我需要一个样品后,我做两个表的连接后,是这样的:做一个连接两个表具有采样他们
SELECT *
from
A left join B
on A.col=B.col
sample 1000000
的问题是,A和B是巨大(超过3十亿行),当我尝试连接时,我的spool空间用完了。
是否有办法在样本之后进行连接,以便连接更小的表(例如,从A和B中选择10,000,000个样本,内部连接它们,并从连接中选择1,000,000个样本,希望我可以获得至少1,000,000行?)
PS 我使用Teradata的
(1)A和B之间的关系是什么? 1:1? 1:N? (2)A和B的主要指标是什么? –
你可以抽样1000000到一个临时表SELECT * INTO #A从一个样本1000000然后选择*从#A左加入B A.Col = B.col – Cato
你已经很好的答案在这里,但如果你回答@Dudu -Markovitz的问题你会让答案得到改善。 – Insac