数据比对
一个库里面有2张数据表,表的数据量都>=百万级,2张表要进行数据遍历比对,即表1的任何一条数据都要与表2的所有数据比对过,请问什么方法效率最高?
如果表有主键还好,否则纯数据比较,再好的算法也不一定能达到所谓的高效!
如果是两表相比较是不是完全相同的话,我想是不是可以这样:
select count(*) from xxx
select count(*) from yyy
select count(*) from (select * from xxx union select * from yyy) z
如果上述结果相同即说明两表数据完全一样!
抛砖