两个表取差集再插入到另一张表中

· 浏览次数 : 0

小编点评

概要：本文主要讨论了如何将两个结构相似的表（t1和t2）中的数据进行差异合并。具体来说，是将t2表中不属于t1表的数据插入到t1表中。为实现这一目标，文章首先分析了两个表的结构，找到了它们的共通字段（other_id），然后通过SQL查询得到了两个表中的差集。最后，将差集中的数据插入到t1表中。实现步骤： 1. 分析两个表的结构，找到共通字段（other_id）。 2. 使用SQL查询，从t2表中取出属于t1表的数据（t1.*）以及t2表中独有的数据。 3. 将取出的数据（id）粘贴到Sublime中，以逗号隔开。 4. 将这些id对应插入到t1表中。注意事项： 1. 该方法适用于数据量较少的场景，如果数据量较大（如1w或更多），查询速度可能会变慢，此时可能需要使用脚本进行优化。 2. 在实际应用中，应根据数据量和系统性能选择合适的解决方案。

正文

概要
思路梳理
实现步骤
小结

概要

工作中采集时候遇到一个问题，就是两张结构一样的表数据不同，哪里不同呢，如t1表是基础表，里面数据量大，但是它不全，t2表有少数t1的数据也有一些自己额外的数据，我的需求是把t2里面t1没有的数据插入到t1中

思路梳理

这种也简单就是在t2中取t1和t2的差集，然后取出这些id再insert到t1中即可。
我的两个表都有一个共通的other_id,这个字段数据是唯一的，可以从other_id下手

实现步骤

取出他们两个的差集，从t2中

SELECT
    t1.*
FROM
    a_film t1
LEFT JOIN
    a_film_copy3 t2
ON
    t1.other_id = t2.other_id
WHERE
    t2.other_id IS NULL;
复制

直接复制结果中所有的id，然后粘贴到sublime中，然后替换以逗号隔开
取出这些id然后对应插入到t1

INSERT INTO a_film_copy3 (title, cover, url, rating, casts, star, directors, cover_x, cover_y, other_id)
SELECT title, cover, url, rating, casts, star, directors, cover_x, cover_y, other_id from a_film where id in(...)
复制

小结

这个方法目前只适用于数量级较少的场景中，我的是1w左右，查询速度2-3秒，如果1百万、1千万级估计吃不消，那时候可能用脚本跑更合适些，暂记录这么多。