數(shù)據(jù)表A:
數(shù)據(jù)表B:
問題描述:
表A和表B分別為兩個(gè)電影數(shù)據(jù)的表,
如果表B的電影信息與表A的電影信息一致,
把表B的id賦值給表A對應(yīng)數(shù)據(jù)的“fname”字段中去。
遇到的問題:
如果單靠兩個(gè)表的“title”來判斷是否一致的話,
會(huì)遇到電影的名字有相同的情況,
PS:最主要的是想通過程序自動(dòng)進(jìn)行兩個(gè)表的電影數(shù)據(jù)進(jìn)行一條條判斷,
可以不用人工干預(yù),不知道這個(gè)實(shí)現(xiàn)的方法與思路是怎么樣的,
求助了!
把B表
的數(shù)據(jù),設(shè)置到ES
(elasticsearch
)的索引,然后遍歷A表
的數(shù)據(jù),通過ES
搜索最匹配的結(jié)果,把id設(shè)置進(jìn)去。這里你可以設(shè)置一個(gè)數(shù)組用來檢測重復(fù)。重復(fù)的再多帶帶處理。
我原來就是這么干的,當(dāng)然處理的數(shù)據(jù)不是電影就是。
你這兩個(gè)表之間要有關(guān)聯(lián)只可能通過title字段,如果遇到兩部電影名字相同的情況就沒辦法了
具體A,B哪張表做索引的話,一般用數(shù)據(jù)多的做索引好點(diǎn),減少重復(fù)概率,匹配率一般有90%以上,當(dāng)然如果數(shù)據(jù)量太大的話,遍歷的話需要很久。
直接執(zhí)行關(guān)聯(lián)更新,再處理特殊情況