【发布时间】:2018-10-01 23:04:51
【问题描述】:
如何编写 SQL(SQLite3、postgres 或 MySQL)以 根据表 B 数据组合(去重)表 A?
给定具有电话号码(表格:电话)的人员(表格:联系人), 我想使用电话号码删除重复的联系人。
在这个例子中,公司需要澄清, 真实数据可能没有同一家公司上市,即使 根据电话号码,人是相同的。
注意,在这个例子中,有两个不同的 Betty's,但是 两个查尔斯是同一个人,应该合并。
此外,Ashok 和 Dale 有一个共同的电话号码,因为他们 在同一家公司工作,但不是同一个人。
Table: contacts
===============
id name company
1 Ashok Alpha Co.
2 Betty Beta Inc.
3 Charles Cain LLC. <---|
4 Betty Delta Corp. |-- same person
5 Charles Cain LLC. <---|
6 Dale Alpha Co.
Table: phones
============
id phone_number contact_id
1 (111) 123-1111 1
2 (111) 123-2222 1
3 (111) 123-3333 1
4 (111) 123-4444 1
5 (222) 456-1111 2
6 (222) 456-2222 2
7 (333) 789-1111 3
8 (333) 789-2222 3
9 (333) 789-3333 3
10 (333) 789-4444 3
11 (444) 456-7777 4
12 (444) 456-8888 4
13 (555) 789-5555 5
14 (333) 789-2222 5
15 (111) 123-3333 6
加入表格给出:
SELECT c.id, c.name, c.company, p.phone_number, p.contact_id
FROM contacts as c
INNER JOIN phones as p
ON c.id = p.contact_id
c.id c.name c.company p.phone p.contact_id
1 Ashok Alpha Co. (111) 123-1111 1
1 Ashok Alpha Co. (111) 123-2222 1
1 Ashok Alpha Co. (111) 123-3333 1
1 Ashok Alpha Co. (111) 123-4444 1
2 Betty Beta Inc. (222) 456-1111 2
2 Betty Beta Inc. (222) 456-2222 2
3 Charles Cain LLC. (333) 789-1111 3
3 Charles Cain LLC. (333) 789-2222 3
3 Charles Cain LLC. (333) 789-3333 3
3 Charles Cain LLC. (333) 789-4444 3
4 Betty Delta Corp. (444) 456-7777 4
4 Betty Delta Corp. (444) 456-8888 4
5 Charles Cain LLC. (555) 789-5555 5
5 Charles Cain LLC. (333) 789-2222 5
6 Dale Alpha Co. (111) 123-3333 6
所以我想的是我想遍历所有 的不同电话号码,获取每个联系人的所有联系人 在这些数字中,检查名称是否相同,如果 他们删除了重复的联系人并更改了contact_ids 在电话号码上。
所以结果看起来像:
Table: contacts
===============
id name company
1 Ashok Alpha Co.
2 Betty Beta Inc.
3 Charles Cain LLC.
4 Betty Delta Corp. <-- Note the duplicate Charles (5) is removed
6 Dale Alpha Co.
Table: phones
============
id phone_number contact_id
1 (111) 123-1111 1
2 (111) 123-2222 1
3 (111) 123-3333 1
4 (111) 123-4444 1
5 (222) 456-1111 2
6 (222) 456-2222 2
7 (333) 789-1111 3
8 (333) 789-2222 3
9 (333) 789-3333 3
10 (333) 789-4444 3
11 (444) 456-7777 4
12 (444) 456-8888 4
13 (555) 789-5555 3 <-- Note the contact_id is updated
15 (111) 123-3333 6 <-- Note the duplicate phone number (14) is removed
或
c.id c.name c.company p.phone p.contact_id
1 Ashok Alpha Co. (111) 123-1111 1
1 Ashok Alpha Co. (111) 123-2222 1
1 Ashok Alpha Co. (111) 123-3333 1
1 Ashok Alpha Co. (111) 123-4444 1
2 Betty Beta Inc. (222) 456-1111 2
2 Betty Beta Inc. (222) 456-2222 2
3 Charles Cain LLC. (333) 789-1111 3
3 Charles Cain LLC. (333) 789-2222 3
3 Charles Cain LLC. (333) 789-3333 3
3 Charles Cain LLC. (333) 789-4444 3
4 Betty Delta Corp. (444) 456-7777 4
4 Betty Delta Corp. (444) 456-8888 4
3 Charles Cain LLC. (555) 789-5555 3
6 Dale Alpha Co. (111) 123-3333 6
【问题讨论】:
标签: mysql sql postgresql sqlite