【发布时间】:2018-05-27 21:46:58
【问题描述】:
我有 2 个数据框:
dfBB
排名、歌曲、艺术家、年份
和dfMap
艺术家、歌曲、SongId、ArtistId
我想根据艺术家和歌曲将它们合并在一起,即:它们匹配的地方我添加额外的列,否则为 0:
艺术家、歌曲、歌曲 ID、艺术家 ID、排名、年份
我预见到艺术家或歌曲可能拼写错误的另一个问题。也许我可以检查相似性?不太清楚该怎么做。
对于我尝试的合并:
merged = pd.merge(dfMap, dfBB, on='Artist' and 'Song', how='outer')
但是得到了:
Artist_x, Song, SongId, ArtistId, Rank, Artist_y, Rank
【问题讨论】:
标签: python pandas dataframe sentence-similarity