【发布时间】:2021-01-20 13:30:18
【问题描述】:
有两个输入表(或 df)。每个都包含一个 id 和相应的描述。也就是说table1包含id1 description1,table2包含id2和description2。我必须比较描述 1 和 2。并将表 1 的行与表 2 的匹配行映射(表 2 中将有不止一行与表 1 的行匹配)。最终输出表包含所有四列。我将 NLP 应用于原始数据集。我必须选择哪种预测算法?
【问题讨论】:
标签: dataframe machine-learning nlp nltk spacy