【发布时间】:2019-12-23 04:13:13
【问题描述】:
我正在尝试在我的 ML 模型中实现新列。如果在抓取数据的文本中找到特定字词,则应创建一个数字列。为此,我创建了一个用于测试的虚拟脚本。
import pandas as pd
bagOfWords = ["cool", "place"]
wordsFound = ""
mystring = "This is a cool new place"
mystring = mystring.lower()
for word in bagOfWords:
if word in mystring:
wordsFound = wordsFound + word + " "
print(wordsFound)
pd.get_dummies(wordsFound)
输出是
cool place
0 1
这意味着有一个句子“0”和一个“酷地方”条目。这是不正确的。期望是这样的:
cool place
0 1 1
【问题讨论】:
标签: python machine-learning nlp