【发布时间】:2018-04-08 13:33:51
【问题描述】:
我有一个带有德国评论的 Panda 数据框。我想获得 POS 标签,我找到了支持德语的模式库。
现在,我想迭代 Review 列,以获取所有 POS,但我收到以下错误(使用此代码):
如何迭代 pandas 列以获取 POS 标签
代码:
r['POSTags'] = parse(r['German_Reviews'].apply(split))
错误信息:
TypeError: expected string or buffer
我想要以下输出:
[(Das, DT), (Essen, NN), (war, VB), (lecker,..
有谁知道我如何使用模式库解决这个问题?
我的 DF 系列看起来像这样:
Rating | German_Reviews | Device ...
----------------------------------------------
5.0 | Das Essen war lecker | Mobile ...
1.0 | Die Pizza war grauenhaft | Desktop ...
4.0 | Das Restaurant war ok | Mobile ...
【问题讨论】:
-
你在数据框中的数据是什么样子的?
-
我在我的帖子中添加了它
-
什么是
split?
标签: python pandas pos-tagger