【发布时间】:2020-01-13 10:13:58
【问题描述】:
我有一个数据集,其中有多个具有多种语言的 cmets 列,我想将这些列翻译成英文并创建包含所有英文翻译的新列。
Accountability_COMMENT 是每行有多个不同语言的 cmets 的列。我想创建一个新列并将所有此类 cmets 翻译成英语。
我已经尝试了以下代码:
from googletrans import Translator
from textblob import TextBlob
translator = Translator()
data_merge['Accountability_COMMENT'] = data_merge['Accountability_COMMENT'].apply(lambda x:
TextBlob(x).translate(to='en'))
我得到的错误是:
TypeError:传递给__init__(text) 的text 参数必须是字符串,而不是类'float'
我的专栏有正确的对象格式
【问题讨论】:
-
您已经尝试过该代码...并且?你有什么错误吗?输出看起来不像你想要的?
-
另外,我不清楚您的输入 DataFrame 是什么样的,以及输出应该是什么样的。是否有 一个 列带有 cmets,还是有 许多 列带有 cmets?
-
有一列包含大约 3000 个不同语言的 cmets。我需要将它们全部翻译成英文并将它们存储到一个新列中。
-
我在一个测试 DataFrame 上测试了你的代码,只有三行不同语言的字符串,它工作正常。错误消息实际上说的是什么?
TypeError: The text argument passed to __init__(text) must be a string, not什么?not后面是什么? -
TypeError: 传递给
__init__(text)的text参数必须是字符串,而不是
标签: python-3.x pandas translation google-translate