【发布时间】:2020-11-16 12:01:25
【问题描述】:
我有一个名为“df”的数据框,它只有一列名为“tweet”。该数据框由一堆这样的句子组成:
I have a cat
What do you mean by that?
This is my room.
Lorem ipsum dolor sit amet
我想把所有的句子分成单词,然后把所有的单词放到一个列表中。
到目前为止我试过了:
def word_split() :
word = []
for index, row in df.iterrows() :
words = row['tweet'].split()
word.append(words)
return word
word_split()
但我得到的不是列表,而是列表:
[['I', 'have', 'a', 'cat'],
['What', 'do', 'you', 'mean', 'by', 'that?'],
['This', 'is' .....]]
我希望它是一个列表而不是列表:
['I', 'have', 'a', 'cat', 'What', 'do', 'you', .....]
有什么建议吗?
【问题讨论】:
-
word.extend(words)? -
谢谢@jonrsharpe,它有效!直到现在我才知道
-
Don't use
iterrows。假设您的列名是word,请使用df["word"].str.split("\s")。 -
使用 .str.split("\s") 代替 iterrows 有什么好处? @HenryYik