【发布时间】:2020-12-21 19:51:48
【问题描述】:
我正在尝试解析我的数据集以获取所有电子邮件和电子邮件之前的单词。例如,如果我有这样的一行:
sno text
1 From: m.kro@b.org To: Cha.Sh@dys.com Hi my name is Sam and my email is samwise@gmail.com
然后我想将其捕获为:
sno text emails
1 From: m.kro@b.org To: Cha.Sh@dys.com Hi my name is Sam and my email is samwise@gmail.com [From : m.kro@b.org ,To: Cha.Sh@dys.com, is samwise@gmail.com]
到目前为止我尝试过的解决方案:
我已尝试使用“find_all”功能来获取所有电子邮件,但在电子邮件开始前获取单词时遇到问题。
df['Full Comments'].str.findall('(\S+@\S+)').str[0]
对此的任何帮助表示赞赏。谢谢。
【问题讨论】:
标签: python pandas numpy text nlp