【发布时间】:2026-01-24 06:25:02
【问题描述】:
我查看了各种链接,但都展示了如何一次性替换多个单词。但是,我想替换模式而不是单词,例如
RT @amrightnow:“真正的特朗普”特朗普关于你”观看制作 #1 https:\/\/t.co\/j58e8aacrE #tcot #pjnet #1A #2A #Tru mp #trump2016 https:\/\/t.co\u2026
当我对上述文本执行以下两个命令时,我得到了所需的输出
result = re.sub(r"http\S+","",sent)
result1 = re.sub(r"@\S+","",result)
这样,我将删除所有 url 和 @(推文中的处理程序)。输出将如下所示:
>>> result1
'RT "The Real Trump" Trump About You" Watch Make #1 #tcot #pjnet #1A #2A #Trump #trump2016 '
谁能告诉我最好的方法是什么?我将基本上从文件中读取推文。我想阅读每条推文并将这些处理程序和网址替换为空白。
【问题讨论】: