寻找提取子字符串 [重复]答案

【问题标题】：Looking To Extract A Substring [duplicate]寻找提取子字符串 [重复]
【发布时间】：2021-09-12 14:31:46
【问题描述】：

我正在寻找一种从一段文本中提取子字符串/多个子字符串的方法。

我需要能够从下面的字符串中提取#Covid19 和#VaccineRecovery。

今天的重要里程碑。没有报告 #CoVid19 的第一天自 3 月 21 日以来的死亡人数。这是充满希望的一天。我们将占上风#VaccineRecovery。

基本上，我需要任何以“#”开头的子字符串，直到下一个空格。从每个句子中提取的哈希标签可能有 1 个或多个。

【问题讨论】：

如果您想标记 Python 问题，请附上您目前尝试过的 Python 代码
而您编写的代码正是为了到达那里？ minimal reproducible example?你制定的解决方案有什么问题？
所有发布的只是程序描述，但这并不能告诉我们您遇到了什么问题。你尝试过什么，遇到过什么烦恼？请edit您的帖子包含valid question，我们可以回答。提醒：确保您知道on-topic 是什么；要求我们为您编写程序、建议和外部链接都是题外话。
你能展示一下你到目前为止所做的工作吗？

标签： python substring

【解决方案1】：

以下似乎可以完成这项工作。将字符串拆分为单词并检查哪个单词以#开头

data = 'Significant milestone today. First day with no reported #CoVid19 deaths since March 21st. This is a day of hope. We will prevail #VaccineRecovery.'
words = [x for x in data.split() if x and x[0] == '#']
print(words)

输出

['#CoVid19', '#VaccineRecovery.']

【讨论】：

我建议使用startswith 来避免空字符串的问题
OP 没有尝试或展示任何作品；这违反了 SO 准则 afaik。
投反对票有什么理由吗？
@OneCricketeer - 谢谢。代码已修复
@rv.kvetch 所以否决了这个问题——而不是答案。