【问题标题】:Looking To Extract A Substring [duplicate]寻找提取子字符串 [重复]
【发布时间】:2021-09-12 14:31:46
【问题描述】:

我正在寻找一种从一段文本中提取子字符串/多个子字符串的方法。

我需要能够从下面的字符串中提取#Covid19 和#VaccineRecovery。

今天的重要里程碑。没有报告 #CoVid19 的第一天 自 3 月 21 日以来的死亡人数。这是充满希望的一天。我们将占上风#VaccineRecovery。

基本上,我需要任何以“#”开头的子字符串,直到下一个空格。从每个句子中提取的哈希标签可能有 1 个或多个。

【问题讨论】:

  • 如果您想标记 Python 问题,请附上您目前尝试过的 Python 代码
  • 而您编写的代码正是为了到达那里? minimal reproducible example?你制定的解决方案有什么问题?
  • 所有发布的只是程序描述,但这并不能告诉我们您遇到了什么问题。你尝试过什么,遇到过什么烦恼?请edit您的帖子包含valid question,我们可以回答。提醒:确保您知道on-topic 是什么;要求我们为您编写程序、建议和外部链接都是题外话。
  • 你能展示一下你到目前为止所做的工作吗?

标签: python substring


【解决方案1】:

以下似乎可以完成这项工作。将字符串拆分为单词并检查哪个单词以#开头

data = 'Significant milestone today. First day with no reported #CoVid19 deaths since March 21st. This is a day of hope. We will prevail #VaccineRecovery.'
words = [x for x in data.split() if x and x[0] == '#']
print(words)

输出

['#CoVid19', '#VaccineRecovery.']

【讨论】:

  • 我建议使用startswith 来避免空字符串的问题
  • OP 没有尝试或展示任何作品;这违反了 SO 准则 afaik。
  • 投反对票有什么理由吗?
  • @OneCricketeer - 谢谢。代码已修复
  • @rv.kvetch 所以否决了这个问题——而不是答案。
猜你喜欢
  • 2021-01-13
  • 1970-01-01
  • 2019-06-22
  • 1970-01-01
  • 1970-01-01
  • 2017-06-09
  • 2019-12-24
  • 2020-11-17
  • 1970-01-01
相关资源
最近更新 更多