【问题标题】:Match data between points and ignore some words匹配点之间的数据并忽略一些单词
【发布时间】:2021-09-08 18:40:06
【问题描述】:

您好,是否可以在 6.1.1 - 6.1.2 等点之间匹配数据。

这是现实世界的例子:https://regex101.com/r/n1XHaG/1

我有这样的点 6.1.1 和 6.1.2(30-40 点,但结构相同),它们总是在左侧,我需要的文本总是在右侧。只是为了调整开始和结束词,每个点都不同匹配不是问题。这实际上是我想要实现的,但我也从标题点和空白处获取文本,然后我需要在这之后编辑它,这不是一个很好的解决方案。我在 UiPath 中使用它来实现自动化,从 pdf 中获取数据并将其插入到 word 中。

我不确定是否可以仅在右侧获取字符串,或者在获取字符串时忽略标题中的某些单词,因为它们与我需要的数据在同一行。

这就是我需要实现的目标:https://ibb.co/sFPrSRf

最好的问候

【问题讨论】:

  • 这个不能同时匹配和不匹配。分两步完成:1)使用您现在拥有的模式进行提取。 2)在一些replace操作中使用(?m)^.*?\S[\p{Zs}\t]{2,}替换为空字符串。
  • 不完全确定我理解你的问题,但你想要这样的(?<=\d\.\d\.\d )(?:[^\s]+\s+)([.*\w\W\n]+)(?=\n\s+\d\.\d\.\d)吗?
  • 你好@WiktorStribiżew 你能告诉我如何替换的例子吗?假设我与第一个正则表达式匹配,然后如何用你建议的正则表达式替换。

标签: regex uipath uipath-studio


【解决方案1】:
^(.){0,45}(.*)$

现在连接 45 个点和第 2 组,然后是 \n

.............................................$2\n # 甚至没有 \n 取决于你的修饰符

结果:

【讨论】:

  • 我们可以有起点并以 tis concat 结束,如起点 - 6.1.1 Необходимые 和终点 и чрезвычайных ситуациях。并从左侧获取文本,然后为第 6.1.2 点构建另一个正则表达式?
  • 如果您添加更多关于 OP 应该如何在 uipath 中实际实现这些步骤的信息,这个答案将会受益。
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2011-03-06
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多