【发布时间】:2021-03-04 06:24:56
【问题描述】:
我有非结构化数据,我必须提取 BP 值和日期(具有不同格式),如下所示。现在我有一个正则表达式函数来提取 Bp 值。我有一个特定情况,如图中突出显示的那样,必须提取连续日期甚至单个遇到的日期(不是 DOB)。
目前,我的代码只给出了 BP 值。我想要 Bp 的正则表达式函数并同时提取日期。
我附上了下面的正则表达式代码。
regex = r'\b(?:BP:?(?:-Sitting)?|Blood Pressure) \d+/\d+(?: \d+/\d+| \d+/\d+)*(?: sm| -Lw| cB| Jr|\
-aA| cs| -ic| ic| -RG| kA| -sL| BL| kc| am| -sH| sH| es| ts| np| 8s| ca| Pm| JE| so| cp| v8| Eu| -cp|\
Pm| EB| Fr| -Fr| -ms| -LN| -mT| -mk| -GF| -HO| Jp| wD| 8m| mc| -mc| Yr| -Lp| -ml| -LA| s/d| -aA| s/d|mmHg| mm Hg|\
mm hg.|.?)?|B/P - (?:Sys|Dias)tolic \d+|(?:Sys|Dias)tolic Blood Pressure \d+ \w+\b'
对此的任何帮助将不胜感激。
【问题讨论】:
标签: python regex data-extraction