【发布时间】:2017-02-12 18:22:13
【问题描述】:
我正在尝试使用 IMACROS 为即将到来的网球比赛提取球员姓名,以便稍后在 excel 中进行分析。
我想从中获取玩家姓名的网站会生成我不想要的额外信息。
奥拉西奥·泽巴洛斯 (ARG)
若昂索萨 (PRT)
Victor Estrella Burgos (DOM) SE
汤米·罗布雷多 (ESP) 公关
法比奥·弗格尼尼 (ITA) LL
阿尔伯特·拉莫斯-维诺拉斯 (ESP) 5
圭多佩拉 (阿根廷)
莱昂纳多·梅耶 (ARG) WC
当我使用下面的提取标签时,我得到了我不需要的额外信息。
TAG POS=1 TYPE=TD ATTR=CLASS:player-name EXTRACT=TXT
我不擅长正则表达式,不知道如何编写表达式来删除“(”之后的所有数据并删除尾随空格,只留下玩家姓名。
任何建议将不胜感激。
非常感谢
【问题讨论】:
-
/^[^(]+\b/应该适用于大多数正则表达式风格
标签: regex screen-scraping imacros