【发布时间】:2023-03-31 18:48:02
【问题描述】:
我正在尝试构建站点地图并解析没有 # 的 hrefs 的 html 正文(因为带有哈希的只是某些内容页面 html 中的子章节链接)。
我现在的正则表达式:<a\\s[^>]*href\\s*=\\s*\"([^\"]*)\"[^>]*>(.*?)</a>
我想我应该使用[^#] 或!# 将# 从hrefs 中排除,但仅通过尝试和谷歌搜索无法解决它。提前感谢您帮助我!
【问题讨论】: