【发布时间】:2012-04-20 18:34:31
【问题描述】:
我想从 Mac OS X 命令行中将 http://www.amiriconstruction.co.uk/goodwoodgolf/scoretable.htm 表中的文本提取为纯文本格式的纺织品,不带 html 标签。
我尝试了很多 sed 命令,但 sed 只会再次打印整个文件。我做错了什么?
我尝试过的示例
sed -n '/<tr>/,/<\/tr>/p' scoretable.htm (只会打印带有html标签的表格内容:()
【问题讨论】:
标签: string tags sed web-scraping extract