【发布时间】:2011-02-11 22:40:20
【问题描述】:
我遇到的问题是我已经成功地从网站源中抓取了一段 JavaScript,现在我必须进行筛选以获取我正在寻找的特定值。
我需要找到flvFileName 并获取所有列出的文件名。在这种情况下,它是'trailer1,trailer2,trailer3'。
起初我开始使用正则表达式来匹配开始和结束标签,然后匹配文件名并将它们提取到一个数组中,但问题是列表中并不总是三个视频。可能有零个或多个,因此匹配不起作用。关于解决这个问题的任何想法不会让我继续滥用我的笔记本电脑?
... ,flashvars: {flvFileName: 'trailer1,trailer2,trailer3', age: 'no', isForced: 'true'} }); });
【问题讨论】:
-
这是一个缺少最后一个 ']' 的数组还是一个字符串?
-
示例 JavaScript 真的很难阅读,所以我将它截断到目标数据之前和之后的部分。原始示例可在修订历史记录中找到。
标签: javascript ruby regex scrape