【发布时间】:2011-05-01 20:22:57
【问题描述】:
尝试使用 YQL 从 totalfilm.com 抓取数据,但出现一个奇怪的错误:
“字符序列“]]>”不得出现在内容中,除非用于标记 CDATA 部分的结尾。”
select * from html where url="www.totalfilm.com"
【问题讨论】:
-
您的查询对我来说很好,而且错误非常不言自明:您想回答什么问题?
-
抱歉,问题是如何使用 YQL 从 totalfilm.com 抓取数据?
-
啊哈,现在它给出了与问题相同的错误。除非您愿意自己整理 HTML(在 YQL 或其他地方)或让 Total Film 来修复它,否则可能没有快速的答案。
-
我现在用php和一个html解析库来做
标签: web-scraping yahoo yql