【发布时间】:2015-07-31 16:06:44
【问题描述】:
使用 JavaScript 和任何其他可用技术执行 从 Google Chrome 扩展程序中对当前未打开的标签页进行网页抓取的最佳选项是什么? 也接受其他 JavaScript 库。
重要的是掩盖抓取行为,使其表现得像正常的网络请求。没有 AJAX 或 XMLHttpRequest 的迹象,例如 X-Requested-With: XMLHttpRequest 或 Origin。
必须可以从 JavaScript 访问抓取的内容,以便在扩展程序中进行进一步操作和呈现,最有可能作为字符串。
在任何 WebKit/Chrome 特定的 API 中是否有任何钩子可用于发出正常的网络请求并获取操作结果?
var pageContent = getPageContent(url); // TODO: Implement
var items = $(pageContent).find('.item');
// Display items with further selections
使用磁盘上的本地文件进行这项工作的奖励积分,用于初始调试。但如果这是唯一的一点是停止解决方案,那么请忽略奖励积分。
【问题讨论】:
-
@buffer 谢谢!我也这么认为,尽管有 3 个人投票支持关闭(??!!)。如果答案是“不可能”,那么这是正确的,并且会被接受,如果一段时间内没有其他问题出现的话。
-
iMacros 正在做类似的事情,尽管我不确定它提供了多少帮助。 chrome.google.com/webstore/detail/…
-
@buffer 似乎只打开标签并收听已经打开的标签,并没有真正在代码中做请求。至少从我能找到的。感谢您的尝试! :D
-
@SebNilsson 你终于找到方法了吗?
-
@Christophe Nopes,没有满足给定标准的好答案。
标签: javascript google-chrome google-chrome-extension xmlhttprequest web-scraping