【发布时间】:2012-11-08 22:53:12
【问题描述】:
背景: 我是 facebook 上一个音乐分享(盗版 gs/yt 的链接)组的一员。每天最多有 20 名成员发布他们认为社区会喜欢的歌曲的链接,因此我们越来越喜欢这种类型的音乐。在月底,我们想创建一个列表,列出我们每个月发布的所有歌曲的所有标题。
问题:Facebook 不提供此功能,它仅提供非常简单的搜索功能(无子过滤器),甚至该搜索也仅返回在帖子中找到的字符串的结果。所以,例如。搜索:“B.B. King”将返回包含该字符串的帖子,如果帖子是该歌曲的则更糟,但在帖子中,用户没有评论“B.B.King”,结果将不会返回该链接。 Fb 也不允许标记帖子。
乱七八糟:通过使用一个名为 Stylish 的 Chrome 插件,我可以(有时)在 facebook 页面上隐藏某个类的大多数元素(又名自定义用户代理样式)并直观地收集我需要的东西。不幸的是,这不适用于我的示例。
我确实缩小了 div 类的名称,其中的 innerHTML 包含我需要的曲目和艺术家信息。
目标: 我想创建一个 Chrome 插件,它将为该 div 的所有实例(使用此类名称)抓取页面,然后将其 innerHTML 内容存储在一个数组中,以便稍后导出。这样做可以让我创建一个完整月的列表并将其作为文件发布到 Facebook 群组的“文件”选项卡中。
指出正确的方向,我会开始修修补补!
提前致谢。
【问题讨论】:
-
这是一个相当宽泛的问题:您是否正在寻找如何构建 Chrome 插件?如何从您的插件中引用另一个插件(Stylish)?如何在您的插件中执行 Stylish 的功能?请缩小范围,因为目前很难回答。
标签: javascript facebook google-chrome google-chrome-extension scrape