【发布时间】:2013-01-02 22:57:25
【问题描述】:
我想制作一个小机器人,以便自动和牙周浏览一些合作伙伴的网站。这将为这里的许多员工节省几个小时。
机器人必须能够:
- 连接到该网站,其中一些以用户身份登录,访问和解析网站上的特定信息。
- 机器人必须集成到我们的网站并使用我们网站的数据更改其设置(使用的用户...)。最终它必须总结解析信息。
- 最好此操作必须从客户端完成,而不是在服务器上。
我上个月试过飞镖,很喜欢…… 我想用飞镖来做。
但我有点失落: 我可以为每个要解析的网站使用 Document 类对象吗? 可能是无头的,或者我应该使用 chrome/dartium api 来控制网络浏览器(我想避免这种情况)?
我一直在阅读此主题:https://groups.google.com/a/dartlang.org/forum/?fromgroups=#!searchin/misc/crawler/misc/TkUYKZXjoEg/Lj5uoH3vPgIJ 使用https://github.com/dart-lang/html5lib 对我来说是个好主意吗?
【问题讨论】:
-
它不在飞镖中,但蜘蛛似乎很有趣:github.com/mikeal/spider
-
嗨,Jhon_,看来您对答案很满意。你介意批准吗?
标签: web-crawler dart