【发布时间】:2015-12-26 08:31:46
【问题描述】:
我想抓取我的网站,然后使用网站中的数据来填充我的应用中的元素,我的网站有登录页面,并且某些页面只有在登录完成后才会打开。
我开始使用 HtmlUnit,因为它是一个无头浏览器,并在 java IDE 中完成了自定义 api,后来我尝试使用从 java IDE 生成的 jar,发现 HtmlUnit 和 Android 存在不兼容问题。
谁能提出这个问题的解决方案?
编辑: 由于没有人真正回答这个问题,我目前正在尝试使用 android 的原生 WebView,将其 Visibility 设置为不可见,然后使用 javascript 接口连接到 Java 对象,我可以注入 JS 代码来抓取任何数据。
【问题讨论】:
-
如果您从自己的网站上抓取 HTML 以在自己的应用程序中使用数据,那么您的做法大错特错。
-
我能问一下您为什么需要抓取自己的网站吗?如果需要,最好通过特殊的 API 让您的应用连接到您的服务器,然后从那里提取信息。
-
我只是想这样做,我喜欢我的应用程序和网站是两个不同的实体并且不访问我的网站内部的想法,所以有什么解决方案吗?
-
看我的回答。希望对你有帮助
-
我认为这是一个好主意,因为您可以使用谷歌网站创建一个免费网页,并让您的应用程序抓取该页面以显示内容,然后不需要服务器或服务器成本。此过程还允许您立即更改所有已安装应用程序的内容!无需升级到较新版本的应用程序即可获取新数据。
标签: java android web-scraping htmlunit