【发布时间】:2012-10-17 02:10:21
【问题描述】:
我想得到一个Android应用信息的数据集,包括应用名称、包名称、版本、请求的权限等。
官方的 Android 应用市场是 Google Play。市场上有数以百万计的应用程序。我想从中获取至少数万条应用信息,并将其存储到 csv 文件中。例如,这是一个应用程序的链接: https://play.google.com/store/apps/details?id=de.ralphsapps.snorecontrol
- 问题是如何获取应用程序的url列表?
- 如何解析网页信息?
有没有适合这种工作的好的网络爬虫?或者有没有脚本语言,比如python,有这样的爬取功能?
谢谢。
【问题讨论】:
-
试试api。如果它不能满足您的需求,也许可以贡献一个补丁?
-
非常感谢。您的信息很有用!
-
@babysnow 遇到了同样的问题。你是怎么克服的?
标签: android web web-crawler