【发布时间】:2020-09-24 19:27:59
【问题描述】:
我正在 Android Studio 中开发一个应用程序,但在使用 JSoup 进行网络抓取时遇到了一些问题。我已成功连接到网页并返回了一些基本元素来测试库,但现在我实际上无法获得我的应用所需的元素。
我正在尝试使用“data-at”属性获取一些元素。奇怪的是,返回了一些具有“data-at”属性的元素,但不是我要查找的元素。无论出于何种原因,我的代码都没有提取所有在网页上共享“data-at”属性的元素。
这是我正在抓取的网页的 URL: https://express.liatoyotaofcolonie.com/inventory?f=dealer.name%3ALia%20Toyota%20of%20Colonie&f=submodel%3ACamry&f=trim%3ALE&f=year%3A2020
包含网页抓取代码的方法:
@Override
protected String doInBackground(Void... params) {
String title = "";
Document doc;
Log.d(TAG, queryString.toString());
try {
doc = Jsoup.connect(queryString.toString()).get();
Elements content = doc.select("[data-at]");
for (Element e: content) {
Log.d(TAG, e.text());
}
} catch (IOException e) {
Log.e(TAG, e.toString());
}
return title;
}
Logcat 中的结果
我要检索的元素
实际正在检索的元素之一
【问题讨论】:
标签: java android android-studio web-scraping jsoup