【发布时间】:2010-11-11 08:58:06
【问题描述】:
我将开始我的文章提取工作。
我将要做的任务是提取发布在不同网页上的酒店评论(例如 1.http://www.tripadvisor.ca/Hotel_Review-g32643-d1097955-Reviews-San_Mateo_County_Memorial_Park_Campground-Loma_Mar_California.html、2.http://www.travelpod.com/hotel/Comfort_Suites_Sfo_Airport-San_Mateo.html)
我需要在 Java 中完成这项任务,而过去几个月我只是在使用 Java..
我的问题来了。
是否有可能以通用方式从不同网页中单独提取评论。
如果有任何 API 支持 Java 中的任务,请告诉我。
另外,请告诉我您的想法/来源,这将有助于我完成上述任务。
更新
如果网络上有任何相关示例,请发布相同的示例,因为这可能很有用。
【问题讨论】:
标签: java extraction html-content-extraction