【问题标题】:How to scrape tweets from twitter using java如何使用java从推特上抓取推文
【发布时间】:2013-02-22 05:30:17
【问题描述】:

我需要抓取名人的推文。可以这样做吗?我能够使用 JSoup 从维基百科中抓取数据。我对 twitter 尝试了同样的方法,结果出现了以下错误。我想我没有这样做的权限。我可以使用不同的 API 吗?我是网络抓取的新手。请帮忙。

Exception in thread "main" javax.net.ssl.SSLHandshakeException:   
sun.security.validator.ValidatorException: PKIX path building failed: 
sun.security.provider.certpath.SunCertPathBuilderException: unable to find valid
certification path to requested target
at com.sun.net.ssl.internal.ssl.Alerts.getSSLException(Unknown Source)
at com.sun.net.ssl.internal.ssl.SSLSocketImpl.fatal(Unknown Source)
at com.sun.net.ssl.internal.ssl.Handshaker.fatalSE(Unknown Source)
at com.sun.net.ssl.internal.ssl.Handshaker.fatalSE(Unknown Source)
at com.sun.net.ssl.internal.ssl.ClientHandshaker.serverCertificate(Unknown Source)
at com.sun.net.ssl.internal.ssl.ClientHandshaker.processMessage(Unknown Source)
at com.sun.net.ssl.internal.ssl.Handshaker.processLoop(Unknown Source)
at com.sun.net.ssl.internal.ssl.Handshaker.process_record(Unknown Source)
at com.sun.net.ssl.internal.ssl.SSLSocketImpl.readRecord(Unknown Source)

【问题讨论】:

  • 你可以使用twitter4j。从来没有用过,但我相信你能从中得到一些东西。

标签: java eclipse twitter web-scraping


【解决方案1】:

查看microblog proxy server 的Java 源代码,这是一个解析来自Twitter 的消息和图像的Web 服务。它使用 twitter4j 作为私人 Twitter。对于公共 Twitter,它使用 Jsoup 进行网页抓取。

【讨论】:

    猜你喜欢
    • 2018-07-28
    • 1970-01-01
    • 1970-01-01
    • 2020-11-12
    • 2022-11-24
    • 1970-01-01
    • 2021-06-04
    • 2022-12-11
    • 1970-01-01
    相关资源
    最近更新 更多