【问题标题】:Python tweepy: how to extract Japanese tweet with not using keywordsPython tweepy:如何在不使用关键字的情况下提取日语推文
【发布时间】:2017-09-22 14:36:47
【问题描述】:

我想使用推文 API 提取日文推文文本。有没有关于这个问题的示例代码?

我只想提取不使用关键字的日语推文。

【问题讨论】:

    标签: python-2.7 tweepy tweets


    【解决方案1】:

    您可以在查询时添加“lang”键来限制语言。
    根据document,它说“将推文限制为给定的语言,由 ISO 639-1 代码给出。语言检测是尽力而为。”

    它会导致这样的事情:

    import json
    from requests_oauthlib import OAuth1Session
    
    tw = OAuth1Session("CONSUMER_KEY", "CONSUMER_SECRET", "ACCESS_TOKEN", "ACCESS_TOKEN_SECRET")
    
    url = "https://api.twitter.com/1.1/search/tweets.json"
    
    params = {'q' : "keyword", 'count' : 100, 'lang' : 'ja'}
    
    while True:
        req = tw.get(url, params=params)
    
        if req.status_code == 200:
            tweets = json.loads(req.text)
            for tweet in tweets['statuses']:
                print(tweet['text'])
                print("<<<<<<<<<<<<<<<<<<<")
    

    【讨论】:

    • 感谢您的回答。你能告诉我什么是tw吗?
    • hi @shogo2022 如何获得更多推文,例如 10000。在我设置 count:10000 后,我只能获得大约 100 条推文。如何解决这个问题。
    • @tktktk0711 可能是 Twitter 搜索 API 上的 rate limit,您可以查看 How rate limit works in twitter in search API 中的速率限制是如何计算的。搜索 API 仅返回过去 7 天的推文,但我相信日文推文超过 1 万条。
    猜你喜欢
    • 2018-12-31
    • 2022-08-06
    • 2020-09-04
    • 1970-01-01
    • 2018-08-12
    • 2022-08-11
    • 1970-01-01
    • 2015-05-24
    • 1970-01-01
    相关资源
    最近更新 更多