【问题标题】:Use Tweepy to gather Tweets with hashtags from Egypt使用 Tweepy 从埃及收集带有标签的推文
【发布时间】:2017-04-12 07:56:27
【问题描述】:

我正在使用 Tweepy 和 Python 来收集来自埃及的推文。 推文必须包含主题标签。

我将这些坐标用于埃及:

25.13671875, 22.0245456012, 35.3759765625, 31.3723991049

代码不是问题,但我发现每隔几秒我只收到一两条推文,但是当我将位置更改为英国时,我得到了 loaddsssss。

请问有人知道怎么回事吗?我的坐标错了吗?

【问题讨论】:

  • 坐标没问题。这可能是由于几个因素。一天中的时间、埃及的活跃 Twitter 用户数量、埃及发生的时事、人口等。美国、英国、印度、法国和加拿大等国家的 Twitter 用户比例远高于埃及

标签: python tweepy twitter-streaming-api


【解决方案1】:

有些人可能会说 RTFM... :-)

因为根据最后tweepy documentation

参数值由“latitude,longitude,radius”指定

但在您的示例中,您设置了两次 GPS 坐标 ...

所以它解释了你得到的结果,因为在我看来,tweeter API 理解你的请求,比如: “我会搜索所有推文,半径为 3537 万(默认情况下),靠近:25.13671875, 22.0245456012”

所以您可以将您的坐标请求切换到:

25.13671875,22.0245456012,1000mil  #mil or km as you prefer

然后就可以了!

*解释差异:英格兰的纬度约为 50.85300:因此应用于英格兰坐标的相同请求会在您选择的中心点附近为您提供半径为 51 百万的所有推文...

最好的问候

【讨论】:

  • 哈哈。我确定我在某处读到 stackoverflow.com/questions/22889122/… 它需要一个边界框,我知道如果我输入我所在区域的坐标,我会看到相关的推文。
  • 实际上我的代码使用了 .filter 方法,你参考的文档没有提到 filter 方法,它有一个 .search 方法...
  • 这是因为此文档适用于 RESTful API,而不是 Streaming API,它确实说明您需要一个边界框。
  • 你是对的 Bender,我希望你使用 RESTFul Api 和搜索方法,但显然你使用带过滤器的流,我在你的问题中添加了 twitter-streaming-api 标签。问候
猜你喜欢
  • 2019-10-03
  • 2018-06-29
  • 1970-01-01
  • 2016-06-29
  • 1970-01-01
  • 1970-01-01
  • 2017-07-31
  • 2018-11-09
  • 1970-01-01
相关资源
最近更新 更多