【发布时间】:2013-03-22 04:24:18
【问题描述】:
我想知道是否有一种方法可以对我正在尝试在我拥有的推文数据集上运行的文本匹配运行嵌套查询。我在 BigQuery 中有一个表,其中包含我收集的讨论各种股票的推文,我想根据每条推文文本中的单词对该表进行分段。
我有一个情绪字典(实际上它是一组表,其中每个表都列出了与感觉相关的单词。有一个表用于表示积极情绪的词,一个用于表示消极、不确定等的词),所以我想要do 类似于以下内容:
SELECT text AS bullish_tweets
FROM bigtweettable
WHERE text CONTAINS (SELECT words FROM table_x);
我只是不确定 BigQuery 是否允许这种查询,或者是否有某些功能可以。因为我在情绪字典中使用的这些表每个都有几百到几千行,很高兴知道这一点。
非常感谢。
【问题讨论】:
-
Tony,为了清楚起见,你能举一个 Tweet 表的架构示例吗?它的结构和 Twitter Stream API JSON 响应一样吗?
-
嗨,Michael,它的结构是 Twitter API JSON 响应的一个子集。我的 BigQuery 数据集中有以下字段:created_at(created_at 字段的字符串表示形式)、source(字符串,“Twitter”或“StockTwits”,取决于哪个网络)、ticker(股票代码的字符串)和文本(推文正文)。
标签: google-bigquery