【发布时间】:2020-07-11 14:32:59
【问题描述】:
我对 Datawarehouse、OLAP 和 hive 完全陌生。我确实有一个 csv 文件,其中包含有关 ebay 等在线市场的训练数据(请参阅列数据)。我的任务是在 hive 中创建一个星型模式(通过 Data Analytics Studio、Spark 或其他)。
我将维度搭建如下:
如何创建这些维度表,尤其是为每一行生成一个新 ID?
我的SELECT New_Guid(), listing_title, listing_subtitle, listing_type_code, start_price, buy_it_now_price, buy_it_now_listed_flag, qty_available_per_listing From auctions,我在另一个教程中找到的。但是New_Guid() 在我的 Data Analytics Studio 中根本不起作用。
非常感谢!
【问题讨论】:
-
如何获取 UUID 或数字代理键:stackoverflow.com/a/58625717/2700344
-
价格是否是维度属性值得商榷
-
所以。如果对您有帮助,请接受。
标签: hadoop hive data-warehouse dimensional-modeling star-schema