【问题标题】:Join Dataframe by an array column通过数组列加入 Dataframe
【发布时间】:2019-04-10 07:05:16
【问题描述】:

我有两个数据框,其中有一列 field 数组(字符串)。那么执行以下操作是否安全:

df1.join(df2, "field");

类似地在具有数组列的 hive 表上的 SQL 查询中

【问题讨论】:

    标签: apache-spark hive


    【解决方案1】:

    Hive 中的类似查询

    SELECT * FROM table1 as df1 
      JOIN SELECT * FROM table2 as df2
      ON (df1.field = df2.field)
    

    参考:https://www.tutorialspoint.com/es/hive/hiveql_joins.htm

    【讨论】:

      【解决方案2】:

      是的,等式运算符是安全且对顺序敏感的。您可以使用 Pablo 建议的 query 在 SQL 中工作。

      【讨论】:

        猜你喜欢
        • 1970-01-01
        • 2017-06-20
        • 2018-12-24
        • 2019-04-21
        • 1970-01-01
        • 2022-01-24
        • 1970-01-01
        • 1970-01-01
        • 2014-01-09
        相关资源
        最近更新 更多