【问题标题】:Transpose operation on pyspark data frame using python使用python对pyspark数据帧进行转置操作
【发布时间】:2017-08-10 11:56:08
【问题描述】:

我是 python 和 pyspark 的新手,我使用 pandas df.T 完成了转置操作。我发现对pyspark数据框没有直接操作(pyspark版本= 2.2.0和python版本= 3.6.2)

我正在使用以下代码为上述操作加载一个 CSV 文件

from pyspark.sql import SQLContext sql = SQLContext(spark_context) path = 'sample.csv' df = (sql.read.format("com.databricks.spark.csv").option("header","true").option("inferSchema", "true").load(path))

【问题讨论】:

标签: python python-3.x pyspark spark-dataframe transpose


【解决方案1】:

您的数据架构是什么?

如果它是某种稀疏矩阵,您可以使用常规 RDD 加载并映射 + 交换您的坐标。

【讨论】:

    猜你喜欢
    • 2021-03-14
    • 1970-01-01
    • 2023-04-07
    • 2020-08-20
    • 2020-08-20
    • 2020-01-07
    • 1970-01-01
    • 1970-01-01
    • 2018-03-09
    相关资源
    最近更新 更多