【发布时间】:2016-12-28 07:04:43
【问题描述】:
我正在使用 pyspark 读取如下镶木地板文件:
my_df = sqlContext.read.parquet('hdfs://myPath/myDB.db/myTable/**')
然后当我执行my_df.take(5) 时,它会显示[Row(...)],而不是像我们使用pandas 数据框时那样的表格格式。
是否可以像熊猫数据框一样以表格格式显示数据框?谢谢!
【问题讨论】:
-
试试这个:
my_df.take(5).show() -
我得到错误:
in () ----> my_df.take(5).show() AttributeError: 'list' object has no属性“显示” -
应该是
my_df.show().take(5) -
@MaxU .take(5).show() 与 .show(5) 有何不同?它更快吗?
-
my_df.show(5) #5 是行数。
标签: python pandas pyspark spark-dataframe