【发布时间】:2015-07-24 17:08:30
【问题描述】:
我是 spark 新手,正在玩 Pyspark.sql。根据 pyspark.sql 文档here,可以像这样设置 Spark 数据帧和架构:
spark= SparkSession.builder.getOrCreate()
from pyspark.sql.types import StringType, IntegerType,
StructType, StructField
rdd = sc.textFile('./some csv_to_play_around.csv'
schema = StructType([StructField('Name', StringType(), True),
StructField('DateTime', TimestampType(), True)
StructField('Age', IntegerType(), True)])
# create dataframe
df3 = sqlContext.createDataFrame(rdd, schema)
我的问题是,True 在上面的schema 列表中代表什么?我似乎无法在文档中找到它。提前致谢
【问题讨论】:
标签: apache-spark pyspark