【发布时间】:2019-06-03 11:05:45
【问题描述】:
任何人都可以在不转换 xlsx 或 xls 文件的情况下告诉我,我们如何将它们作为 spark 数据帧读取
我已经尝试使用 pandas 读取,然后尝试转换为 spark 数据帧,但出现错误,错误是
错误:
Cannot merge type <class 'pyspark.sql.types.DoubleType'> and <class 'pyspark.sql.types.StringType'>
代码:
import pandas
import os
df = pandas.read_excel('/dbfs/FileStore/tables/BSE.xlsx', sheet_name='Sheet1',inferSchema='')
sdf = spark.createDataFrame(df)
【问题讨论】:
标签: python-3.x azure databricks