【问题标题】:'SparkSession' object has no attribute 'textFile'“SparkSession”对象没有属性“textFile”
【发布时间】:2021-09-11 15:37:56
【问题描述】:

我目前正在使用 SparkSession,并被告知 SparkContext 在 SparkSession 中。但是,在编写代码时,它向我显示 SparkSession 中不存在 SparkContext 的错误

下面是我做的代码

import findspark
findspark.init()
from pyspark.sql import SparkSession, Row
import collections

spark = SparkSession.builder.config("spark.sql.warehouse.dir", "file://C:/temp").appName("SparkSQL").getOrCreate()

lines = spark.textFile('C:/Users/file.xslx')

错误如下:

---------------------------------------------------------------------------
AttributeError                            Traceback (most recent call last)
~\AppData\Local\Temp/ipykernel_59944/722806425.py in <module>
----> 1 lines = spark.textFile('C:/Users/samue/bt4221_spark/exercise/week5/customer-orders.xslx')

AttributeError: 'SparkSession' object has no attribute 'textFile'

我目前的版本 发现火花:1.4.2 pyspark:3.0.3

我不认为它与任何版本问题有关。任何帮助是极大的赞赏! :)

【问题讨论】:

    标签: apache-spark pyspark apache-spark-sql


    【解决方案1】:

    textFile 出现在 SparkContext 类中而不是 SparkSession

    spark.sparkContext.textFile('filepath')
    

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 2019-05-17
      • 2017-01-24
      • 2018-03-31
      • 1970-01-01
      • 1970-01-01
      • 2012-12-01
      • 2021-08-03
      相关资源
      最近更新 更多