【发布时间】:2019-08-28 20:26:39
【问题描述】:
我想在我的笔记本电脑上使用 PySpark 从 s3 读取数据。但我收到以下错误消息。
spark._jsc.hadoopConfiguration().set("fs.s3n.awsAccessKeyId", "...")
spark._jsc.hadoopConfiguration().set("fs.s3n.awsSecretAccessKey", "...")
my_df = spark.read.csv("s3n://bucket-name/file_name.csv").count()
Py4JJavaError:调用 o498.csv 时出错。 : java.lang.RuntimeException: java.lang.ClassNotFoundException: 类 org.apache.hadoop.fs.s3native.NativeS3FileSystem 找不到
【问题讨论】:
-
你能解决这个问题吗?目前让我发疯
标签: amazon-s3 pyspark jupyter-notebook