【发布时间】:2021-01-10 09:51:19
【问题描述】:
我这里有一段简单的代码:
query = """
select id, date, type from schema.camps
"""
df = spark.sql(query)
我收到一条错误消息:
> > "cannot resolve '`id`' given input columns:
> > [ecs_snapshot, ecs_version, ecs_bundle_type]; line 2
文件
>> “/usr/lib/spark/python/lib/pyspark.zip/pyspark/sql/session.py”,行
>> 767,在 sql 中
>> 返回 DataFrame(self._jsparkSession.sql(sqlQuery), self._wrapped) 文件
>> "/usr/lib/spark/python/lib/py4j-0.10.7-src.zip/py4j/java_gateway.py",
>> 第 1257 行,在 调用
>> 答案,self.gateway_client,self.target_id,self.name)文件“/usr/lib/spark/python/lib/pyspark.zip/pyspark/sql/utils.py”,
> 第 69 行,
> > 在装饰
>> 引发 AnalysisException(s.split(': ', 1)[1], stackTrace) pyspark.sql.utils.AnalysisException: "无法解析
>> 'id' 给定输入列:[ecs_snapshot,
>> ecs_version, ecs_bundle_type];第 2 行第 11 行;"
根据提供的解决方案尽我所能。有趣的是,我在另一个工作正常的表上有另一个查询。对此有任何帮助将不胜感激。提前致谢。
这是表的架构:
camps(
id numeric(38,0) NOT NULL encode raw,
name varchar(765) NULL encode zstd,
type varchar(765) NULL encode zstd,
YYYY varchar(765) NULL encode zstd,
ZZZZ varchar(765) NULL encode zstd,
LLLL varchar(765) NULL encode zstd,
MMMM numeric(38,0) NULL encode zstd,
NNNN varchar(765) NULL encode zstd,
date timestamp without time zone NULL encode zstd,
PPPP numeric(38,0) NULL encode az64,
PRIMARY KEY (marketplace_id, campaign_id)
)
;
【问题讨论】:
-
ads.dim_campaigns - 你可以显示描述吗?
-
@mvasyliv 在此处添加了架构
-
对不起。带有数据库广告的表 dim_campaigns 的架构?
标签: python-3.x pyspark apache-spark-sql