【发布时间】:2019-02-12 10:12:04
【问题描述】:
我想在 spark 数据框中加载一个数据表。我的数据库中有 2 个表。是否需要写 2 次完整连接选项? 有什么办法可以写一次公共部分,然后多次更改变量表名。
table1 = spark.read\
.format("jdbc")\
.option("url","jdbc:oracle:thin:USER/Password@host:port/db_name")\
.option("driver","oracle.jdbc.driver.OracleDriver" )\
.option("dbtable","table_name_1")\
.load()
table2 = spark.read\
.format("jdbc")\
.option("url","jdbc:oracle:thin:USER/Password@host:port/db_name")\
.option("driver","oracle.jdbc.driver.OracleDriver" )\
.option("dbtable","table_name_2")\
.load()
【问题讨论】:
标签: python-3.x apache-spark pyspark bigdata data-science