【发布时间】:2020-07-09 12:18:20
【问题描述】:
我正在尝试使用 JDBC 从数据库表中读取内容:
val df = spark.read.jdbc("<database url>", "<some table name>", <some DbProperties>)
然后将其写入另一个数据库:
df.write.mode(SaveMode.Append).jdbc("<other database url>", "<same table name>", <some DbProperties>)
- 如果我们没有在 Db 属性中指定
numPartitions选项,那么numPartitionsSpark 用于将表从数据库读取到df的默认值是多少? - 如果我想将上面的
df写入另一个数据库的另一个表中,如果我仍然不指定numPartitions,写入数据库时是否会创建并行连接? - 假设在阅读时我将
numPartitions设为 8,而在将此df写入目标数据库时,如果我在写入时没有明确指定numPartitions = 8仍然有效吗?
【问题讨论】:
标签: scala apache-spark apache-spark-sql