【发布时间】:2019-12-21 06:54:47
【问题描述】:
我在 Databricks 上使用 Scala Notebook。我需要将数据从数据框插入到 SQL Server 中的表中。如果数据已经存在,则无需修改或插入——只插入不存在的数据。
我尝试了这里指定的方法https://docs.databricks.com/spark/latest/data-sources/sql-databases.html#write-data-to-jdbc,但是,它们没有解决我的用例。 SaveMode.Append 创建数据的重复条目,SaveMode.Overwrite 替换现有数据(表),如果表已存在,SaveMode.Ignore 不会添加任何新数据。
df.write.mode(SaveMode.Overwrite).jdbc(url=dbUrl, table=table_name, dbConnectionProperties)
如何只向数据库插入新数据?
非常感谢您的帮助!
【问题讨论】:
标签: sql-server scala apache-spark-sql databricks