【问题标题】:Specifying database name while using Neo4j-Spark connector在使用 Neo4j-Spark 连接器时指定数据库名称
【发布时间】:2021-04-08 17:03:35
【问题描述】:

Neo4j-Spark connector (4.0.0) 的最新版本中,官方文档中有一个示例演示了如何使用 spark (here) 从 Neo4j 中读取数据:

import org.apache.spark.sql.{SaveMode, SparkSession}

val spark = SparkSession.builder().getOrCreate()

spark.read.format("org.neo4j.spark.DataSource")
  .option("url", "bolt://localhost:7687")
  .option("labels", "Person")
  .load()
  .show()

想象一下,我有几个数据库在“bolt://localhost:7687”上运行。我想知道如何指定要从中读取数据的数据库名称。这个连接器甚至支持这种事务吗?

【问题讨论】:

    标签: apache-spark neo4j


    【解决方案1】:

    driver configuration 部分https://neo4j.com/developer/spark/configuration/ 中可以发现database 选项用于指定要使用的数据库:

    spark.read.format("org.neo4j.spark.DataSource")
      .option("url", "bolt://localhost:7687")
      .option("database", "mydb")
      .option("labels", "Person")
      .load()
      .show()
    

    您还可以在此处找到该选项的源代码:https://github.com/neo4j-contrib/neo4j-spark-connector/blob/4.0/src/main/scala/org/neo4j/spark/Neo4jOptions.scala#L83

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 2022-10-19
      • 1970-01-01
      • 1970-01-01
      • 2017-06-26
      • 1970-01-01
      • 2018-11-19
      • 2020-12-11
      相关资源
      最近更新 更多