【发布时间】:2021-10-05 14:46:01
【问题描述】:
我正在寻找构建从 mongoDB 到 google BigQuery 的 ETL 流。我在想下面的ETL流程 MongoDB ->谷歌数据融合->谷歌BigQuery
Google 数据融合似乎没有连接到 MongoDb 的连接器。
还有其他方法可以构建此 ETL 流程吗?
【问题讨论】:
标签: mongodb google-bigquery etl pipeline google-cloud-data-fusion
我正在寻找构建从 mongoDB 到 google BigQuery 的 ETL 流。我在想下面的ETL流程 MongoDB ->谷歌数据融合->谷歌BigQuery
Google 数据融合似乎没有连接到 MongoDb 的连接器。
还有其他方法可以构建此 ETL 流程吗?
【问题讨论】:
标签: mongodb google-bigquery etl pipeline google-cloud-data-fusion
首先,您需要按照以下步骤为 MongoDB to Data Fusion 创建 JDBC 驱动程序:
打开您的数据融合实例。
单击 + 以添加实体并上传驱动程序。
在“上传驱动程序”标签上,拖动或浏览重命名的 JAR 文件。
在“驱动程序配置”选项卡上:
Name:为驱动创建一个名称(cdata.jdbc.mongodb)并记下 的名字。
类名:设置JDBC类名: (cdata.jdbc.mongodb.MongoDBDriver)。
现在您已经创建了 JDBC 驱动程序,您可以将 MongoDB 用于数据融合管道。为此,请务必按照以下步骤操作:
设置标签
将引用名称设置为任何将来引用的值(即: cdata-mongodb)
将插件类型设置为“jdbc”
将连接字符串设置为 MongoDB 的 JDBC URL。例如:
jdbc:mongodb:RTK=5246...;Server=MyServer;Port=27017;Database=test;User=test;Password=Password;
在“接收器”选项卡中,单击以添加目标接收器。
点击 BigQuery 接收器上的“属性”以编辑属性。
设置标签
将引用名称设置为类似 mongodb-bigquery 的值
将项目 ID 设置为特定的 Google BigQuery 项目 ID(或保留默认设置,“自动检测”)
将数据集设置为特定的 Google BigQuery 数据集
将 Table 设置为您希望将 MongoDB 数据插入到的表的名称
我按照this 页面上的教程进行操作,它帮助了我;希望对你有帮助。
【讨论】: