作者姜海玲
最后更新于 2022 年 6 月 28 日
警告
本文来自 Teradata 公司网站入门这是在 中发布的内容的删节版。我们不保证所发布内容的准确性、完整性、可靠性或最新性。具体内容请参考原文。
另外,如果您有任何需要或更正的要求或更正,请发表评论。
概述
Teradata Jupyter Extension 提供 Teradata SQL 内核和几个 UI 扩展,允许用户从 Jupyter 环境轻松访问和操作 Teradata 数据库。 Google Vertex AI 是 Google Cloud 全新的统一机器学习平台。 Vertex AI Workbench 为您的整个数据科学工作流程提供基于 Jupyter 的开发环境。本文介绍了如何将我们的 Jupyter 扩展与 Vertex AI Workbench 集成,以便 Vertex AI 用户可以在其 ML 管道中利用 Teradata 扩展。
Vertex AI Workbench 支持两种类型的笔记本:托管笔记本和用户管理的笔记本。在这里,我们专注于用户管理的笔记本。有两种方法,使用启动脚本安装内核和扩展,以及使用自定义容器。
先决条件
・访问 Teradata Vantage 实例
笔记!
如果您需要 Vantage 的新实例,您可以在 Google Cloud、Azure 或 AWS 云上安装名为 Vantage Express 的免费版本。您还可以使用 VMware、VirtualBox 或 UTM 在本地计算机上运行 Vantage Express。
・已启用 Vertex AI 的 Google Cloud 帐户
- 用于存储启动脚本和 Teradata Jupyter 扩展包的谷歌云存储
关于整合
有两种方法可以在 Vertex AI 上运行 Teradata Jupyter Extensions。
下面介绍这两种集成方法。
使用启动脚本
您可以在创建新笔记本实例时指定启动脚本。此脚本仅在实例创建后运行一次。以下是步骤。
① 下载 Teradata Jupyter 扩展包
Jupyter 的 Vantage 模块从以下位置下载捆绑的 Linux 版本的 Teradata Jupyter 扩展包
② 将包上传到谷歌云存储桶。
③ 创建启动脚本并上传到您的云存储桶。
下面是一个示例脚本。从您的云存储桶中获取 Teradata Jupyter 扩展包并安装 Teradata SQL 内核和扩展。
#! /bin/bash
cd /home/jupyter
mkdir teradata
cd teradata
gsutil cp gs://teradata-jupyter/* .
unzip teradatasql*.zip
# Install Teradata kernel
cp teradatakernel /usr/local/bin
jupyter kernelspec install ./teradatasql --prefix=/opt/conda
# Install Teradata extensions
pip install --find-links . teradata_preferences_prebuilt
pip install --find-links . teradata_connection_manager_prebuilt
pip install --find-links . teradata_sqlhighlighter_prebuilt
pip install --find-links . teradata_resultset_renderer_prebuilt
pip install --find-links . teradata_database_explorer_prebuilt
# PIP install the Teradata Python library
pip install teradataml
# Install Teradata R library (optional, uncomment this line only if you use an environment that supports R)
#Rscript -e "install.packages('tdplyr',repos=c('https://r-repo.teradata.com','https://cloud.r-project.org'))"
④ 创建一个新笔记本并从您的云存储桶中添加启动脚本。
⑤ 完成笔记本创建可能需要几分钟时间。完成后,单击打开笔记本“点击。
使用自定义容器
还有一种方法可以在创建笔记本时提供自定义容器。
① 下载 Teradata Jupyter 扩展包
Jupyter 的 Vantage 模块从页面下载适用于 Linux 的 Teradata Jupyter 扩展包捆绑包。
② 将此包复制到您的工作目录并解压。
③ 构建自定义 Docker 镜像
自定义容器必须在端口 8080 上公开其服务。我们建议创建一个派生自 Google Deep Learning Containers 映像的容器。这些映像已配置为与用户管理的笔记本兼容。
下面是一个示例 Dockerfile,可用于构建安装了 Teradata SQL 内核和扩展的 Docker 映像。
# Use one of the deep learning images as base image
# if you need both Python and R, use one of the R images
FROM gcr.io/deeplearning-platform-release/r-cpu:latest
USER root
##############################################################
# Install kernel and copy supporting files
##############################################################
# Copy the kernel
COPY ./teradatakernel /usr/local/bin
RUN chmod 755 /usr/local/bin/teradatakernel
# Copy directory with kernel.json file into image
COPY ./teradatasql teradatasql/
# Copy notebooks and licenses
COPY ./notebooks/ /home/jupyter
COPY ./license.txt /home/jupyter
COPY ./ThirdPartyLicenses/ /home/jupyter
# Install the kernel file to /opt/conda jupyter lab instance
RUN jupyter kernelspec install ./teradatasql --prefix=/opt/conda
##############################################################
# Install Teradata extensions
##############################################################
RUN pip install --find-links . teradata_preferences_prebuilt &&
pip install --find-links . teradata_connection_manager_prebuilt &&
pip install --find-links . teradata_sqlhighlighter_prebuilt &&
pip install --find-links . teradata_resultset_renderer_prebuilt &&
pip install --find-links . teradata_database_explorer_prebuilt
# Give back ownership of /opt/conda to jovyan
RUN chown -R jupyter:users /opt/conda
# PIP install the Teradata Python libraries
RUN pip install teradataml
# Install Teradata R library (optional, include it only if you use a base image that supports R)
RUN Rscript -e "install.packages('tdplyr',repos=c('https://r-repo.teradata.com','https://cloud.r-project.org'))"
④ 在工作目录(解压 Teradata Jupyter 扩展包的地方),码头工人建造构建图像。
docker build -f Dockerfile imagename:imagetag .
⑤ 将 docker 镜像推送到 Google 容器注册表或工件注册表。
要将 docker 映像推送到您的注册表,请参阅下面的文档。
⑥ 创建一个新的笔记本。
"环境部分,自定义容器字段到新创建的自定义容器的位置。
学到更多
・Teradata Jupyter 扩展网站
・适用于 Jupyter 的 Teradata Vantage™ 模块安装指南
・Teradata® Python 包用户指南
・顶点 AI 文档。创建用于训练的自定义容器映像
・顶点 AI 文档。使用自定义容器创建用户管理的笔记本实例
・顶点 AI 文档。创建用户管理的笔记本实例
联系 Teradata Vantage
原创声明:本文系作者授权爱码网发表,未经许可,不得转载;
原文地址:https://www.likecs.com/show-308631680.html