作者姜海玲
最后更新于 2022 年 6 月 28 日

警告
本文来自 Teradata 公司网站入门这是在 中发布的内容的删节版。我们不保证所发布内容的准确性、完整性、可靠性或最新性。具体内容请参考原文。
另外,如果您有任何需要或更正的要求或更正,请发表评论。

概述

Teradata Jupyter Extension 提供 Teradata SQL 内核和几个 UI 扩展,允许用户从 Jupyter 环境轻松访问和操作 Teradata 数据库。 Google Vertex AI 是 Google Cloud 全新的统一机器学习平台。 Vertex AI Workbench 为您的整个数据科学工作流程提供基于 Jupyter 的开发环境。本文介绍了如何将我们的 Jupyter 扩展与 Vertex AI Workbench 集成,以便 Vertex AI 用户可以在其 ML 管道中利用 Teradata 扩展。

Vertex AI Workbench 支持两种类型的笔记本:托管笔记本和用户管理的笔记本。在这里,我们专注于用户管理的笔记本。有两种方法,使用启动脚本安装内核和扩展,以及使用自定义容器。

先决条件

・访问 Teradata Vantage 实例

笔记!
如果您需要 Vantage 的新实例,您可以在 Google Cloud、Azure 或 AWS 云上安装名为 Vantage Express 的免费版本。您还可以使用 VMware、VirtualBox 或 UTM 在本地计算机上运行 Vantage Express。

・已启用 Vertex AI 的 Google Cloud 帐户
- 用于存储启动脚本和 Teradata Jupyter 扩展包的谷歌云存储

关于整合

有两种方法可以在 Vertex AI 上运行 Teradata Jupyter Extensions。

使用启动脚本
使用自定义容器

下面介绍这两种集成方法。

使用启动脚本

您可以在创建新笔记本实例时指定启动脚本。此脚本仅在实例创建后运行一次。以下是步骤。

① 下载 Teradata Jupyter 扩展包
Jupyter 的 Vantage 模块从以下位置下载捆绑的 Linux 版本的 Teradata Jupyter 扩展包
② 将包上传到谷歌云存储桶。
③ 创建启动脚本并上传到您的云存储桶。
下面是一个示例脚本。从您的云存储桶中获取 Teradata Jupyter 扩展包并安装 Teradata SQL 内核和扩展。

install_Vantage_JupyterExt
#! /bin/bash

cd /home/jupyter
mkdir teradata
cd teradata
gsutil cp gs://teradata-jupyter/* .
unzip teradatasql*.zip

# Install Teradata kernel
cp teradatakernel /usr/local/bin

jupyter kernelspec install ./teradatasql --prefix=/opt/conda

# Install Teradata extensions
pip install --find-links . teradata_preferences_prebuilt
pip install --find-links . teradata_connection_manager_prebuilt
pip install --find-links . teradata_sqlhighlighter_prebuilt
pip install --find-links . teradata_resultset_renderer_prebuilt
pip install --find-links . teradata_database_explorer_prebuilt

# PIP install the Teradata Python library
pip install teradataml

# Install Teradata R library (optional, uncomment this line only if you use an environment that supports R)
#Rscript -e "install.packages('tdplyr',repos=c('https://r-repo.teradata.com','https://cloud.r-project.org'))"

④ 创建一个新笔记本并从您的云存储桶中添加启动脚本。

Google Vertex AIとTeradata Jupyterエクステンションを統合する方法

⑤ 完成笔记本创建可能需要几分钟时间。完成后,单击打开笔记本“点击。

Google Vertex AIとTeradata Jupyterエクステンションを統合する方法

使用自定义容器

还有一种方法可以在创建笔记本时提供自定义容器。

① 下载 Teradata Jupyter 扩展包
Jupyter 的 Vantage 模块从页面下载适用于 Linux 的 Teradata Jupyter 扩展包捆绑包。
② 将此包复制到您的工作目录并解压。
③ 构建自定义 Docker 镜像

自定义容器必须在端口 8080 上公开其服务。我们建议创建一个派生自 Google Deep Learning Containers 映像的容器。这些映像已配置为与用户管理的笔记本兼容。

下面是一个示例 Dockerfile,可用于构建安装了 Teradata SQL 内核和扩展的 Docker 映像。

示例_Docker
# Use one of the deep learning images as base image
# if you need both Python and R, use one of the R images
FROM gcr.io/deeplearning-platform-release/r-cpu:latest

USER root

##############################################################
# Install kernel and copy supporting files
##############################################################

# Copy the kernel
COPY ./teradatakernel /usr/local/bin

RUN chmod 755 /usr/local/bin/teradatakernel

# Copy directory with kernel.json file into image
COPY ./teradatasql teradatasql/

# Copy notebooks and licenses
COPY ./notebooks/ /home/jupyter
COPY ./license.txt /home/jupyter
COPY ./ThirdPartyLicenses/ /home/jupyter

# Install the kernel file to /opt/conda jupyter lab instance
RUN jupyter kernelspec install ./teradatasql --prefix=/opt/conda

##############################################################
# Install Teradata extensions
##############################################################

RUN pip install --find-links . teradata_preferences_prebuilt && 
    pip install --find-links . teradata_connection_manager_prebuilt && 
    pip install --find-links . teradata_sqlhighlighter_prebuilt && 
    pip install --find-links . teradata_resultset_renderer_prebuilt && 
    pip install --find-links . teradata_database_explorer_prebuilt

# Give back ownership of /opt/conda to jovyan
RUN chown -R jupyter:users /opt/conda

# PIP install the Teradata Python libraries
RUN pip install teradataml

# Install Teradata R library (optional, include it only if you use a base image that supports R)
RUN Rscript -e "install.packages('tdplyr',repos=c('https://r-repo.teradata.com','https://cloud.r-project.org'))"

④ 在工作目录(解压 Teradata Jupyter 扩展包的地方),码头工人建造构建图像。

docker_build
docker build -f Dockerfile imagename:imagetag .

⑤ 将 docker 镜像推送到 Google 容器注册表或工件注册表。
要将 docker 映像推送到您的注册表,请参阅下面的文档。

容器注册表。图像推拉
工件注册表。图像推拉

⑥ 创建一个新的笔记本。
"环境部分,自定义容器字段到新创建的自定义容器的位置。

Google Vertex AIとTeradata Jupyterエクステンションを統合する方法

学到更多

Teradata Jupyter 扩展网站
适用于 Jupyter 的 Teradata Vantage™ 模块安装指南
Teradata® Python 包用户指南
顶点 AI 文档。创建用于训练的自定义容器映像
顶点 AI 文档。使用自定义容器创建用户管理的笔记本实例
顶点 AI 文档。创建用户管理的笔记本实例

联系 Teradata Vantage

联系 Teradata Vantage


原创声明:本文系作者授权爱码网发表,未经许可,不得转载;

原文地址:https://www.likecs.com/show-308631680.html

相关文章:

  • 2022-02-18
  • 2022-12-23
  • 2021-06-30
  • 2021-04-24
  • 2021-06-18
  • 2022-12-23
  • 2021-04-20
  • 2022-12-23
猜你喜欢
  • 2022-12-23
  • 2022-12-23
  • 2022-12-23
  • 2021-08-18
  • 2021-04-06
  • 2022-12-23
  • 2021-06-19
相关资源
相似解决方案