OpenAI 的 Whisper 是一种开源工具,据说能够以与人类相同的准确度识别语音。

官方网站https://openai.com/blog/whisper

在这篇文章中,作为 Whisper 的一个稍微不寻常的使用方式,你可以使用“你什么时候开始说,你什么时候说完?”的时间数据,从你喜欢的视频中剪切和粘贴视频,创建你自己的英语教材。输出字幕文件。这里是怎么做的。

你可以制作这样的视频教材

首先,我想介绍一下我自己使用 Whisper 制作的英语教材。和《英语汉农》一样,是反复练习相同英语句子的教材。

(C) Tsugumi Ohba、Takeshi Obata/集英社、VAP、Madhouse、NTV
引自《死亡笔记 / 死亡笔记完整版 DVD-BOX》

(C) Tsugumi Ohba、Takeshi Obata/集英社、VAP、Madhouse、NTV
引自《死亡笔记 / 死亡笔记完整版 DVD-BOX》

识别准确度验证

我们使用 Netflix 的《死亡笔记》的字幕数据来验证识别准确率是否足以作为教材使用。识别模型使用基本模型。

OpenAIの音声認識Whisperを使って好きな洋画やアニメから英語教材を自作する

(C) Tsugumi Ohba、Takeshi Obata/集英社、VAP、Madhouse、NTV
引自《死亡笔记 / 死亡笔记完整版 DVD-BOX》

在这个长长的英文句子中存在三个基本的误认。似乎没有问题。

创建过程

有两种方法,一种是从浏览器上传单个 mp4 文件的简单试用程序,另一种是从 Google Drive mp4 文件(可能有多个文件)创建以进行更全面的使用。我会解释。

尝试的简单步骤

  1. 从下面的链接打开 Google Colaboratory 并使用您的 Google 帐户登录。

    https://colab.research.google.com/gist/dai-pop/7ed153eb33bbecd3f3389088a270fddd/whisper_english.ipynb

    OpenAIの音声認識Whisperを使って好きな洋画やアニメから英語教材を自作する

  2. 运行时 → 更改运行时类型
    OpenAIの音声認識Whisperを使って好きな洋画やアニメから英語教材を自作する

  3. 将硬件加速设置为 GPU
    OpenAIの音声認識Whisperを使って好きな洋画やアニメから英語教材を自作する

  4. 编辑源代码并设置你要练习的单词
    OpenAIの音声認識Whisperを使って好きな洋画やアニメから英語教材を自作する

  5. 按左上角的播放键
    OpenAIの音声認識Whisperを使って好きな洋画やアニメから英語教材を自作する

  6. 按“仍然运行”
    OpenAIの音声認識Whisperを使って好きな洋画やアニメから英語教材を自作する

  7. 从“选择文件”上传带有英语对话的 mp4 视频文件
    OpenAIの音声認識Whisperを使って好きな洋画やアニメから英語教材を自作する

  8. 稍等片刻,视频就准备好了。根据视频的长度,可能需要一些时间。此示例耗时 13 分 15 秒。

    OpenAIの音声認識Whisperを使って好きな洋画やアニメから英語教材を自作する

    如何使用 Google Drive 进行全面使用

    1. 将 mp4 视频放在 Google Drive 的特定文件夹中。该示例假定它被放置在“电影”中。
    2. 打开下面的示例 URL
      https://colab.research.google.com/gist/dai-pop/41664d7b2c7ec110e3253d8e0c40ca44/whisper_english_gdrive.ipynb
    3. 从上面运行每个单元格
    4. 教育视频已在 Google 云端硬盘中准备就绪

      使用的工具

      博客文章介绍

      下面的 URL 解释了一些关于非技术部分的更多信息。如果你喜欢请得到。


原创声明:本文系作者授权爱码网发表,未经许可,不得转载;

原文地址:https://www.likecs.com/show-308628058.html

相关文章: