YouTube、動画の他言語への吹き替え導入で人工知能に賭ける

YouTube AI

YouTube は AI 統合に賭ける

人工知能革命はすでに事実 そして、それは私たちの日常生活を良くも悪くも変えるために到来した引き返せない地点であり、私たちはそれに適応し、イエスかイエスか対話する必要があります。

最近の人工知能 (AI) モデルの素晴らしさ、およびさまざまな製品やソリューションへの実装により、多くの企業、組織、開発者、アプリケーションなどが自社の製品に AI の使用を実装する必要性を認識しています。

とで Google の場合も例外ではありません。 彼の賭けに加えて 独自のチャットボット「Bard」, 同社はまた、さまざまな製品への AI の実装にも取り組んできました。 そして今日私たちが共有するメモの中で、YouTube (Google が所有) は、AI によって生成された多言語合成オーディオ トラックの生成のサポートを導入しました。

それ YouTube が賭けた新しい実験機能、クリエイターが許可することを目的としています。 新規および既存のビデオに吹き替えを追加します。 より幅広い国際的な視聴者にリーチします。

この新機能の動作については、次のように述べられています。 このツールはクリエイターに代わってビデオを文字起こしし、それを翻訳して吹き替え版を作成します。 作成者は、吹き替えが生成される前にトランスクリプトを確認および編集できます。

同社が発表した 現在、数百人のクリエイターを対象にこのツールをテスト中です。 現時点でサポートされている言語はほとんどありませんが、YouTube は XNUMX 月末に、さらにいくつかの言語が間もなく利用可能になると発表しました。

この新機能 Aloud と連携して開発されており、 Google の Area 120 インキュベーターから独立した、AI を活用したナレーション サービスです。 プレゼンテーションの Web サイトによると、Aloud はビデオの文字起こしから開始し、レビューして編集できるトランスクリプトを提供します。その後、Aloud が翻訳して吹き替えを制作します。

「私たちの長期的な目標は、あらゆる言語を吹き替えられるようにすることであり、そのために、さまざまな地域で吹き替えコンテンツのテストと学習を続けていきます。 クリエイターが母国語を超えて活躍できるよう支援することで、新しい視聴者にリーチできるようになります。 YouTube は、翻訳されたオーディオ トラックをより多くの表現と口パクでクリエイターの声のように聞こえるように取り組んでいます」と、Aloud の共同創設者で、新しく YouTube 吹き替えプロダクト マネージャーに任命された Buddhika Kottahachchi 氏は述べています。

上で述べたように、現在 f英語のビデオのみで動作し、スペイン語とポルトガル語の吹き替えをサポートします。 しかし、Google のサポートと YouTube との提携を考慮すると、Aloud は将来的に言語オプションを拡大する可能性があります。 とはいえ、ビデオに多言語吹き替えを追加するクリエイターが増えているため、言語の数が限られている場合でも、Aloud は便利なツールになる可能性があります。

最近まで、Aloud は Google の社内インキュベーターの一部でした。 XNUMX月から彼は正式に会社に統合されました。 現時点では、Aloud パイロット プロジェクトは主に、チャンネルがアップロードで収益を得ることができる YouTube アフィリエイト プログラムにすでに参加しているクリエイターで構成されています。 教育クリエイターは最初に選ばれるチャンネルの XNUMX つです。

個人的なコメントとして言及しておきますが、 YouTube でのこの機能の実装は称賛に値します。 そして間違いなく、これが他の同様のプラットフォーム、たとえばオンライン学習プラットフォームの参考になることを願っています。将来このコンセプトを実装すれば、多くの人々が情報や知識にアクセスできるようになるでしょう。

そして、とりわけ、別の言語で書かれた記事、ビデオ、カンファレンスを見つけられず、そのコンテンツを楽しむ能力が制限されている人たちです。 たとえば、Linux の場合、学習プラットフォームに関するカンファレンスやコースのビデオで、ほとんどが英語またはその他の言語で、単に字幕がない、またはプラットフォームによって生成されたものさえ存在しないものが何本ありますか。まともだと思われます。

たとえば、ウォーキング中や、常に画面を見ている必要のないその他の活動をしながら楽しめることを考えることは、間違いなくこれまでの AI の最良のユースケースの XNUMX つです。

ただし、コインの裏側もあります。これは、多くの人にとって、翻訳者やビデオの吹き替えに専念する人々という職業の喪失につながる可能性があり、さらには誤用を示す可能性もあります。これをリラックスした方法で扱うことで、たとえば、フェイクニュースでの使用。

最後に、もしあなたが それについてもっと知りたい、 あなたはで詳細を確認することができます 次のリンク。