【Midjourney×llElevenLabs×D-iD】AIアバターに自分の声で多言語に喋らせる方法

アバターにしゃべらせる方法

デジタル技術が進化する中で、私たちの日常生活にも革新的な変化が訪れています。

特に、自分だけのアバターを持つことができ、それが自分の声で話すというのは、非常に興味深いテーマです。

このブログでは、MidjourneyElevenLabsを使って、自分の声を持つAIアバターを作る方法を簡単に説明します。

この方法を使えば、誰でも簡単に自分だけのデジタルキャラクターを持つことができます

目次

MidjourneyでAIアバターを作成する

まずはAIアバターを作成していきます。

今回AIアバターはMidjourneyで作成します。

Midjourneyの基本的な使い方は以下のブログで解説していますので、まだ利用したことがない方はこちらから確認してみてください。

以下のプロンプトにより作成しました。

render of attractive man ,front facing,looking at camera

いかつすぎますね・・・

アバターの注意点(失敗例)

はじめに以下のようなプロンプトで、ピクサーアニメ風のアバター画像を作成しました。

/imagine prompt: <画像のURL> cartoon 3d render of attractive man,in the style of pixar ,front facing,looking at camera

初めに以下の画像をアップロードしようとしましたが、後続の「D-ID」で顔を識別できずにアップロードできませんでした。

D-IDという動画生成AIツールでは、正面を向いた画像しか顔を判別できないようです。

その場合、上のプロンプトでも紹介していますが、「front facing,looking at camera」をプロンプトにつけてあげましょう。そうすることで正面を向いた顔画像を生成してくれます。

しかし、次の画像も今度は動画作成の段階でエラーが頻発しました。

llElevenLabsでの音声生成

音声はllElevenLabsで作成しました。

llElevenLabsであれば自分の音声をさまざまな言語に変換することができます。

ピクサー風の主人公が言いそうな言葉を、15秒程度の文章で作るようChatGPTに依頼しました。

今回作成した音声は以下になります。

自分の声で音声ファイルを作成するには、llElevenLabsの使い方を解説していますのでこちらを参照してみてください。

D-IDでの動画作成

アバターと音声ができたとこで、これらから動画を生成してアバターに音声を喋らせます。

動画生成には「D-ID」という動画生成AIツールを使用します。

まずはD-ID(https://www.d-id.com/)にアクセスし、右上の「START FREE TRIAL」をクリックします。

無料サインアップで20クレジット分の動画生成が可能です。「Sign up」ボタンから登録していきましょう。

登録が完了すると、ダッシュボードに戻るため、右上の「Create」から「Video」をクリックします。

Avatar画面で、作成したアバターをアップロードしましょう。「+」マークから画像ファイルをアップロードします。

アップロードできたら、Avarar画面から動きを設定していきます。

Emotionsでは、表情だったり動きをつけていく設定です。お好みのものを選択しましょう。

Script画面の「Upload audio」から音声ファイルをアップロードしていきます。

アップロードが完了しました。

音声ファイルをアップロードしたら、「Generate video」ボタンをクリックします。

Creditsを1消費するようです。「Let’s go」ボタンをクリックします。

しばらく時間がかかりますので待ちましょう。

もう1回アバターを作り直してみると・・・

気を取り直して、よりリアルな人間に近いアバターを作成してみます。(私ではありません)

「We’ve successfully・・・」と表示され、作成できました。

「failed to generate video」エラーによる動画作成失敗

動画作成が完了すると思いきや、ものすごく失敗します。「failed to generate video」というエラーで失敗します。

どうやらネット検索していくと、アニメ風の顔は判別が難しいようです。

まとめ

いかがでしたでしょうか。Midjourney×llElevenLabs×D-IDでのアバターに喋らせる方について解説してきました。

Midjourneyでアバター作成、llElevenLabsで音声作成、D-IDで音声に合わせてアバターに喋らせることを実現することができました

とても面白いものができたのですが、フェイク動画には十分に注意したいところです。

これらを使ってどのような未来を創っていけるのかを模索しつつ、今後のAI動向に期待します。

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!
目次