【誰でもできる】AI画像生成でアバターを作り動画を作る!

新米デザイナーのアピコです。

今日は「AIを使って自分のアバター作り、脚本をテキストで作ったものをアバターが読む動画を作る」までを学んでいきたいと思います。

AIや画像生成を扱うには、厳密にはプロンプト(AIへの的確な指示)を学び指示項目や指示する順序などの技術が必要で、昨今ではプロンプトエンジニアの人材確保は企業にとって重要な課題となっているそうです。

AIの進化は半年で概念を覆すほど早くなっていて、とてもとても人間の学習能力では追いつけません。

私のように新米だったりプロンプトエンジニアではない人でも、臆せずにAIをアシスタントのように使いこなせるようになる方法をあれこれ積極的にチャレンジしていこうと思っています。

そんな私が最も簡単に【誰でもできる】画像生成でアバターを作り動画を作る!方法をお伝えします。

やっぱり有能なChatGPT4(有料)とDall-E3!!

私のようにITやプロンプトに慣れていなくても、しっかりアシストしてくれるのはChatGPT4とDall-E3です!

こちらは有料ですが、GTP4にアップすることで画像生成するDall-E3も使用できます。日本語対応お友だちとLINEする感覚で始めることができます。

ChatGPTの画面

①クリップマークをクリックしてアバターを作りたい画像をファイル選択して、②要望をテキストで打ち込み、③を押すと、十数秒待っていると下記のようにクオリティーの高い画像を生成してくれます。

しかし、アピコにするにはもう少し手直ししてもらう必要があるので、さらに要望を加えてお願いします。

この時、作る側が作りたいビジョンをしっかり持って指示することが大事です。

これが人間だと「あの、すみませんが・・・もうちょっとここをこうして・・・大した変化はないんですけど、ここも・・・あれこれ・・・」と気を遣ってしま意がちですが、AIだと気遣いをせずに気持ちよくお願いできるという点でも、最高のアシスタントになります。

注意したいのは、現在のDall-E3のシステムでは、要望をお願いするたびに画風やキャラクターの顔などが変わってしまうところです。

プロンプトエンジニアになると、気に入ったキャラクターにIDなどをつけ、いろんな動作させることができるようなんですが、今、アピコはできません。(いつかその学習ブログも作れるように頑張りますね!)

それなので、上記のように何度かやり取りをしていくうちに、どんどんキャラクターの顔が変わってしましました。

Dall-E3が出してきた画像の下、ピンクで囲ったマークを押すと、改めて画像を生成してくれます。

アピコは左下のアバターに決めました。

 

脚本を読むアバター  顔認識できる画像とは??

今回の最終目的な「脚本を読む動画を作る」なので、使用予定のアプリが顔認識する必要がありました。

使用予定のアプリは、D-ID の API または Creative Reality™ スタジオです。

それでは、AIが顔と認識する条件を有能なアシスタントGPTくんに聞いてみましょう!!

「顔認識」 Chat GPTくんの答えはこれ!!

AIがキャラクターの顔を認識するための条件は、一般的に以下の要素に依存します。顔認識には多くのアルゴリズムやアプローチがありますが、以下は一般的な条件です。

  1. 顔の特徴検出: まず、AIは画像やビデオフレームから顔の特徴を検出する必要があります。これには、目、鼻、口、眉毛などの顔の主要な部分の位置を検出するためのアルゴリズムが使用されます。
  2. トレーニングデータ: AIモデルをトレーニングするために、多くの顔の画像が必要です。これらの画像は、異なる角度、照明条件、表情、肌のトーンなどのさまざまな変化をカバーする必要があります。
  3. ラベリング: トレーニングデータはラベリングされ、各画像に含まれる顔の位置と特徴が正確に示される必要があります。これにより、AIモデルはどこに顔があるかを理解できるようになります。
  4. イルミネーションと品質: 画像の照明条件や品質が顔認識の性能に影響を与えることがあります。適切な照明条件と高品質な画像は、認識の正確性を向上させるのに役立ちます。
  5. 多くの
  6. 表情と表情の変化: AIは異なる表情や感情を持つ顔を認識できるように訓練される必要があります。怒っている、笑っている、驚いているなど、さまざまな表情が考慮されます。
  7. 多様性への対応: AIモデルは、異なる人種や民族背景、年齢層などの多様性に対応できるように設計されることが望まれます。
  8. 顔の
  9. リアルタイム性: リアルタイムアプリケーションでは、高速で効率的な顔認識が求められます。処理速度が適切であることが重要です。

作ったアバターを設定して脚本を読ませよう!

YouTubeなどで人気のVチューバーですが、動きながら喋ってくれるVirtual(バーチャル)キャラクターを作るには、専門的な技術が必要で、髪の毛や顔のパーツを作って一つずつ設定するなどとても複雑で多くの時間が必要になります。

今回は【誰でもできる】面白いアプリが今回使用するアプリケーション「D-ID」です。

試用期間は無料で10クレジット(15秒の動画10回分、30秒の動画5回分くらい)試すことができるので、気軽に遊んでみることができます。

まずはお手持ちのメールアドレスとパスワードを登録するだけで使用開始できます。

ログイン後の画面

①を押して作ったアバターのファイルを選択します。

※①を押した時に出てくる顔認識の注意書きはこんなものでした。ご参考まで

②脚本をテキストで打ち込みます。コンピューターに読ませる時は棒読みになるので、間が欲しい所に★1の時計マークを押して加えてください。

③読ませる言語を選択

④声優さんの選択

★2で文字起こしもできるようです。

⑤ビデオを生成を押すと、動画が生成されてダウンロードが可能になります。

ダウンロードした動画をSNSや色んなサービスにアップロードすることができます!

完成した動画はこちらです。

今回のブログはいかがでしたか?

実は、この方法を教えてくれたのは広報の「ジュン」さんです。

ジュンさんは、IT業界が長く社内でもとても頼れる存在です。

新しいことも好奇心旺盛で仕事に熱いいつも色んな情報を教えてくれるので、とっても刺激になります。

また色んな面白い情報を聞けましたら、投稿するので、一緒に学んでいきましょう!!

 

 

AIを導入しリーズナブルで確実と信頼があるホームページ制作はアピステクノロジーへ

アピステクノロジーでは、特注システム開発をはじめ、AIを導入したHPの制作にも力を入れています。

WordPressはもちろん、ShopifyのECサイトもご要望に応じて制作いたします。

詳しくは弊社HPをご覧ください。

アピステクノロジーの実績紹介はこちら

システムの入ったパッケージ「ITツール」紹介ページはこちら

アピステクノロジーでは、IT専門家としておすすめPCの販売も行っています!