Technical Blog テクニカルブログ
  1. HOME
  2. テクニカルブログ
  3. OpenAIのSoraを使ってみた【導入編】

OpenAIのSoraを使ってみた【導入編】

投稿者:長嶺

1. はじめに

こんにちは。NI+Cの長嶺です。
OpenAIの動画生成AI「Sora」が2024年12月10日に一般提供されました。

テキストや画像をもとに、リアルで高品質な動画を自動生成するツールは、話題を呼んでいます。
Soraの概要、料金プランや使い方を紹介し、実際に動画を生成した感想をお伝えしたいと思います。

2. OpenAI Soraについて

Soraは、OpenAIが提供する先進的なAIツールです。
テキストや簡単な指示をもとに、即座に高品質な動画を生成することができるプラットフォームです。
どのような特徴があるか見てみましょう。

  • テキストから即座に動画を生成
    ユーザーが入力したテキストに基づいて、Soraはシーン、キャラクター、アクションなどをリアルタイムで生成し、瞬時に動画を完成させます。これにより、手間のかかる制作過程を大幅に省略できます。
  • インタラクティブなコンテンツ生成
    ユーザーとの対話を通じて、動画内容を調整することが可能です。視聴者に最適化された体験を提供し、動画のパーソナライズを実現します。
  • 幅広い応用分野
    Soraは教育、マーケティング、エンターテインメント、広告など、さまざまな業界での利用が進んでおり、コンテンツ制作の効率化と質の向上を実現します。

Soraは、誰でも簡単に高品質な動画を制作できる新しい方法を提供し、動画制作の未来を切り拓くツールとして注目されています。

3. Soraの料金とプラン

Soraの料金プランには、「ChatGPT Plus」と「ChatGPT Pro」の2種類があります。
Proプランは高解像度の動画制作が可能になります。
Soraの利用には、クレジットが必要になり、プランに応じて付与されるクレジット数や利用条件は以下の通りです。
詳細は、OpenAI公式サイトをご確認ください。

プランの紹介ChatGPT PlusChatGPT Pro
月額料金$20$200
優先ビデオ作成本数最大50本最大500本
優先ビデオクレジット1,000クレジット10,000クレジット
最大解像度720p1080p
最大ビデオ長さ720pで5秒(480pで10秒)1080pで20秒
同時生成可能ビデオ数44
その他の特徴創造性を探求する機能を含む無制限のリラックスビデオ生成、
ウォーターマークなしでダウンロード可能

今回は、「ChatGPT Plus」のプランを使用して動画を生成していきます。

4. Soraを使ってみた①:テキストから動画生成

実際にテキストから動画を生成してみます。
まず、プロンプトを作成します。作成したい動画の内容を記述します。
今回は、パンダがダンスを踊る動画を生成したいと思います。
ポイントは、詳細な指示のプロンプトを作成することにより、イメージに沿った動画を生成することができます。

今回は、解像度480pで動画の長さを5秒に指定。同時生成ビデオ数は1を選択しています。

出来上がった動画を見て頂くと、映画『サタデー・ナイト・フィーバー』のイメージでダンスホールでパンダが踊っている動画が生成されました。

5. Soraを使ってみた②:画像から動画生成

次に写真から動画を生成したいと思います。
以前、中国旅行で撮った成都のジャイアントパンダの写真を取り込んで、動画にしてみます。

画像や動画をアップロードするには、以下のように「+」ボタンからアップロードができます。

初回のみ確認事項への承諾が必要になります。

画像がアップロードされると、どの部分を動画にするか範囲を指定します。
パンダ部分を選択して、プロンプトの指示文には何も入れずに動画を生成してみます。

プロンプトに何も入れずに実行すると、思い出のパンダ写真がリアルな動画として、生成されました。

同じ写真を使用して、プロンプトに先ほど「テキストから動画生成』で使用した指示文を入れて実行します。

生成された動画は、写真のパンダがキレキレのダンスを踊っています。

6. Soraを使ってみた③:日本語と英語指示文の生成動画の違い

テキストから動画生成をした際、日本語でプロンプトを作成しました。
プロンプトの指示文について、日本語よりも英語の方がより正確に内容が伝わると言われています。
実際に同じ内容の指示文を英語で入力した場合、どのような動画が生成されるか見てみましょう。

「4.Soraを使ってみた①:テキストから動画生成』で使用した日本語の指示文を英語にして、実行します。

生成された動画は、以下になります。アングルが真正面になりましたが、日本語と比較して、それほど大きな差はないように思えます。
このくらいの指示文であれば、日本語でも英語でも大きな差は出ないことが分かりました。
より細かいニュアンスなどは、英語の方が良いかもしれませんが、日本語でも十分イメージ通りの動画を生成してくれます。

7.まとめ

動画生成AI「Sora」を使ってみた感想は、まず第一にクオリティが高いことに驚きました。
想像していたよりもイメージに近い動画を生成することができました。
また、動画生成までの操作が非常に簡単なので誰でも高品質の動画を作成することができます。
今回は、「ChatGPT Plus」のプランで動画を生成しましたが、制約のあるプランでも十分その性能を堪能することができました。

テキストからの動画生成では、背景やカメラワーク等、細かい指示をプロンプトすることで、
よりイメージに近い動画を生成することができます。

また、画像から動画生成では、写真が本物のように違和感なく動き出したのには感動しました。
思い出の写真もプロンプトの指示文次第で自分のイメージ通りの動画にすることができます。

今回は、導入編として、「Sora」を使って、誰でも簡単に動画生成できることを紹介しましたが、
次回、生成した動画をオプション機能を使って、より高度な動画にブラッシュアップしていきたいと思います。

ページのトップへ