【OpenAI社発表】動画生成AI Soraとは?いつから使用できる?
2024年2月にOpenAI社が発表した動画生成AIツール「Sora」。公式サイトやX(旧Twitter)上で公開された動画の完成度が高いことから、発表されてすぐに世界中から注目も浴びています。
すぐに使用してみたいと思っても、実はまだリリースはされていません。いつから使えるのかソワソワしてしまいますよね。
そんなSoraについて、公式が発表している情報をもとにどんな動画が生成できるのかを解説していきます。リリース予定についてや、機能・使い方などを公開されている動画例とともに紹介しています。ぜひ参考にしてください。
目次
OpenAI社が発表した次世代AIツール「Sora」とは?
Soraとは、2024年2月15日(日本時間16日)にChatGPTを開発したOpenAI社が発表した「動画生成AI」です。公式サイトやX(旧Twitter)にて、Soraで生成された動画が公開され、高画質かつハイクオリティな内容に世界中が注目しているツールです。
どういう動画を作りたいか文章で指定するだけで、リアルな動画の生成が可能です。なお、名前の由来は、日本語の「空」にちなんでいるのではないかと言われています。
一般リリースは2024年内予定ではないかと予想
Soraを使いたいと思っても、2024年4月時点ではアクセスを許可されたアーティストやデザイナーしか利用できません。いつから使用できるのかの明確な日時は不明です。
しかし、2024年4月16日にPhotoshopで有名なAdobeから「Sora」を含む動画生成AIが含まれた機能を今年中に導入すると発表しました。
We’re thrilled to announce breakthrough #GenerativeAI features powered by the new #AdobeFirefly video model. Take a sneak peek at Object Addition, Object Removal and Generative Extend. All coming soon to #PremierePro! 💥 https://t.co/Yg1NxffVNR pic.twitter.com/wa5ivFXAPG
— Adobe (@Adobe) April 15, 2024
このことから、「Sora」自体も2024年中に一般リリースされるのではないかと予想できます。実際にOpenAI社のMira Murati氏が海外メディアに向けて「年内、早ければ数ヶ月以内(にリリース)」と答えています。今からでもワクワクしますよね。楽しみに待ちましょう。
既存の動画生成AIツールとの違い
既存の動画生成AIツールとSoraとの違いは「技術進歩」「生成動画の長さ」「言語理解と映像生成の統合」などです。
最新技術を駆使しているため、従来の動画AIでは3~4秒の長さしかありませんでしたが、Soraでは最大60秒の動画を生成できます。また、言語から映像への翻訳能力はいままでのAIよりもさらに進化しています。
Soraは従来の動画生成AIと比べて、動画の長さや複雑さ、そしてリアリティにおいて一歩先を行っていると言えるでしょう。これらの違いにより、Soraは映像制作の新たな可能性を感じさせています。
Soraでできること
Soraを使ってできることを、公式サイトの内容からまとめてみました。主に以下の6つの機能があります。
- 言語(プロンプト)から動画を生成
- 静止画から動画を生成
- 動画から動画を生成
- 異なる動画を繋げて一つにする
- 画像(静止画)の生成
- 高度なシミュレーション
どんな機能なのか、簡単に解説していきます。
言語(プロンプト)から動画を生成
Soraのメイン機能である「Text-To-Video」は、文字通り言語から動画を生成します。プロンプトの理解がかなり高性能で、文字通りの動画を作成しやすいです。
A new Sora video about a group of adventurous puppies.
— DLife (@dlifeio) February 21, 2024
Prompt:
“Cinematic trailer for a group of adventurous puppies exploring ruins in the sky”
Video generated by Sora
from @_tim_brooks #Sora #SoraAI #OpenAI #SoraMovie #SoraFilm #SoraAnime #aimovie #AIFilm #AIanime pic.twitter.com/wIHP9B1bHE
上記の動画のプロンプトは「空の遺跡を探索する冒険好きな子犬たちの映画の予告編」です。リアルな犬たちが描かれているのが良くわかります。犬種を指定するなど、細かい設定も可能です。
静止画から動画を生成
「Image-to-Video」という機能は、準備した静止画から高度な動画を生成します。プロンプトと組み合わせることで、よりリアリティがある動画にすることも可能です。
動画から動画を生成
「Video-to-Video」は動画の編集・拡張機能で、元の動画から構成能なAI動画を生成できます。例えば、取り出したシーンの時間を逆再生する、連続再生をしてループ動画を生成するなどが可能です。
異なる動画を繋げて一つにする
動画を作成する際、異なる2つのシーンを自然につなげることは、非常に難しい技術です。どうしても、ぶつ切りになったりカットが変わります。
ですが、SORAはまったく異なる2つの動画を繋げながら、一つの流れるような動画を作成することが可能です。
例えば、海辺で撮影されたビデオと山で撮影されたビデオを繋げたいとします。従来の手法では、この2つのシーンの間は場面が唐突に転換することになります。SORAを使えば、海から山へ自然に移行する映像を生成できるのです。
画像(静止画)の生成
Soraは動画だけでなく、画像の生成にも対応しています。最大2048×2048pxの解像度なので、高画質な画像を作れます。
Sora is also capable of generating images.
— Dogan Ural (@doganuraldesign) February 16, 2024
So… here is the comparison:
🧵 OpenAI Sora vs Midjourney v6 pic.twitter.com/MSWA9NKWgG
上記は「Sora」と「Midjourney v6」で生成した静止画を比較したものです。プロンプトは「秋の女性のクローズアップポートレートショット、極端なディテール、浅い被写界深度」となります。リアリティなのはSoraに軍配が上がるかと思われます。
高度なシミュレーション
Soraはデジタル世界の高度なシミュレーションも可能です。
Prompt 1: A surreal scene unfolds as a giant, translucent jellyfish floats gracefully through a deserted cityscape at dusk. The scene is shot on 35mm film.
— Sora Ai Clips (@SoraOpenAiClip) February 25, 2024
[Video Generated by Sora]
Thread 🧵 1/2 pic.twitter.com/IScSJt3afx
上記の動画のプロンプトとして指定された世界観は「夕暮れの荒廃した都市の風景」です。このようにゲームなどの人工的な世界のシミュレーションも作成可能です。
※2024年6月4日現在、Sora公式アカウントが凍結中※
Soraの使い方
Soraの正式な使い方は現時点でまだ未公開です。ですが、機能を見る分には以下のような使い方になると予測できます。
- テキストで指示
- 静止画を読み込ませる
- 動画を読み込ませる
- テキストと静止画のように掛け合わせる
使い方次第では、企業や商品などのプロモーションとしても活用できそうです。動画制作未経験者でも、簡単に作れるようになるのはいいですね。
Soraで動画生成をするメリット
Soraは従来の動画生成AIでは実現できなかった技術が詰め込まれています。主に以下の3つのようなメリットがあります。
- 多彩なカメラワークに対応
- 実写もアニメーションも生成可能
- 既存の世界観を理解して動画に反映
- 物理法則に則った動きをシミュレートできる
多彩なカメラワークに対応
Soraは単一視点の動画だけではなく、多彩なカメラワークに対応しています。まるで映画のような臨場感あふれる動画の生成に期待できます。
A drone camera circles around a beautiful historic church built on a rocky outcropping along the Amalfi Coast, the view showcases historic and magnificent architectural details and tiered pathways and patios, waves are seen crashing against the rocks below as the view overlooks. pic.twitter.com/H19yN833wX
— Sora Ai Clips (@SoraOpenAiClip) February 17, 2024
上記の動画のプロンプトには「ドローンカメラが旋回」と入ってます。このように指定することで、本当にドローンカメラが撮影しているようなカメラワークを実現できます。
ほかにも、走行車をカメラが追いかける、右から左に向けてカメラの視線が変わるなどの指定が可能です。
※2024年6月4日現在、Sora公式アカウントが凍結中※
実写もアニメーションも生成可能
実写やアニメーションの生成も可能です。実写の場合は俳優の名前を指定、アニメーションの場合はキャラの見た目やデザインをもとに3Dアニメーションと入力すれば良いです。
Prompt: “Animated scene features a close-up of a short fluffy monster kneeling beside a melting red candle. the art style is 3d and realistic, with a focus on lighting and texture. the mood of the painting is one of wonder and curiosity, as the monster gazes at the flame with… pic.twitter.com/aLMgJPI0y6
— OpenAI (@OpenAI) February 15, 2024
上記は公式で公開されているSoraで生成されたアニメーションです。なめらかな動きかつ、かわいらしい見た目のキャラクターが生成されています。誰でも簡単に自分好みのキャラクターを作れそうですね。
既存の世界観を理解して動画に反映
Soraは、実際の世界観や街並みを理解して動画に反映できます。「英国スコットランドにある歴史的なグレンフィナン高架」「ブルーアワーのサントリーニ島」のように擬態的な街を指定をすれば実現可能です。
Introducing Sora, our text-to-video model.
— OpenAI (@OpenAI) February 15, 2024
Sora can create videos of up to 60 seconds featuring highly detailed scenes, complex camera motion, and multiple characters with vibrant emotions. https://t.co/7j2JN27M3W
Prompt: “Beautiful, snowy… pic.twitter.com/ruTEWn87vf
上記の公式動画は東京の街を指定しています。リアルな世界観をもとに、非現実的な動画が生成されています。
物理法則に則った動きをシミュレートできる
物理法則に則った動きをシミュレートできることも大きなメリットと言えます。人や動物などの自然な動きを大量のデータで学習させているので、様々な表現が可能です。
Photorealistic closeup video of two pirate ships battling each other as they sail inside a cup of coffee. pic.twitter.com/gTwVPhHcal
— Sora Ai Clips (@SoraOpenAiClip) February 17, 2024
上記の動画のプロンプトは「コーヒーカップの中を航行しながら戦う2隻の海賊船」です。コーヒーの表面がまさに大海原のような自然な波ができているうえ、波に揺られる海賊船の動きも滑らかです。
また、物理法則にのっとった動きは、教え込まなくてもSora自ら学習します。
※2024年6月4日現在、Sora公式アカウントが凍結中※
Soraが抱える問題点と対策
Soraは革新的な動画生成AIとして注目を集めていますが、技術的な問題や倫理的な懸念もあります。現在は、そうした課題が多いことから一般公開が控えられています。
ここでは、Soraが直面している技術的な課題や潜在的なリスク、そしてこれらの問題に対してOpenAI社がどのような対策を講じているのかを紹介します。
生成された動画を悪用されるリスク
最初に挙げられるリスクは、有名人の肖像やフェイクニュースの生成です。実在の人物を無断で登場させたり、偽の情報を拡散するような動画を、作成することができてしまいます。
この問題に対処するため、OpenAIはいくつかの対策を講じています。まず、生成する動画に対する厳格なガイドラインを設け、特定の指示文に対して拒否をしたり、不適切な内容のフィルタリングを強化しています。
また、動画がAIによって生成されたことを示すマークの追加や、生成過程の透明性を高めることも重要な対策として挙げられます。
さらに、OpenAIは社会的な影響を考慮し、専門家や一般のユーザーからのフィードバックを積極的に取り入れ、倫理的な観点からもモデルの改善を進めています。
こうした取り組みを通じて潜在的なリスクを減らし、安全かつ責任ある技術の利用を目指しています。
生成された動画の技術的な問題
Soraなら高精度な映像を生成できますが、それでもまだまだ、技術的な課題を抱えています。
4/ Soraの弱点
— 木内翔大@SHIFT AI代表「日本をAI先進国に」𝕏 (@shota7180) February 17, 2024
動画生成AIの完成形に見えるSoraですが、以下の課題点がOpenAIによって報告されています。
・複雑な空間を正確にシミュレート
・物事の因果関係の理解
・プロンプトに含まれる空間に関する情報処理
・時間の経過に伴う出来事の正確な描写… pic.twitter.com/spWlx8TG12
例えば、動植物が物理的にあり得ない動きをしたり、物体の特性・性質や相互作用を理解できずに、不自然な動きをしてしまう場合があります。
これらの問題に対処するため、OpenAI社はモデルの改善と最適化を進めています。具体的には、データの充実とアルゴリズムの効率化を通じて、生成される動画の品質と処理速度の向上を図っています。
また、AIがより現実的な物理法則を学習し、自然な動きを再現できるよう、新たな学習手法の開発にも注力しています。
Chat GPTで有名なOpenAIの最先端技術だからこそ期待度が高い
OpenAIのSORAが公開した動画は多くの人々から注目を集めました。その詳細な映像表現と高いクオリティに、多くのユーザーが驚きとともに多くの期待を抱いています。
画像生成AI「Dalle3」で作られた画像をOpenAI「Sora」によって動画化された、ある厨房の映像。
— そねち | AIクリエイター (@AIsonesone) March 8, 2024
画像1枚からここまで世界が広がり、空間の一貫性も保てていることにやはり驚き。
各種画像生成AIとSoraとを連携させるのが楽しみ。pic.twitter.com/ZT8GKLc33Q
これOpenAIの「Sora」で生成された美術館ツアーで、本物にいるかのような没入感。
— 火神(かがみ)@AI大全 (@k_aitaizen) March 13, 2024
しかも1分と今までの動画生成AIの中で最長レベル。
ドローンで撮影したかのような視点で作れるのでリリースされたら世界が変わる・・・!pic.twitter.com/HwtjGx3iqz
最新技術を駆使した動画生成AIの登場は、私たちの創造や生産性の向上をサポートしてくれるはずです。今後の続報を注目したいところですね。
RANKING ランキング
- WEEKLY
- MONTHLY
UPDATE 更新情報
- ALL
- ARTICLE
- MOVIE
- FEATURE
- DOCUMENT