OpenAIの動画生成AI"sora"とその先にあるAGI(汎用人工知能）がヤバイ

2024年2月21日 2025年4月1日

私はほぼ毎日「AI」の開発現場でのたうち回っていますが、
そういう現場にいてこれほどに進化がすさまじく急速な技術は
AI以外では超えるものが無いだろうと実感しています。

開発現場といっても本当に泥臭い、しょうもない話が多く、
「今日、〇〇さんからコロナになったと連絡あったのですが、ここのフォローをどうしたらいいでしょうか？」
とかに代表されるようなAIとは関係なくどこにでもある話ばかりです。

そういうなかにあっても、ときどきぶっ飛んだ話を知る機会があり、
この記事ではChatGPTの母体であるOpenAIが最近発表している記事などから
末恐ろしい状況をご報告したいと思います。

OpenAIの動画生成AI"sola"

ChatGPTはご存じのように、テキスト（文章）を入力に
テキストをアウトプットするLLM（Large Language Model)のひとつです。

ChatGPTを提供しているOpenAIが最近発表した"sora"が話題を集めています。
soraはプロンプトから映像を生成するAIです。

OpenAI自身が発表したこの記事にサンプル動画も載っていますので
どんなものかは直観的にご理解いただけると思います。

: https://openai.com/research/video-generation-models-as-world-simulators

openai.com

細かく映像をチェックすると実は不自然な点もまだまだ残っていますが、
濡れたアスファルトを歩く女性のリアリティを見ると、
映像全体の完成度としては恐ろしいほどの進化です。

まだまだ初期レベルのものですが動画生成での不自然な点の一例を指摘しておくと、
前記画像（＝生成動画のキャプチャ画像）の赤い丸で囲った領域をご覧ください。

夜の繁華街でのいかにもありそうな看板がたくさん表示されていますが、
ここに看板や標識上の文字を見るとお分かりのように、もちろんこれは日本語でも中国語でもありません。

さらに言うとどの国の言語でもありません。

ひらかな、かたかなっぽい表記が看板にもありますが、
全体として意味を成しておりません。
少なくとも人間は理解できないはずです。

soraがどのように学習したのかは不明ですが、
看板画像なんかで見かける情報を選んでそれらしく表示しており、
テキストのつもりかもしれませんが地球では見かけることのできない不自然さがわかります。

ただ、今がまだそうであるに過ぎずこういった不自然さもどんどん解消され、
そうそう簡単に見破れない動画生成を行う日はさほど遠くないように感じています。

こういった技術でフェイク情報が溢れると、
きっと滑らかでリアリティのある映像の細部には気づかず
それを本物だと信じてしまう人がたくさん出てくるでしょう。

この手の予防と対策については、
マグニフィセントセブンだけではなく
各国政府が連帯してしっかり管理してもらいたいものです。

ChatGPTが2022年11月に発表されてから、たった1年ちょっとでここまできたわけです。

生成AIのマルチモーダル化

今、AIの世界で話題でもあり活発に進んでいるのがマルチモーダル化。

マルチモーダル化とはテキストだけではなく、
画像・映像・音声を処理できる
という意味合いです。

プロンプトにテキストだけではなく、画像・音声・動画を入力して
なんらかのアウトプットを得ていくというものです。

テキストをプロンプトとして画像・音声・動画を生成する次元を超えて、
これらがいわゆる生成AIの入力情報となる、という意味。

実はChatGPTの運営母体であるOpenAIはそこにかなり力を入れています。

なにを目指しているのか？
というと；

AGI（Artificial General Intelligence　人工汎用知能）

と呼ばれるものです。

AGIとは人間と同様の知識や能力を持ち、
独自の学習や問題解決ができる能力を持ち合わせているAIのことです。

従来からあるChatGPT含めたAIとは次元の異なるAIとなります。

AIのマルチモーダル化を推進することがAGIを実現するために
欠かせないステップであることをOpenAIは熟知しているのです。

AIに耳と目を与えると物理法則や数学も理解できる

AGIは経験から学習する能力を持つために、空恐ろしいことに
新たな発見や技術の進歩をもたらす可能性大と言われてます。

そのためのステップがマルチモーダル化になるのですが、
ここを少し詳しくお話します。

わかりやすく言うと；

映像（動画）からAIは物理法則や数学を学びとる
可能性が十分あります。

どうやって？

例えば、動画に「木からリンゴが落ちる」様子が含まれていたとします。

するとそのような動画をたくさん学習させるとマルチモーダル化されたAIは、

重力の存在に気づき、
リンゴが落ちるスピードや時間から重力加速度を知り
その重力加速度が地球では9.8 m/s²

であることも知るでしょう。

この重力加速度がいくらか？程度のことは、ChatGPTもこれまでの学習で
とっくに理解できていることですが、重要なことは
自ら法則やそこに関係する数学を発見できるということなのです。

映像や音声で学習できるということは、
AIに目と耳を与えたことになるのです。

実はAGIとともに
ASI（ Artificial Superintelligence　人工超知能）
も業界では話題のひとつです。

ASIはAGIがさらに進化したものです。

ASIは人間の知能を超えたレベルの人工知能であり、
あらゆるタスクや問題において人間よりも圧倒的に優れた能力を持つことを意味します。

要するに人間には解決できないことを解決できるポテンシャルを秘めています。

これは何者？
人類の福音になるのか破滅を呼ぶのかわかりません。
わかりませんが、そこを目指しているのです。

いかがでしょうか、ChatGPT出現から1年ちょっとで
そういう世界がまじかにやってきているという現実に
日々AIにまみれている私も驚きの連続です。

この記事タイトルとURLをコピー

comment コメントをキャンセル

This site uses Akismet to reduce spam. Learn how your comment data is processed.

BLOG strategy

2025/4/1

山口周さんの「人生というプロジェクトの原理」に深く感銘受けた話（人生の経営戦略）

山口周さんは、元ボストン・コンサルティンググループなどで活躍されてきた正真正銘のプロのコンサルタントです。（現在はコンサルティング以外でも多数の分野で活躍されています）私は約20年前、当時本業として勤めていた会社がアメリカの某社を買収（M&A)するかどうか、その可能性と是非を調べて来いとの社命で一時期アメリカに渡って仕事をするチームに加わり、それまで全く知識外であった本場のコンサルに出会いました。現地で2つのコンサルティングファームと仕事をすることになり、ボストン・コンサルティングもそのひとつ ...

strategy 木坂健宣

2025/2/15

木坂健宣さんの公式メルマガ最新情報　

何年かぶりの木坂メルマガ案内この記事は、木坂健宣さんファンのためのシンプルなご連絡記事になります。当ブログでも木坂健宣さんの話は何度かとりあげており、わりと頻繁にお問合せもいただきます。木坂健宣さんとは何者か？はここでは割愛し、すでに名前を知ってる方に通じればという思いです。お問合せは、「木坂健宣さんのメルマガに登録するにはどうすればよいですか？」的なものが多く、実はこの返答にはややこしい事情がありズバッとお答えできていません。この記事でご紹介している木坂健宣さんの公式メルマガ最新情報も、いつリンク ...

AI BLOG strategy

2025/2/11

中国発『DeepSeek』のインパクト～これからAIはどうなる？

2025年1月末に突如としてAI業界に震撼が走りました。中国のAIスタートアップDeepSeekの登場です。この記事ではDeepSeekがどんな影響を与えているのか、これからどうなりそうかを考察してみました。きっかけは直接関係はありませんが、以下のようなご相談をメルマガ読者様からいただいたことで最近のAI動向で思っていることを整理したいと思ったからです。「1000万円の開発費がかかったAIツールは買いですか？」そのAIツールがなにものであるにせよ、この読者様は「1000万円」という数字が大変に大きな ...

BLOG CONTENTS TIPS

2025/1/30

日本人の「理念」とはなにかに迫るMomoka JapanのYouTubeが凄い～マーケッター必見！

この記事は2024年7月に投稿した以下の記事の続編となります。 Momoka Japanってなに？星の数あるYouTubeチャネルでご紹介しているワケとか前記記事をご覧いただければすぐにご理解いただけるはずです。一言でいうと、「外国人に日本食をご馳走しその反応を紹介しているYouTubeチャネル」というものですが、この言い方では同種のチャネルはたくさん存在します。前記記事にて私は、Momoka Japanは成功するべくして成功していると述べました。この思いは最近、より深く実感しており、先の記事ではお ...

CONTENTS strategy

2025/1/11

曼荼羅チャートの読み解き方～「自分」の壁を知る

新春企画として、以下の「AIバースト完全版マーケッター曼荼羅チャート」をご紹介している中で、メルマガ読者様からとても興味深いご質問をいただきました。なお以下のページは販売期間中のみ閲覧可能ですのでご注意ください。ご質問とは；『曼荼羅チャートという単語をよく耳にしますが、これは自分を発見するためのものですか？』一般的に世間に知られている曼荼羅チャートは、目標設定シートなどにも活用されるため「YES」かもしれません。ただし、私が今回ご提供している「AIバースト完全版マーケッター曼荼羅チャート」の ...

「気のボール（元気玉）」は錯覚か科学か

RenderNetでバーチャルモデルを作って遊ぼう

OpenAIの動画生成AI"sora"とその先にあるAGI(汎用人工知能）がヤバイ

OpenAIの動画生成AI"sola"

https://openai.com/research/video-generation-models-as-world-simulators

生成AIのマルチモーダル化

AIに耳と目を与えると物理法則や数学も理解できる