주요 기사 바로가기

「ChatGPT? 正気なら使わないだろう」…“世界をモデリングする” AI がやって来る(2)

ⓒ 中央日報/中央日報日本語版2025.12.11 15:31
0
◆ビッグテックもワールドモデル競争開始

「私たちは今、Gemini (ジェミニ)を、単なる言語モデルを越えて、世界の一部をシミュレーションし、未来の行動を計画できるワールドモデルへと拡張している」。今年5月のGoogle I/O(年次開発者会議)で、グーグル・ディープマインド(Google DeepMind)のデミス・ハサビスCEOはこう宣言した。グーグル・ディープマインドは、テキストだけでリアルタイムに探索できる3次元世界を生成できる「Genie 3」を公開した。長期計画や物理シミュレーションを目指している。ビッグテックの中で最も積極的なのはエヌビディア(NVIDIA)だ。エヌビディアは今年初め、ワールドモデル「Cosmos(コスモス)」を発表した。ワールドモデルが話題になると、オープンAI(Open AI)も「Sora(ソラ)を基盤にビデオモデルを世界シミュレーターへ拡張できる」と表明した。中国の百度・テンセントやUAEのムハンマド・ビン・ザーイド人工知能大学(MBZUAI)もワールドモデル競争に参戦した。

 
AI競争の様相も変わる可能性がある。ワールドモデル時代は「世界シミュレーションプラットフォーム」を誰が先に確保するかの戦いに変わる。理由は簡単だ。現実をシミュレーションできるプラットフォームを持つ企業が、ロボット・自動運転・デジタルツイン・XRなど物理世界を基盤とした産業の標準を事実上支配できるからだ。ビッグテックはワールドモデルを通じて特定産業を独占するのではなく、産業全体のシミュレーション環境を提供するプラットフォームへ進化しようとしている。エヌビディアのジェンスン・フアンCEOは「ワールドモデルこそ、ロボット・自動運転などフィジカルAIを開く鍵」と強調した。物理世界を再現するプラットフォームを持つ企業が、次世代産業の標準を事実上掌握するという意味だ。

投資資金を武器にしたスタートアップも参入している。フェイフェイ・リー氏が創業したワールドラボ(World Labs)は、テキスト・写真・ビデオだけで編集可能な3D世界を作るワールドモデル「Marble」を公開し、市場にいち早く商用製品を出した。ヤン・ルカン氏も、自らワールドモデルのスタートアップを創業する計画を明らかにした。

◆まだ越えるべき山は多い

しかし、ワールドモデルが、まるでOpen AIが新しいモデルを出すように、近いうちに私たちの目の前にすぐに現れるわけではない。ワールドモデルの発展で最大の難関とされるのは、やはりデータだ。世界を理解するには、時間の流れ・物理的相互作用・3D構造が絡み合った大規模データで学習しなければならない。問題は、インターネット上のデータを集めて学習したLLMとは違い、こうしたデータはインターネットに蓄積されておらず、形式もまちまちで、収集自体が難しく費用もかかる点だ。現実世界の物理法則を習得するには数十億単位の高品質マルチモーダルデータが必要だが、現状ではその量も質も圧倒的に不足している。アクシオスは「超大規模の高品質マルチモーダルデータが必要だが、現在公開されているデータセットは出発点にすぎない」と伝えた。

「ChatGPT? 正気なら使わないだろう」…“世界をモデリングする” AI がやって来る(1)

関連記事

最新記事

    もっと見る 0 / 0
    TOP