AI動画生成「Vidu」が大規模アップデートを発表、音声・映像統合生成「Vidu Q3」で制作効率を向上

未分類

主要な新モデルと機能強化

Vidu Q3:音声・映像統合生成によるストーリーテリングの強化

Vidu Q3 「Built for Storytelling」

Vidu Q3は、業界で初めて最大16秒のネイティブ音声・映像を単一パスで生成する長編AI動画モデルです。音声と映像をモデルレベルで直接統合することで、完全に同期されたストーリーテリングが可能になります。

主な機能

  • 音声・映像の同時生成: 最大16秒のネイティブ音声・映像を単一パスで出力。

  • 多言語対応リップシンク: 中国語・日本語・英語に対応し、キャラクターの口の動きが発話内容と完全に同期。

  • 映画的カメラ制御: ドリー、パン、チルトの詳細指定や、シームレスなカット割り制御。

  • ネイティブ1080p(フルHD)出力: 看板や字幕などのテキスト情報も正確に表現。

  • ストーリーボード編集: 時間経過とテンポ調整が単一カット内で可能。

これらの機能により、アニメーション、ショートドラマ、映画制作など、物語主導のフォーマットでの活用が期待されます。

詳細については、Vidu公式サイトをご確認ください。

Vidu Q2 Reference-to-Video Pro:制御可能なクリエイションの実現

Vidu Q2 Reference-to-Video Proは、「あらゆるものを参照素材として活用できる」世界初の動画モデルです。2つの動画参照と4つの画像参照を統合ワークフロー内で同時にサポートし、AI動画生成を一発生成から構造化された参照駆動型のワークフローへと拡張します。

主な機能

  • 複数参照の同時活用: 2つの動画と4つの画像を統合ワークフロー内で参照可能。

  • 要素の追加・削除・変更: 全体を再生成せずに部分修正が可能。

  • 表情・感情転写: 参照動画の表情や感情の流れを別の人物へ転写。

  • 動作再現: ダンスなどの動作を異なるキャラクターで再現。

  • スタイル変換: 動画全体を日本アニメ風、ピクサー風、クレイアニメーション風などに一括変換。

これにより、より高い制御性、一貫性、制作効率が実現されます。

詳細については、Vidu Q2 Reference-to-Video Pro特設ページをご確認ください。

その他の強化点

  • Reference Hub: 世界初のAI動画主体ベース制作コミュニティとして、8つの構造化されたカテゴリと200種以上の厳選された主体を提供。クリエイターは独自の動画・画像素材をアップロードして主体として保存することも可能です。
    詳細については、Vidu公式サイトをご確認ください。

  • Vidu Agent 1.0: インテリジェントなプランニングとリアルタイム生成によるワンクリック動画制作を実現。カスタムBGMアップロード、ナレーション削除機能、ストーリーボードベース編集などの新機能が追加されました。
    詳細については、Vidu公式サイトをご確認ください。

研究開発と技術的優位性

Viduは、最先端研究を実用可能なシステムへ迅速に転換する「研究開発の実装速度」を競争力の源泉としています。清華大学との共同研究によるTurboDiffusionは、推論速度を最大200倍に高速化し、OpenAI Soraなどの競合との差別化要因となっています。

AI評測機関「Artificial Analysis」が発表したText-to-Videoリーダーボードにおいて、Vidu Q3 ProはELOスコア1,241を獲得し、グローバル第2位にランクインしました。Runway Gen-4.5やGoogle Veoなどの主要競合を上回り、世界トップレベルの動画生成プラットフォームとしての地位を確立しています。

ベンチマークの詳細は、Artificial Analysisのリーダーボードで確認できます。

グローバルでの採用と市場の課題解決

2024年4月のローンチ以降、Viduは200以上の国と地域で展開され、4,000万人以上のクリエイターと10,000以上の開発者・企業顧客にサービスを提供しています。プラットフォーム上で生成された動画は5億本以上に達し、総出力の70%以上が商業プロジェクトとして活用されています。

日本国内の動画配信サービス市場は2024年度で約6,500億円規模に達し、グローバルではAI動画生成市場が2032年には25.629億米ドルへ拡大する見込みです。動画制作現場における時間とコストの負担、音声と映像の同期精度、多言語対応といった課題に対し、Viduは独自のU-ViTアーキテクチャを用いたマルチモーダル大規模基盤モデル技術を活かし、「音声と映像を一括生成し、制作工程を統合する」ことでこれらの解決を目指します。

提供開始日および料金プラン

  • 提供開始日: 2026年1月30日より順次展開

  • 料金プラン: 無料プラン(80クレジット相当の機能試用)、有料プラン(スタンダード、プレミアム、アルティメット、エンタープライズ)が用意されています。

詳細な料金およびクレジット体系については、Vidu公式サイトの料金ページをご確認ください。

関連リンク

コメント

タイトルとURLをコピーしました