Skip to content
公開日

2026-06-06

過去24時間(2026年6月5日〜6日頃)のGoogle Veo 3およびGoogle Omni(Gemini Omni)に関する主な情報まとめ(古い情報は除外)。

Veo 3の状況

Veo 3(およびVeo 3.1)は、Google DeepMindの動画生成モデルとして安定して利用可能で、テキスト/画像/動画入力から高品質な動画(音声付き、720p〜4K、最大8秒程度)を生成。GitHub上ではプロンプト集、ComfyUIカスタムノード、APIラッパーなどのリポジトリが活発に更新されており、実装例(例: text-to-video、image-to-video、extend機能、4K upscale)が共有されています。

公式アクセスはGeminiアプリ、Google Flow、Gemini API経由が主流で、Canvaへの統合も進んでいます。リアルタイム生成や物理法則の再現が強化されていますが、一部ユーザーからは生成失敗や安定性の指摘もあります。

Google Omni(Gemini Omni / Gemini Omni Flash)の最新動向

Gemini OmniはVeoの動画生成能力をGeminiのマルチモーダル(テキスト・画像・音声・動画入力対応)に統合した「world model」で、会話形式の動画編集が最大の特徴です。自然言語で背景変更、スタイル変換、カメラ移動、音声追加、キャラクター一貫性維持などが可能。YouTube Shorts、Google Flow、Geminiアプリに展開されており、SynthIDウォーターマークとC2PA検証でAI生成コンテンツの透明性を確保しています。

過去24時間のX上の主な言及(指定アカウント中心、詳細引用): - @Strength04_X: Gemini Omni Flashを使って「The Overnight Ferry ⛴️」や「The Seedling Forest 🌲」などの美しい動画を生成・共有。夜のフェリーや森のシーンで、滑らかな動きと雰囲気再現の高さを示す例。 - @kevstrat: 「Google Omniは現在最も印象的なAI動画ツール」と評価。動画作成・シーン編集・音声生成・スタイル適用・AIアバター構築をシンプルプロンプトで実現したテスト動画を公開。 - @ham_ai_skill: Google Omniで物理法則に基づく動き(AIが苦手とする領域)を再現した動画例を共有。10回以上の生成で得られた安定例として、ドローンPOV(麻布台ヒルズから東京タワー)や実写風→アニメ風変換を紹介。プロンプト詳細も記載。

他の指定アカウントでは関連の新規詳細発言は確認されませんでした(多様なユーザーからの分散引用を優先)。

その他のX/ネットの指摘: - 偽情報動画生成の懸念:NewsGuard調査で、Gemini Omniが一部虚偽主張(地政学関連など)を裏付けるリアル動画を容易に生成するケースが報告(健康関連は拒否傾向)。認知戦への影響を懸念する声。 - ユーザー体験:動画-to-動画編集で厳格な安全フィルタが適用され、軽微な変更でも拒否されるケースあり。 - GitHub:Veo 3スタイルのオープン実装(MTVCraftなど)やプロンプトガイドが活発。

全体として、Veo 3は基盤動画生成モデルとして成熟し、Gemini Omniは会話型編集・マルチモーダル統合でクリエイティブワークフローを革新している段階。過去24時間は実例共有と実用性議論が中心で、新規大規模発表はなし。最新情報はGeminiアプリや公式ブログで確認を。

(情報はツール検索に基づく2026年6月6日時点のスナップショット。状況は急速に変化します。)