公開日 2026-05-31

2026-05-31

過去24時間（2026年5月30日〜31日）のGoogle Veo 3およびGoogle Omni（Gemini Omni）に関する主な情報まとめです。

Veo 3 / Veo 3.1 の動向

Veo 3.1はGoogle AI Studioで利用可能で、テキスト/画像から動画+ネイティブ音声生成が特徴。Veo 3.1 Fast版は速度重視でソーシャルメディアや広告向けに最適化されています。フレームレートや動画長などの仕様が公開され、継続的にアクセス可能。
X上ではGrok Imagine Video 1.5 PreviewがVideo ArenaのImage-to-VideoベンチマークでVeo 3.1を上回ったという話題が活発。+52ポイント上昇でSeedance 2.0なども抜き、xAIの進捗が注目されています。

@cb_doge: Grokの新モデルがVeo 3.1をベンチマークで上回った点を詳細に共有。動画例も添付され、コミュニティの反応を呼んでいます。

Gemini Omni（Google Omni）の動向

Gemini Omni（特にGemini Omni Flash）はGoogle I/O 2026で発表された統一マルチモーダルモデルで、テキスト・画像・動画・音声を単一モデルで処理。Veo 3.1を基盤に置きつつ、物理理解（physics-aware）や会話ベースの動画編集が強みです。

主な特徴（過去24時間の投稿から）:
ネイティブマルチモーダル：別モデルを繋ぐ必要がなく、一貫性が高い。
会話編集：「背景を変えて」「照明を調整」などの自然言語指示で動画を修正。キャラクター/世界観の維持が向上。
用途例：手持ち写真/動画の魔改造、解説動画の自動生成、ストーリーボード作成。
物理シミュレーションやオブジェクト挿入/削除が強いが、一部で一貫性限界やフィルタリングの指摘あり。

@AiForSuccess: I/O 2026でのGemini Omni発表を簡潔にまとめ、「1モデルで全モダリティ処理」とネイティブマルチモーダルの利点を強調。

@bicha_nure: 詳細な日本語解説投稿。動画編集が「会話」になる革命性、初心者向け使い方3選（会話編集、手持ち素材活用、解説動画生成）を具体例付きで説明。Gemini Omniを「AI動画編集者」と位置づけ、プロンプト例も豊富。

@AIwithSynthia: PixPrettyでのGemini Omni活用例としてファンタジーストーリーボード生成動画を共有。詳細プロンプト（キャラクター設定、パネル構成、スタイル指定）を記載し、実際の出力例を示す。

GitHub関連

Gemini Omni関連リポジトリ（例: geminiomni/geminiomni、google-gemini-omni/gemini-omni）が活発。デスクトップクライアント、Python SDK、プロンプトガイドなどが更新され、Veo 3.1との統合やローカルワークフローに関する議論が見られます。統一アーキテクチャ（単一Transformerでのトークン処理）の技術的解説が目立つ。

全体として、Veo 3.1は安定運用中、Gemini Omni Flashは会話編集と一貫性の向上でクリエイターの注目を集めています。過去24時間はベンチマーク比較や実用例共有が中心で、新規大規模発表はありませんでした。情報は急速に更新されるので、Google AI StudioやGeminiアプリで直接確認をおすすめします。