2026-05-31
過去24時間(2026年5月30日〜31日)のGoogle Veo 3およびGoogle Omni(Gemini Omni)に関する主な情報まとめです。
Veo 3 / Veo 3.1 の動向
- Veo 3.1はGoogle AI Studioで利用可能で、テキスト/画像から動画+ネイティブ音声生成が特徴。Veo 3.1 Fast版は速度重視でソーシャルメディアや広告向けに最適化されています。フレームレートや動画長などの仕様が公開され、継続的にアクセス可能。
- X上ではGrok Imagine Video 1.5 PreviewがVideo ArenaのImage-to-VideoベンチマークでVeo 3.1を上回ったという話題が活発。+52ポイント上昇でSeedance 2.0なども抜き、xAIの進捗が注目されています。
@cb_doge: Grokの新モデルがVeo 3.1をベンチマークで上回った点を詳細に共有。動画例も添付され、コミュニティの反応を呼んでいます。
Gemini Omni(Google Omni)の動向
Gemini Omni(特にGemini Omni Flash)はGoogle I/O 2026で発表された統一マルチモーダルモデルで、テキスト・画像・動画・音声を単一モデルで処理。Veo 3.1を基盤に置きつつ、物理理解(physics-aware)や会話ベースの動画編集が強みです。
- 主な特徴(過去24時間の投稿から):
- ネイティブマルチモーダル:別モデルを繋ぐ必要がなく、一貫性が高い。
- 会話編集: 「背景を変えて」「照明を調整」などの自然言語指示で動画を修正。キャラクター/世界観の維持が向上。
- 用途例:手持ち写真/動画の魔改造、解説動画の自動生成、ストーリーボード作成。
- 物理シミュレーションやオブジェクト挿入/削除が強いが、一部で一貫性限界やフィルタリングの指摘あり。
@AiForSuccess: I/O 2026でのGemini Omni発表を簡潔にまとめ、「1モデルで全モダリティ処理」とネイティブマルチモーダルの利点を強調。
@bicha_nure: 詳細な日本語解説投稿。動画編集が「会話」になる革命性、初心者向け使い方3選(会話編集、手持ち素材活用、解説動画生成)を具体例付きで説明。Gemini Omniを「AI動画編集者」と位置づけ、プロンプト例も豊富。
@AIwithSynthia: PixPrettyでのGemini Omni活用例としてファンタジーストーリーボード生成動画を共有。詳細プロンプト(キャラクター設定、パネル構成、スタイル指定)を記載し、実際の出力例を示す。
GitHub関連
- Gemini Omni関連リポジトリ(例: geminiomni/geminiomni、google-gemini-omni/gemini-omni)が活発。デスクトップクライアント、Python SDK、プロンプトガイドなどが更新され、Veo 3.1との統合やローカルワークフローに関する議論が見られます。統一アーキテクチャ(単一Transformerでのトークン処理)の技術的解説が目立つ。
全体として、Veo 3.1は安定運用中、Gemini Omni Flashは会話編集と一貫性の向上でクリエイターの注目を集めています。過去24時間はベンチマーク比較や実用例共有が中心で、新規大規模発表はありませんでした。情報は急速に更新されるので、Google AI StudioやGeminiアプリで直接確認をおすすめします。