2026-06-14
過去一週間(2026年6月7日頃〜6月14日頃)のAI画像生成サービス動向まとめ(Google Nanobana系・Adobe Firefly除く)。
Grok / xAIの画像生成(Grok Imagine)
xAIのGrok Imagineは引き続き活発に更新されており、Grok Imagine 1.5 Preview関連の言及が見られます。画像-to-ビデオ機能の強化、キャラクターの一貫性向上、シームレスな環境生成、ドローン風トラッキングショットや360°カメラムーブ、シネマティックなストーリーテリング対応などが進んでいます。音声統合の可能性も指摘され、アニメイラストの自然な動き生成で高評価です。
- @Eris_Create_Labは、Grok Imagineのアップデートで「アニメイラストをそのまま自然な形で動かす」性能がSeedance並みかそれ以上と評価。激しいアクションや日本語ボイスはまだ課題だが、全体として好印象。
- @PrivateIcedC81は、Grok Imagineに新テンプレート「Logo Editor」が追加されたと報告。
- xAI公式ではGrok Imagine 1.5 Previewの画像-to-ビデオモデル(720p対応、自然言語モーション制御)がAPIプレビューで利用可能。ソース画像のルック・アンド・フィーリングを維持しつつシネマティック動画化可能。
Grokの画像生成はFlux系基盤を活かしたリアリズムと柔軟性が強みで、Premiumユーザー向けに継続進化中です。
ChatGPT / OpenAIの画像生成(GPT Image / DALL-E後継)
ChatGPT Images 2.0(gpt-image-2モデル)は4月頃のリリース後、安定運用・改善フェーズに入っている模様。推論(thinking)モードでの複雑プロンプト対応、多画像生成、テキストレンダリング強化(多言語対応)、幅広いアスペクト比(3:1〜1:3)が特徴で、マーケティングやデザイン実務向けに評価されています。DALL-Eシリーズからの移行が進んでいます。
X上では具体的な新アップデート言及は少なく、既存機能の活用報告(プロンプト改善など)が主でした。
Midjourney
Midjourney V6/V8.1関連の話題が活発。V8.1がデフォルト化し、HDモデル解禁で画像粒度・フォトリアリズムが大幅向上。スタイル参照(--sref)、撮影用語活用のプロンプトエンジニアリング、論理的整合性強化が実務現場で高く評価されています。
- @muku_snsはV8.1デフォルト化とHD解禁を報告。「画像の粒度が細かくてすごい」と絶賛し、解説記事を公開。逆光エフェクトなどChatGPTにはない表現力が魅力。
- @ai_hakase_はV6のプロ品質生成術として、スタイル参照・撮影用語・コンテキスト理解の重要性を解説。クリエイティブ現場のスピードアップに最適。
Ideogram(有力オープンウェイト候補)
Ideogram 4.0(6月3日リリース)が過去一週間の目玉。9.3Bパラメータのオープンウェイトモデルで、商用ライセンス対応。テキストレンダリング(OCR精度97%前後)、2Kネイティブ解像度、透明PNG出力、キャラクター一貫性、bounding-boxレイアウト制御が強力。デザインツールとしての実用性が高く、open-weightながら閉鎖モデルに迫る評価。
GitHubでもプロンプト集(EvoLinkAI/awesome-ideogram-4.0-promptsなど)が更新され、YouTubeサムネ・ポスター・ロゴ向けとして注目。
その他の動き(Flux系など)
- Flux.2関連のマイグレーションや派生モデル言及あり(例: Flux2-Klein-9B)。Black Forest Labs基盤の継続進化。
- 全体として、テキスト精度・一貫性・実務適応(デザイン、広告、クリエイティブ)が進化の焦点。オープンウェイトモデルの台頭(Ideogram 4.0など)が閉鎖モデルとのギャップを縮めています。
X上の議論はユーザー体験中心で、具体的な新機能リリースはGrok ImagineやMidjourneyの細かいアップデート、Ideogram 4.0の反響が主。GitHubはプロンプト/ツール共有が活発。古い情報(2025年以前)は除外しました。状況は日々変化するので、最新は各公式を確認してください。