公開日 2026-06-07

2026-06-07

過去1週間（2026年5月31日〜6月7日頃）のAI画像生成サービス動向まとめ（Google NanoBanana系・Adobe Firefly除く）

この期間、主な動きはGrok Imagineのビデオ関連拡張、ChatGPT Images 2.0の積極活用、Ideogram 4.0のリリースを中心に、Flux系やMidjourneyなどの既存モデルとの比較・プロンプト共有が活発でした。GitHubではStable Diffusion/ComfyUI関連の継続的な更新が見られますが、大規模新リリースの言及は少なかったです。

1. Grok Imagine（xAI）

Grokの画像生成機能（FLUX.1基盤中心）は引き続き注目を集め、Grok Imagine Video 1.5 Preview（5月30日頃リリース、過去1週に話題）が画像-to-ビデオやテキスト-to-ビデオで高評価。ネイティブオーディオ（音楽・効果音・リップシンク）、ビデオ拡張、720P対応などが強みで、画像生成のクオリティ向上（Quality Mode API含む）も継続的に言及されています。

X上では日常的に「Grok Imagine」で生成した画像共有が多く、Android/iOSの機能展開差異についてのユーザー議論も見られますが、画像生成自体は安定して利用可能。

2. ChatGPT Images / GPT Image 2.0（OpenAI）

ChatGPT Images 2.0が非常に活発に使われており、プロンプト共有や具体的な画像生成事例（和風写真、ファッション、レイアウトモックアップなど）が多数投稿されています。アップロード写真を基にしたスタイル転写や、詳細なシーン指定（例: 黒道千金和風写真9パターン）で高品質出力が得やすい点が評価され、サムネイル作成やアイデアラフに特に有効という声が多いです。

例: @zhongying14 は、GPT Image 2の詳細プロンプト（人物特徴固定、和室設定、光線・服装指定など）を共有し、視覚反差（外国人漢服など）の生成例を示しています。プロンプトの構造化（固定総控＋個別シーン）が実用的。

@AiWithTariq はGemini/Grok/GPT Image 2.0での写真アップロード活用法をスレッドで解説。

3. Ideogram 4.0（Ideogram）

6月3日リリースの最新モデルが大きなトピック。建築・街並み生成で特に強みを発揮し、「NBP（NanoBanana）を凌ぐ」との評価も。プロンプト互換性が高く、テキストレンダリングや複雑シーンが改善されたようです。

@sigmode21 はリリース直後に建築画像生成を試し、Noteで詳細比較を共有。従来プロンプトで街並み・建築物のクオリティ向上を確認。

他のユーザーも「今週の新モデル（Reve 2.0・Ideogram 4.0・Gemma 4）」として言及。

4. その他の有力候補（Flux、Midjourney、Leonardoなど）

Flux系: Grok Imagineとの統合で引き続き基盤として人気。LoRA学習やTransformer拡散モデルの議論あり。
Midjourney: リアル写真風の高品質で安定候補として名前上がり。
Leonardo AI など: 具体的な新機能言及は少なかったが、日常生成ツールとして併用。
全体傾向: 各モデルの「得意分野」比較（リアル写真→Midjourney/NanoBanana系、手軽ポップ→Seedream/Gemini、物語性→Flux/GPT Image）が共有され、完璧モデル不存在を前提とした使い分けが推奨されています。

GitHub・インターネット全体の動き

Stable Diffusion / ComfyUI関連リポジトリが活発（node-basedワークフロー強化）。オープンソース画像生成のエコシステムが継続進化。
プロンプト集やAPI統合リポジトリ（awesome-gpt-image-2など）の更新あり。
ニュースダイジェストではIdeogram 4.0などの新モデルがまとめられ、開発者向けAIニュースリポジトリも6月更新。

総括: 過去1週間はIdeogram 4.0の新リリースとChatGPT Images 2.0/Grok Imagineの実践活用が目立ち、ビデオ拡張の進化もトピック。ユーザーはプロンプト技法の共有を通じてモデル特性を深掘りしており、クロスプラットフォーム（Grok/ChatGPTなど）の併用が主流化しています。詳細は各X投稿のリンク先や公式リリースノートで確認を。