2026-06-07
過去1週間(2026年5月31日〜6月7日頃)のAI画像生成サービス動向まとめ(Google NanoBanana系・Adobe Firefly除く)
この期間、主な動きはGrok Imagineのビデオ関連拡張、ChatGPT Images 2.0の積極活用、Ideogram 4.0のリリースを中心に、Flux系やMidjourneyなどの既存モデルとの比較・プロンプト共有が活発でした。GitHubではStable Diffusion/ComfyUI関連の継続的な更新が見られますが、大規模新リリースの言及は少なかったです。
1. Grok Imagine(xAI)
Grokの画像生成機能(FLUX.1基盤中心)は引き続き注目を集め、Grok Imagine Video 1.5 Preview(5月30日頃リリース、過去1週に話題)が画像-to-ビデオやテキスト-to-ビデオで高評価。ネイティブオーディオ(音楽・効果音・リップシンク)、ビデオ拡張、720P対応などが強みで、画像生成のクオリティ向上(Quality Mode API含む)も継続的に言及されています。
X上では日常的に「Grok Imagine」で生成した画像共有が多く、Android/iOSの機能展開差異についてのユーザー議論も見られますが、画像生成自体は安定して利用可能。
2. ChatGPT Images / GPT Image 2.0(OpenAI)
ChatGPT Images 2.0が非常に活発に使われており、プロンプト共有や具体的な画像生成事例(和風写真、ファッション、レイアウトモックアップなど)が多数投稿されています。アップロード写真を基にしたスタイル転写や、詳細なシーン指定(例: 黒道千金和風写真9パターン)で高品質出力が得やすい点が評価され、サムネイル作成やアイデアラフに特に有効という声が多いです。
例: @zhongying14 は、GPT Image 2の詳細プロンプト(人物特徴固定、和室設定、光線・服装指定など)を共有し、視覚反差(外国人漢服など)の生成例を示しています。プロンプトの構造化(固定総控+個別シーン)が実用的。
@AiWithTariq はGemini/Grok/GPT Image 2.0での写真アップロード活用法をスレッドで解説。
3. Ideogram 4.0(Ideogram)
6月3日リリースの最新モデルが大きなトピック。建築・街並み生成で特に強みを発揮し、「NBP(NanoBanana)を凌ぐ」との評価も。プロンプト互換性が高く、テキストレンダリングや複雑シーンが改善されたようです。
@sigmode21 はリリース直後に建築画像生成を試し、Noteで詳細比較を共有。従来プロンプトで街並み・建築物のクオリティ向上を確認。
他のユーザーも「今週の新モデル(Reve 2.0・Ideogram 4.0・Gemma 4)」として言及。
4. その他の有力候補(Flux、Midjourney、Leonardoなど)
- Flux系: Grok Imagineとの統合で引き続き基盤として人気。LoRA学習やTransformer拡散モデルの議論あり。
- Midjourney: リアル写真風の高品質で安定候補として名前上がり。
- Leonardo AI など: 具体的な新機能言及は少なかったが、日常生成ツールとして併用。
- 全体傾向: 各モデルの「得意分野」比較(リアル写真→Midjourney/NanoBanana系、手軽ポップ→Seedream/Gemini、物語性→Flux/GPT Image)が共有され、完璧モデル不存在を前提とした使い分けが推奨されています。
GitHub・インターネット全体の動き
- Stable Diffusion / ComfyUI関連リポジトリが活発(node-basedワークフロー強化)。オープンソース画像生成のエコシステムが継続進化。
- プロンプト集やAPI統合リポジトリ(awesome-gpt-image-2など)の更新あり。
- ニュースダイジェストではIdeogram 4.0などの新モデルがまとめられ、開発者向けAIニュースリポジトリも6月更新。
総括: 過去1週間はIdeogram 4.0の新リリースとChatGPT Images 2.0/Grok Imagineの実践活用が目立ち、ビデオ拡張の進化もトピック。ユーザーはプロンプト技法の共有を通じてモデル特性を深掘りしており、クロスプラットフォーム(Grok/ChatGPTなど)の併用が主流化しています。詳細は各X投稿のリンク先や公式リリースノートで確認を。