Google DeepMindが実験的オープンソースモデル「DiffusionGemma」(26Bパラメータ、MoE)を公開。従来のトークン逐次生成ではなく、画像拡散モデル風にテキストブロック(最大256トークン)を並列生成し、専用GPUで最大4倍高速化。ローカル推論向けでApache 2.0ライセンス、Hugging Faceで入手可能。速度重視のインタラクティブ用途に適するが、一部ベンチマーク品質でトレードオフあり。
テキスト拡散モデルとして革新的アーキテクチャを採用。並列生成により高速(RTX GPUで700+ tokens/sec)。マルチモーダル対応(画像・ビデオ・140言語以上)でオープンウェイト公開。開発者向けガイドも同時リリースされ、vLLM/Hugging Face Transformersなどで即時利用可能。NVIDIAも最適化支援。