公開日 2025-12-26

2025-12-26

AI関連本日のニュースまとめ (2025年12月26日)

本日のAI関連ニュースをX(Twitter)上の投稿を中心に集めました。指定されたアカウントの投稿を重視しつつ、関連する一般投稿も参考にしています。主なトピックはOpenAI/ChatGPT、Claude/Anthropic、Google系AI（Gemini/Jules/NotebookLM）、Microsoft系AI（Copilot/Github Copilot）、XのGrok、Perplexity、MetaのLlama、DeepSeek、その他の有力AIモデル/リサーチ、AIエディタ/CLI、Genspark/DIA/Manus/Skywork/Gamma関連です。同一アカウントからの引用を分散させるよう努めました。

OpenAI/ChatGPT関連

ChatGPTのPro版がビジネス現場での適応力が高いと評価されており、凸凹の道を進むような柔軟な処理が強み。Geminiと比較して、エージェントの中心として信頼性が高いとの意見。@super_bonochin
ChatGPTのThinking機能が正確性と思考力で優位。派手なアウトプットは弱いが、ファーストパーティーサービスとして圧倒的。@super_bonochin
OpenAIのResponses APIを活用した実装で、GPTにReasoningをさせつつPerplexityのAPIをツールとして呼ぶのが最強との指摘。@super_bonochin

Claude/Anthropic関連

Claude in Chromeを使って100枚の下書き作成や変換作業を実施した事例。効率化の好例。@akira_papa_IT
Claude 4.5の開発が進む中、AIプリンシプルコードのパブコメでデータセット透明化の議論。Anthropicの運用負担や市場競争への影響が懸念。@hokazuya
Claudeの出力能力と継続能力が別物であることがNano Banana Proの事例で明らか。SkillとObsessionの違いを指摘。@akira_papa_IT

Google系AI（Gemini/Jules/NotebookLM）関連

Geminiがエージェントの脳みそとしては不十分で、単発推論や画像処理に特化した工業部品として使えるとの評価。全体オーケストレーションには向かない。@super_bonochin
Geminiの理想化された局所状況での強み（ベンチマーククリア）とビジネス現場での弱み（ポンコツムーブ）の対比。GPTとの違いをサーキット vs. オフロードに例える。@super_bonochin
AItuber七味ちゃんの過去事例でGemini 1.5を使用。Gemini 3での再テストを検討中。@hayakawagomi

Microsoft系AI（Copilot/Github Copilot）関連

Microsoftの分析ツールとしてSupabase MCP Server、GA4 MCP Server、GSC MCP Serverを活用した事例。AIによるデータ分析の効率化。@Shin_Engineer

XのGrok関連

GrokのSRAM使用チップが256MBと低容量で、HBMを置き換えられない。インファレンスに1TB必要なモデルでは複数チップ必要。@vikramskr
GroqのLPUがNvidiaのGPUより優位との主張は笑える。市場シェア80%以上のNvidiaが認めるはずない。@vikramskr
Groqの特徴として実世界への影響を議論。@vikramskr

Perplexity関連

Perplexityの検索精度が高く、ハルシネーションが少ない。独自のAIネイティブ検索インデックスが強み。@super_bonochin
PerplexityがResearch特化ツールとして便利。Gensparkと比較して正確な情報取得に優位。@super_bonochin
Perplexityのバランスの良さが武器。ChatGPTの本家サービスがもっさりしてきた中で優位性再認識。@super_bonochin

MetaのLlama/AI関連

MetaのLlama関連の具体的な本日投稿は確認されず（古いものは除外）。

DeepSeek関連

DeepSeek関連の具体的な本日投稿は確認されず（古いものは除外）。

その他の有力AIモデル/リサーチ

Turing Testの欠陥がAIの進化で露呈。GPT-4.5がTuringの原案をパス。ARC-AGIも同様の運命か。@emollick
非人間への知能/創造性/意識テストの不備。AIの進化に適応が追いつかない。@emollick
商空間拡散モデルが対称性を考慮した生成モデルとして画期的。分子構造生成などで有効。@hillbig
RLがLLMの推論能力を本当に向上させるか？NeurIPS 2025 Best Paper Runner-upの論文議論。@burkov
低品質コードライターはAIで消えるが、高度なコード（最適化/ドライバ開発）は残る。@burkov
ChapterPalのUXでユーザー制御のテキスト表示とQ&A。@burkov

AIエディタ/CLI関連

CursorのエコシステムでCloud AgentsとBugbotの活動度向上。レビューでテストケースを検出。@kinopee_ai
CursorのBugbotが他のツールでは見逃したテストケースを指摘。@kinopee_ai

Genspark/DIA/Manus/Skywork/Gamma関連

Gensparkが多機能ツールとして便利。Perplexityと比較して手足が多い。@super_bonochin
Skywork Websites 2.0のアップグレードでテンプレートからフルスタックサイト生成。ブランド一致の自動調整。@cosmopolitanea