Skip to content
公開日

2025-12-26

AI関連本日のニュースまとめ (2025年12月26日)

本日のAI関連ニュースをX(Twitter)上の投稿を中心に集めました。指定されたアカウントの投稿を重視しつつ、関連する一般投稿も参考にしています。主なトピックはOpenAI/ChatGPT、Claude/Anthropic、Google系AI(Gemini/Jules/NotebookLM)、Microsoft系AI(Copilot/Github Copilot)、XのGrok、Perplexity、MetaのLlama、DeepSeek、その他の有力AIモデル/リサーチ、AIエディタ/CLI、Genspark/DIA/Manus/Skywork/Gamma関連です。同一アカウントからの引用を分散させるよう努めました。

OpenAI/ChatGPT関連

  • ChatGPTのPro版がビジネス現場での適応力が高いと評価されており、凸凹の道を進むような柔軟な処理が強み。Geminiと比較して、エージェントの中心として信頼性が高いとの意見。@super_bonochin
  • ChatGPTのThinking機能が正確性と思考力で優位。派手なアウトプットは弱いが、ファーストパーティーサービスとして圧倒的。@super_bonochin
  • OpenAIのResponses APIを活用した実装で、GPTにReasoningをさせつつPerplexityのAPIをツールとして呼ぶのが最強との指摘。@super_bonochin

Claude/Anthropic関連

  • Claude in Chromeを使って100枚の下書き作成や変換作業を実施した事例。効率化の好例。@akira_papa_IT
  • Claude 4.5の開発が進む中、AIプリンシプルコードのパブコメでデータセット透明化の議論。Anthropicの運用負担や市場競争への影響が懸念。@hokazuya
  • Claudeの出力能力と継続能力が別物であることがNano Banana Proの事例で明らか。SkillとObsessionの違いを指摘。@akira_papa_IT

Google系AI(Gemini/Jules/NotebookLM)関連

  • Geminiがエージェントの脳みそとしては不十分で、単発推論や画像処理に特化した工業部品として使えるとの評価。全体オーケストレーションには向かない。@super_bonochin
  • Geminiの理想化された局所状況での強み(ベンチマーククリア)とビジネス現場での弱み(ポンコツムーブ)の対比。GPTとの違いをサーキット vs. オフロードに例える。@super_bonochin
  • AItuber七味ちゃんの過去事例でGemini 1.5を使用。Gemini 3での再テストを検討中。@hayakawagomi

Microsoft系AI(Copilot/Github Copilot)関連

  • Microsoftの分析ツールとしてSupabase MCP Server、GA4 MCP Server、GSC MCP Serverを活用した事例。AIによるデータ分析の効率化。@Shin_Engineer

XのGrok関連

  • GrokのSRAM使用チップが256MBと低容量で、HBMを置き換えられない。インファレンスに1TB必要なモデルでは複数チップ必要。@vikramskr
  • GroqのLPUがNvidiaのGPUより優位との主張は笑える。市場シェア80%以上のNvidiaが認めるはずない。@vikramskr
  • Groqの特徴として実世界への影響を議論。@vikramskr

Perplexity関連

  • Perplexityの検索精度が高く、ハルシネーションが少ない。独自のAIネイティブ検索インデックスが強み。@super_bonochin
  • PerplexityがResearch特化ツールとして便利。Gensparkと比較して正確な情報取得に優位。@super_bonochin
  • Perplexityのバランスの良さが武器。ChatGPTの本家サービスがもっさりしてきた中で優位性再認識。@super_bonochin

MetaのLlama/AI関連

  • MetaのLlama関連の具体的な本日投稿は確認されず(古いものは除外)。

DeepSeek関連

  • DeepSeek関連の具体的な本日投稿は確認されず(古いものは除外)。

その他の有力AIモデル/リサーチ

  • Turing Testの欠陥がAIの進化で露呈。GPT-4.5がTuringの原案をパス。ARC-AGIも同様の運命か。@emollick
  • 非人間への知能/創造性/意識テストの不備。AIの進化に適応が追いつかない。@emollick
  • 商空間拡散モデルが対称性を考慮した生成モデルとして画期的。分子構造生成などで有効。@hillbig
  • RLがLLMの推論能力を本当に向上させるか?NeurIPS 2025 Best Paper Runner-upの論文議論。@burkov
  • 低品質コードライターはAIで消えるが、高度なコード(最適化/ドライバ開発)は残る。@burkov
  • ChapterPalのUXでユーザー制御のテキスト表示とQ&A。@burkov

AIエディタ/CLI関連

  • CursorのエコシステムでCloud AgentsとBugbotの活動度向上。レビューでテストケースを検出。@kinopee_ai
  • CursorのBugbotが他のツールでは見逃したテストケースを指摘。@kinopee_ai

Genspark/DIA/Manus/Skywork/Gamma関連

  • Gensparkが多機能ツールとして便利。Perplexityと比較して手足が多い。@super_bonochin
  • Skywork Websites 2.0のアップグレードでテンプレートからフルスタックサイト生成。ブランド一致の自動調整。@cosmopolitanea