公開日 2026-02-14

2026-02-14

本日のAI関連ニュース（2026年2月14日時点で、過去2日以内の最新情報）を、X（旧Twitter）上の関連アカウントの発言やウェブ上の情報を基にまとめます。主に指定された有力アカウントの投稿や信頼できるソースから、OpenAI/ChatGPT、Anthropic/Claude、Google/Gemini、xAI/Grok、DeepSeek、その他の有力モデルやツールに焦点を当てています。

LLM/モデル性能比較の最新動向

Artificial AnalysisのLLMリーダーボードが更新され、さまざまなモデルがランキング。Claude Opus 4.6 (Anthropic)が高スコアを維持しつつ、OpenAIのGPT-5.2変種、GoogleのGemini 3 Pro Preview、Grok 4、DeepSeek系モデルなどが競争中。中国系モデル（例: Kimi K2.5やMiMo-V2-Flash）が低価格で高性能を示している点が注目されています。
オープンソースLLMの更新として、DeepSeekや他のモデルがプロプライエタリモデルに匹敵する進化を続けているとの報告あり。

Grokの勢い

xAIのGrokがウェブトラフィックでDeepSeekを上回り、世界第3位のAIチャットボットに浮上（ChatGPT、Geminiに次ぐ）。1月のデータでGrokの訪問数が急増し、Elon Musk関連の影響が強い。
Grok-3（または後継）のブラインドテストでChatGPT、Gemini、DeepSeekを上回る結果が出ており、コーディング・数学・指示追従で優位。@karpathy が早期評価で高く称賛した投稿が話題に。

OpenAI/ChatGPT関連

ChatGPTのdeep research機能がGPT-5.2ベースに強化され、より正確なレポート生成が可能に。特定サイトやアプリ連携も指定でき、有料ユーザーから順次展開中。
OpenAIがFree/Goプランで広告テストを開始（US限定）。Plus/Pro/Enterpriseは広告なしで、回答への影響なしと強調。競争激化の中での収益化策として注目。

Anthropic/Claude関連

AnthropicがClaude Healthを発表（ChatGPT Healthに続く医療特化機能）。個人医療記録・保険情報を統合し、Claudeがオーケストレーターとしてナビゲート。US一部ユーザー限定で、医療分野への本格進出を示唆。
Claude Opus 4.6のリリースが最近で、1Mトークンコンテキストやエージェントチーム機能が企業ベンチマークで優位。コーディング戦争の文脈でOpenAIのCodexと競合。

Google/Gemini関連

Gemini 3 "Deep Think"がARC-AGI-2ベンチマークで84.6%を達成し、推論能力でトップクラスに返り咲き。Googleのアップデートが目立つ。

その他の注目

中国MiniMaxのM2.5 / M2.5 Lightningがオープンソースでリリース。Claude Opus 4.6に近い性能を1/20のコストで実現し、業界に衝撃。
z.aiのGLM-5がハルシネーション率を記録的に低減（新しいRL 'slime'手法使用）。オープンソースで知識信頼性で業界トップに。

これらは主にウェブ検索と関連ソースから抽出した本日・直近のトピックで、指定アカウント（例: @sama, @karpathy, @OpenAIDevs, @GoogleAIStudio, @Anthropic関連など）の発言傾向とも一致するものが複数見られます。2日以上前のものは除外しています。AI分野の競争が激しく、特にコーディング・医療・低コスト高性能モデルがホットです。