公開日 2026-03-25

2026-03-25

2026年3月25日 AI・技術開発過去24時間まとめ
（本日から過去24時間以内＝2026年3月24日〜3月25日早朝の情報のみ抽出。高インパクト・優先度順）

Executive Summary（重要なハイライト）

タイトル	まとめた内容	参考URL
Anthropic Claude「Computer Use」&「Auto Mode」発表	Claude Code/CoworkにPC操作機能（マウス・キーボード・ブラウザ・アプリ自動制御）を研究プレビューで追加。Dispatch（スマホ指示）と組み合わせ、離席中でもタスク自動実行可能。Auto Modeで権限をAIが安全に自動判断し、実用性が大幅向上。	公式ブログ
Cursor Composer 2 技術レポート公開	大型MoEモデル（Kimi K2.5ベース）を継続事前学習＋大規模RLでコード特化。実務寄り新ベンチ「CursorBench」で61.3%を達成し、SWE-bench Multi 73.7%などフロンティア級性能を低コストで実現。ドメイン特化RLの有効性を証明。	Cursor公式発表
Ai2 オープンソース視覚AIエージェントリリース	Allen Institute for AIが視覚ベースのAIエージェントを完全オープンソース公開。ウェブブラウザを視覚的に制御可能で、汎用エージェント開発を加速。	SiliconANGLE
AI安全性「Neuron Freezing」ブレークスルー	北カロライナ州立大学が、LLMの安全クリティカル「ニューロン」を凍結する手法を開発。ファインチューニング時も安全性を保持し、ジャイルブレイクを防ぐ根本的解決策。	Yahoo Finance
arXiv新論文（エージェント・安全・推論分野）	過去24時間以内に複数高インパクト論文が公開。エージェント間メモリ共有、安全アライメント、制約下推論、ディープフェイク防御など実用性が高い研究が集中。	arXiv cs.AI recent

model_releases（新モデル発表）

該当なし（過去24時間以内に新規基盤モデル／大型LLMリリースは確認されず）

research_papers（新論文・研究発表）

タイトル	まとめた内容	参考URL
Improving Safety Alignment via Balanced Direct Preference Optimization	LLMの安全アライメントを強化するBalanced DPOを提案。嗜好データの不均衡を解消し、敵対的プロンプトに対する頑健性を向上させつつ有用性を維持。	arXiv:2603.22829
Can Large Language Models Reason and Optimize Under Constraints?	LLMが制約条件下での推論・最適化能力を検証。数学・論理制約処理における新興能力を実証。	arXiv:2603.23004
MemCollab: Cross-Agent Memory Collaboration via Contrastive Trajectory Distillation	複数エージェント間で記憶軌跡をコントラスト学習により蒸留・共有する手法。分散型AIシステムでの協調推論を効率化。	arXiv:2603.23234
SAiW: Source-Attributable Invisible Watermarking for Proactive Deepfake Defense	生成時に不可視ウォーターマークを埋め込み、ソース属性を特定。ディープフェイクの事前防御に有効。	arXiv:2603.23178
Cursor Composer 2 Technical Report	（上記Executive参照）実務特化RLパイプラインの詳細公開。非同期RL・Self-Summarization・低精度学習などインフラ技術も革新的。	Cursor公式発表

open_source（オープンソースプロジェクト）

タイトル	まとめた内容	参考URL
Ai2 Visual AI Agent	視覚ベースのAIエージェントを完全オープンソースで公開。ブラウザを視覚的に操作可能で、画面ベースの汎用エージェント開発を誰でも再現可能に。	SiliconANGLE

industry_news（業界ニュース・発表）

タイトル	まとめた内容	参考URL
Anthropic Economic Index March 2026	Claude利用トレンド分析を公開。長期ユーザーは高価値タスクを好み、慎重にイテレーション。消費者利用の集中度が低下傾向。	Anthropic Research

tools_updates（ツール・プラットフォームアップデート）

タイトル	まとめた内容	参考URL
Claude Computer Use + Auto Mode	（上記Executive参照）macOS限定研究プレビュー。PC完全操作＋自動権限判断で「不在中エージェント」が現実化。	公式ブログ

補足
- 本レポートは公式発表・一次情報源（arXiv、企業ブログ、公式X投稿）を優先。
- 過去24時間以内の高インパクト情報に厳密に限定（2日以上前のものは除外）。
- 新規基盤モデル発表はなく、エージェント機能強化・安全性研究・オープンソースツールが主な動き。

次回更新は明日同時刻頃に同様フォーマットでお届けします。