Skip to content
公開日

2026-03-25

2026年3月25日 AI・技術開発 過去24時間まとめ
(本日から過去24時間以内=2026年3月24日〜3月25日早朝の情報のみ抽出。高インパクト・優先度順)

Executive Summary(重要なハイライト)

タイトル まとめた内容 参考URL
Anthropic Claude「Computer Use」&「Auto Mode」発表 Claude Code/CoworkにPC操作機能(マウス・キーボード・ブラウザ・アプリ自動制御)を研究プレビューで追加。Dispatch(スマホ指示)と組み合わせ、離席中でもタスク自動実行可能。Auto Modeで権限をAIが安全に自動判断し、実用性が大幅向上。 公式ブログ
Cursor Composer 2 技術レポート公開 大型MoEモデル(Kimi K2.5ベース)を継続事前学習+大規模RLでコード特化。実務寄り新ベンチ「CursorBench」で61.3%を達成し、SWE-bench Multi 73.7%などフロンティア級性能を低コストで実現。ドメイン特化RLの有効性を証明。 Cursor公式発表
Ai2 オープンソース視覚AIエージェントリリース Allen Institute for AIが視覚ベースのAIエージェントを完全オープンソース公開。ウェブブラウザを視覚的に制御可能で、汎用エージェント開発を加速。 SiliconANGLE
AI安全性「Neuron Freezing」ブレークスルー 北カロライナ州立大学が、LLMの安全クリティカル「ニューロン」を凍結する手法を開発。ファインチューニング時も安全性を保持し、ジャイルブレイクを防ぐ根本的解決策。 Yahoo Finance
arXiv新論文(エージェント・安全・推論分野) 過去24時間以内に複数高インパクト論文が公開。エージェント間メモリ共有、安全アライメント、制約下推論、ディープフェイク防御など実用性が高い研究が集中。 arXiv cs.AI recent

model_releases(新モデル発表)

該当なし(過去24時間以内に新規基盤モデル/大型LLMリリースは確認されず)

research_papers(新論文・研究発表)

タイトル まとめた内容 参考URL
Improving Safety Alignment via Balanced Direct Preference Optimization LLMの安全アライメントを強化するBalanced DPOを提案。嗜好データの不均衡を解消し、敵対的プロンプトに対する頑健性を向上させつつ有用性を維持。 arXiv:2603.22829
Can Large Language Models Reason and Optimize Under Constraints? LLMが制約条件下での推論・最適化能力を検証。数学・論理制約処理における新興能力を実証。 arXiv:2603.23004
MemCollab: Cross-Agent Memory Collaboration via Contrastive Trajectory Distillation 複数エージェント間で記憶軌跡をコントラスト学習により蒸留・共有する手法。分散型AIシステムでの協調推論を効率化。 arXiv:2603.23234
SAiW: Source-Attributable Invisible Watermarking for Proactive Deepfake Defense 生成時に不可視ウォーターマークを埋め込み、ソース属性を特定。ディープフェイクの事前防御に有効。 arXiv:2603.23178
Cursor Composer 2 Technical Report (上記Executive参照)実務特化RLパイプラインの詳細公開。非同期RL・Self-Summarization・低精度学習などインフラ技術も革新的。 Cursor公式発表

open_source(オープンソースプロジェクト)

タイトル まとめた内容 参考URL
Ai2 Visual AI Agent 視覚ベースのAIエージェントを完全オープンソースで公開。ブラウザを視覚的に操作可能で、画面ベースの汎用エージェント開発を誰でも再現可能に。 SiliconANGLE

industry_news(業界ニュース・発表)

タイトル まとめた内容 参考URL
Anthropic Economic Index March 2026 Claude利用トレンド分析を公開。長期ユーザーは高価値タスクを好み、慎重にイテレーション。消費者利用の集中度が低下傾向。 Anthropic Research

tools_updates(ツール・プラットフォームアップデート)

タイトル まとめた内容 参考URL
Claude Computer Use + Auto Mode (上記Executive参照)macOS限定研究プレビュー。PC完全操作+自動権限判断で「不在中エージェント」が現実化。 公式ブログ

補足
- 本レポートは公式発表・一次情報源(arXiv、企業ブログ、公式X投稿)を優先。
- 過去24時間以内の高インパクト情報に厳密に限定(2日以上前のものは除外)。
- 新規基盤モデル発表はなく、エージェント機能強化・安全性研究・オープンソースツールが主な動き。

次回更新は明日同時刻頃に同様フォーマットでお届けします。