公開日
2026-03-25
2026年3月25日 AI・技術開発 過去24時間まとめ
(本日から過去24時間以内=2026年3月24日〜3月25日早朝の情報のみ抽出。高インパクト・優先度順)
Executive Summary(重要なハイライト)
| タイトル |
まとめた内容 |
参考URL |
| Anthropic Claude「Computer Use」&「Auto Mode」発表 |
Claude Code/CoworkにPC操作機能(マウス・キーボード・ブラウザ・アプリ自動制御)を研究プレビューで追加。Dispatch(スマホ指示)と組み合わせ、離席中でもタスク自動実行可能。Auto Modeで権限をAIが安全に自動判断し、実用性が大幅向上。 |
公式ブログ |
| Cursor Composer 2 技術レポート公開 |
大型MoEモデル(Kimi K2.5ベース)を継続事前学習+大規模RLでコード特化。実務寄り新ベンチ「CursorBench」で61.3%を達成し、SWE-bench Multi 73.7%などフロンティア級性能を低コストで実現。ドメイン特化RLの有効性を証明。 |
Cursor公式発表 |
| Ai2 オープンソース視覚AIエージェントリリース |
Allen Institute for AIが視覚ベースのAIエージェントを完全オープンソース公開。ウェブブラウザを視覚的に制御可能で、汎用エージェント開発を加速。 |
SiliconANGLE |
| AI安全性「Neuron Freezing」ブレークスルー |
北カロライナ州立大学が、LLMの安全クリティカル「ニューロン」を凍結する手法を開発。ファインチューニング時も安全性を保持し、ジャイルブレイクを防ぐ根本的解決策。 |
Yahoo Finance |
| arXiv新論文(エージェント・安全・推論分野) |
過去24時間以内に複数高インパクト論文が公開。エージェント間メモリ共有、安全アライメント、制約下推論、ディープフェイク防御など実用性が高い研究が集中。 |
arXiv cs.AI recent |
model_releases(新モデル発表)
該当なし(過去24時間以内に新規基盤モデル/大型LLMリリースは確認されず)
research_papers(新論文・研究発表)
| タイトル |
まとめた内容 |
参考URL |
| Improving Safety Alignment via Balanced Direct Preference Optimization |
LLMの安全アライメントを強化するBalanced DPOを提案。嗜好データの不均衡を解消し、敵対的プロンプトに対する頑健性を向上させつつ有用性を維持。 |
arXiv:2603.22829 |
| Can Large Language Models Reason and Optimize Under Constraints? |
LLMが制約条件下での推論・最適化能力を検証。数学・論理制約処理における新興能力を実証。 |
arXiv:2603.23004 |
| MemCollab: Cross-Agent Memory Collaboration via Contrastive Trajectory Distillation |
複数エージェント間で記憶軌跡をコントラスト学習により蒸留・共有する手法。分散型AIシステムでの協調推論を効率化。 |
arXiv:2603.23234 |
| SAiW: Source-Attributable Invisible Watermarking for Proactive Deepfake Defense |
生成時に不可視ウォーターマークを埋め込み、ソース属性を特定。ディープフェイクの事前防御に有効。 |
arXiv:2603.23178 |
| Cursor Composer 2 Technical Report |
(上記Executive参照)実務特化RLパイプラインの詳細公開。非同期RL・Self-Summarization・低精度学習などインフラ技術も革新的。 |
Cursor公式発表 |
open_source(オープンソースプロジェクト)
| タイトル |
まとめた内容 |
参考URL |
| Ai2 Visual AI Agent |
視覚ベースのAIエージェントを完全オープンソースで公開。ブラウザを視覚的に操作可能で、画面ベースの汎用エージェント開発を誰でも再現可能に。 |
SiliconANGLE |
industry_news(業界ニュース・発表)
| タイトル |
まとめた内容 |
参考URL |
| Anthropic Economic Index March 2026 |
Claude利用トレンド分析を公開。長期ユーザーは高価値タスクを好み、慎重にイテレーション。消費者利用の集中度が低下傾向。 |
Anthropic Research |
| タイトル |
まとめた内容 |
参考URL |
| Claude Computer Use + Auto Mode |
(上記Executive参照)macOS限定研究プレビュー。PC完全操作+自動権限判断で「不在中エージェント」が現実化。 |
公式ブログ |
補足
- 本レポートは公式発表・一次情報源(arXiv、企業ブログ、公式X投稿)を優先。
- 過去24時間以内の高インパクト情報に厳密に限定(2日以上前のものは除外)。
- 新規基盤モデル発表はなく、エージェント機能強化・安全性研究・オープンソースツールが主な動き。
次回更新は明日同時刻頃に同様フォーマットでお届けします。