公開日 2025-10-23

2025-10-23

Executive Summary

重要なハイライト（3-5項目）

タイトル	まとめた内容	参考URL
OpenAIがChatGPT Atlasブラウザをリリース	OpenAIはAI統合型ブラウザChatGPT Atlasを発表。サイドバーで即時対話可能で、エージェントモードにより自動タスク実行を実現。macOS版が公開され、Windows・モバイル版も予定。AIブラウジングの革新として注目。	OpenAI公式
AnthropicがClaudeの新モデルを複数リリース	AnthropicはClaude Haiku 4.5、Claude Opus 4.1、Claude Codeを発表。無料ユーザー向けのHaiku 4.5は小型で高速、Opus 4.1はエージェントタスクで向上。Claude Codeはウェブ/モバイルでコード生成を強化。	Anthropic公式
Googleが量子コンピューティングの画期的進展を発表	Google Quantum AIはWillowチップで量子エラー訂正の課題を解決。Quantum Echoesアルゴリズムで従来のスーパーコンピューターより13,000倍高速に検証可能。医学や材料科学への応用が期待される。	Google AIブログ
DeepSeekが長文処理向け新AIモデルをリリース	中国のDeepSeekがDeepSeek-OCRを発表。OCRモデルとして画像をテキストに変換し、200Kページのデータを1GPUで処理可能。長文コンテキストのボトルネックを解消する革新。	DeepSeek公式
Pokee AIがオープンソース研究エージェントモデルを公開	Pokee AIがPokeeResearch-7Bをリリース。7Bパラメータの深層研究エージェントで、ウェブ検索・証拠収集・自己検証が可能。他の7Bモデルを上回る性能で、Hugging Faceで公開。	Hugging Face

Model Releases

新モデル・アップデート

タイトル	まとめた内容	参考URL
OpenAI Sora 2 生成AIモデル	OpenAIがSora 2を発表。動画生成の新モデルで、映画制作やクリエイティブ分野に影響大。現実的な動画生成が可能で、AIのクリエイティブ応用を加速させる。	OpenAI公式
Anthropic Claude Haiku 4.5	Anthropicの小型モデルHaiku 4.5を無料ユーザー向けにリリース。大型モデルを上回る性能で、コスト効率が高く、日常タスクに適する。	Anthropic公式
Anthropic Claude Opus 4.1	Anthropicの最上位モデルOpus 4.1を更新。エージェントタスク、コーディング、推論で向上し、複雑な問題解決に強みを発揮。	Anthropic公式
Google Cell2Sentence-Scale 27B	GoogleとYaleのAIモデルで、がん療法の新経路を発見。細胞データを分析し、医療分野でのAI活用を推進。	Google AI
DeepSeek-OCR マルチモーダルモデル	DeepSeekの新OCRモデルで、大規模ドキュメントを効率処理。1GPUで200Kページのトレーニングデータを生成し、AIのスケーラビリティを向上。	DeepSeek公式
Workday Custom AI Model Library	Workdayが120以上の事前構築AIモデルをリリース。契約レビューを効率化し、HR・ベンダー管理に活用。企業向けAIの実用化を促進。	Workday公式

Research Papers

新論文・研究発表

タイトル	まとめた内容	参考URL
DeepAnalyze: Agentic LLM for Autonomous Data Science	データサイエンスの全工程を自動化するDeepAnalyze-8Bを提案。カリキュラムベースのトレーニングで人間の学習を模倣し、既存エージェントを上回る性能。オープンソースで公開。	arXiv
OML 1.0: Open, Monetizable, Loyal Models	SentientAGIの論文で、モデル所有権を証明するフィンガープリンティング技術を提案。24,576キーを埋め込み、SFTや蒸留に耐性。オープンAGIの基盤を強化。	arXiv
LiveCodeBench Pro: Competitive Programming Benchmark	SentientAGIの論文で、プログラミング競技のベンチマークを提案。Dockerベースで小型モデルが大型モデルに匹敵し、データ効率を向上。	arXiv
MindGames Arena: Social Reasoning in Games	SentientAGIの論文で、AIエージェントの社会的推論をテストするアリーナを提案。欺瞞・協力のゲームで進化し、プリンストン/Metaモデルに匹敵。	arXiv
SPIN-Bench: Multi-Agent Negotiation Benchmark	SentientAGIの論文で、交渉ベンチマークを提案。PDDLやDiplomacyでテストし、オープンモデルが閉鎖モデルに勝る透明性を示す。	arXiv
Agentic Context Engineering (ACE)	Stanfordの論文で、ファインチューニング不要の文脈進化技術を提案。モデルが自己改善し、10.6%性能向上。コスト86.9%低減。	arXiv
FineVision: Large-Scale Vision-Language Dataset	185サブセットの大規模データセットFineVisionをリリース。人間監修でデータ衛生を確保し、VLM性能を向上。	arXiv

Open Source

オープンソースプロジェクト

タイトル	まとめた内容	参考URL
PokeeResearch-7B 深層研究エージェント	Pokee AIの7Bモデルで、ウェブ検索・証拠収集・自己検証を実現。他の7Bモデルを上回り、Hugging Faceで公開。vLLM/SGL/VERLで構築。	GitHub
MassGen: Multi-Agent Scaling System	GitHubで公開のマルチエージェントシステム。複雑タスクを協力的に解決し、AIのスケーラビリティを向上。	GitHub
ExecuTorch 1.0: PyTorch Edge AI	QualcommのオープンソースエッジAIソリューション。Hexagon NPU対応でローカル推論を強化。	Qualcomm Developer Blog
Krea: 14B Realtime Text-to-Video Model	Kreaが14BパラメータのリアルタイムT2Vモデルをオープンソース化。動画生成の効率を向上。	Krea公式

Industry News

業界ニュース・発表

タイトル	まとめた内容	参考URL
AnthropicとGoogleのクラウド契約交渉	AnthropicがGoogleと数百億ドルのクラウド契約を議論。TPUチップ活用でAI開発を加速。	Bloomberg
AIスタートアップ資金調達ブーム	UnifyAppsが$50M調達、Gensparkが$200M超を目指す。AIエージェント分野の投資活発化を示す。	Reuters
MythWorxが$5M調達	MythWorxが人間の脳に着想した低電力AIモデル開発で$5M調達。エネルギー効率の高いAIを目指す。	SiliconAngle
Uniphoreが$260M Series F調達	UniphoreがNVIDIAなどから$260M調達。エンタープライズAIプラットフォームを強化。	BuiltInSF

Tools Updates

ツール・プラットフォームアップデート

タイトル	まとめた内容	参考URL
ChatGPT Atlas エージェントモード更新	OpenAIのブラウザでエージェントモードを強化。自動タスク実行とプライバシーコントロールを追加。	OpenAI公式
Anthropic Claude Code ウェブ/モバイル版	AnthropicがClaude Codeをブラウザ/アプリでリリース。コマンドライン不要でコード生成を容易に。	Anthropic公式
Bitget Wallet トランザクション更新	Bitget Walletがアドレスブック・セキュリティチェックを追加。Web3トランザクションを安全・迅速化。	Bitget Wallet公式
Microsoft Agent Framework	MicrosoftがAIエージェント開発フレームワークをリリース。次世代エージェント構築を支援。	Microsoft公式