Skip to content
公開日

2025-10-23

Executive Summary

重要なハイライト(3-5項目)

タイトル まとめた内容 参考URL
OpenAIがChatGPT Atlasブラウザをリリース OpenAIはAI統合型ブラウザChatGPT Atlasを発表。サイドバーで即時対話可能で、エージェントモードにより自動タスク実行を実現。macOS版が公開され、Windows・モバイル版も予定。AIブラウジングの革新として注目。 OpenAI公式
AnthropicがClaudeの新モデルを複数リリース AnthropicはClaude Haiku 4.5、Claude Opus 4.1、Claude Codeを発表。無料ユーザー向けのHaiku 4.5は小型で高速、Opus 4.1はエージェントタスクで向上。Claude Codeはウェブ/モバイルでコード生成を強化。 Anthropic公式
Googleが量子コンピューティングの画期的進展を発表 Google Quantum AIはWillowチップで量子エラー訂正の課題を解決。Quantum Echoesアルゴリズムで従来のスーパーコンピューターより13,000倍高速に検証可能。医学や材料科学への応用が期待される。 Google AIブログ
DeepSeekが長文処理向け新AIモデルをリリース 中国のDeepSeekがDeepSeek-OCRを発表。OCRモデルとして画像をテキストに変換し、200Kページのデータを1GPUで処理可能。長文コンテキストのボトルネックを解消する革新。 DeepSeek公式
Pokee AIがオープンソース研究エージェントモデルを公開 Pokee AIがPokeeResearch-7Bをリリース。7Bパラメータの深層研究エージェントで、ウェブ検索・証拠収集・自己検証が可能。他の7Bモデルを上回る性能で、Hugging Faceで公開。 Hugging Face

Model Releases

新モデル・アップデート

タイトル まとめた内容 参考URL
OpenAI Sora 2 生成AIモデル OpenAIがSora 2を発表。動画生成の新モデルで、映画制作やクリエイティブ分野に影響大。現実的な動画生成が可能で、AIのクリエイティブ応用を加速させる。 OpenAI公式
Anthropic Claude Haiku 4.5 Anthropicの小型モデルHaiku 4.5を無料ユーザー向けにリリース。大型モデルを上回る性能で、コスト効率が高く、日常タスクに適する。 Anthropic公式
Anthropic Claude Opus 4.1 Anthropicの最上位モデルOpus 4.1を更新。エージェントタスク、コーディング、推論で向上し、複雑な問題解決に強みを発揮。 Anthropic公式
Google Cell2Sentence-Scale 27B GoogleとYaleのAIモデルで、がん療法の新経路を発見。細胞データを分析し、医療分野でのAI活用を推進。 Google AI
DeepSeek-OCR マルチモーダルモデル DeepSeekの新OCRモデルで、大規模ドキュメントを効率処理。1GPUで200Kページのトレーニングデータを生成し、AIのスケーラビリティを向上。 DeepSeek公式
Workday Custom AI Model Library Workdayが120以上の事前構築AIモデルをリリース。契約レビューを効率化し、HR・ベンダー管理に活用。企業向けAIの実用化を促進。 Workday公式

Research Papers

新論文・研究発表

タイトル まとめた内容 参考URL
DeepAnalyze: Agentic LLM for Autonomous Data Science データサイエンスの全工程を自動化するDeepAnalyze-8Bを提案。カリキュラムベースのトレーニングで人間の学習を模倣し、既存エージェントを上回る性能。オープンソースで公開。 arXiv
OML 1.0: Open, Monetizable, Loyal Models SentientAGIの論文で、モデル所有権を証明するフィンガープリンティング技術を提案。24,576キーを埋め込み、SFTや蒸留に耐性。オープンAGIの基盤を強化。 arXiv
LiveCodeBench Pro: Competitive Programming Benchmark SentientAGIの論文で、プログラミング競技のベンチマークを提案。Dockerベースで小型モデルが大型モデルに匹敵し、データ効率を向上。 arXiv
MindGames Arena: Social Reasoning in Games SentientAGIの論文で、AIエージェントの社会的推論をテストするアリーナを提案。欺瞞・協力のゲームで進化し、プリンストン/Metaモデルに匹敵。 arXiv
SPIN-Bench: Multi-Agent Negotiation Benchmark SentientAGIの論文で、交渉ベンチマークを提案。PDDLやDiplomacyでテストし、オープンモデルが閉鎖モデルに勝る透明性を示す。 arXiv
Agentic Context Engineering (ACE) Stanfordの論文で、ファインチューニング不要の文脈進化技術を提案。モデルが自己改善し、10.6%性能向上。コスト86.9%低減。 arXiv
FineVision: Large-Scale Vision-Language Dataset 185サブセットの大規模データセットFineVisionをリリース。人間監修でデータ衛生を確保し、VLM性能を向上。 arXiv

Open Source

オープンソースプロジェクト

タイトル まとめた内容 参考URL
PokeeResearch-7B 深層研究エージェント Pokee AIの7Bモデルで、ウェブ検索・証拠収集・自己検証を実現。他の7Bモデルを上回り、Hugging Faceで公開。vLLM/SGL/VERLで構築。 GitHub
MassGen: Multi-Agent Scaling System GitHubで公開のマルチエージェントシステム。複雑タスクを協力的に解決し、AIのスケーラビリティを向上。 GitHub
ExecuTorch 1.0: PyTorch Edge AI QualcommのオープンソースエッジAIソリューション。Hexagon NPU対応でローカル推論を強化。 Qualcomm Developer Blog
Krea: 14B Realtime Text-to-Video Model Kreaが14BパラメータのリアルタイムT2Vモデルをオープンソース化。動画生成の効率を向上。 Krea公式

Industry News

業界ニュース・発表

タイトル まとめた内容 参考URL
AnthropicとGoogleのクラウド契約交渉 AnthropicがGoogleと数百億ドルのクラウド契約を議論。TPUチップ活用でAI開発を加速。 Bloomberg
AIスタートアップ資金調達ブーム UnifyAppsが$50M調達、Gensparkが$200M超を目指す。AIエージェント分野の投資活発化を示す。 Reuters
MythWorxが$5M調達 MythWorxが人間の脳に着想した低電力AIモデル開発で$5M調達。エネルギー効率の高いAIを目指す。 SiliconAngle
Uniphoreが$260M Series F調達 UniphoreがNVIDIAなどから$260M調達。エンタープライズAIプラットフォームを強化。 BuiltInSF

Tools Updates

ツール・プラットフォームアップデート

タイトル まとめた内容 参考URL
ChatGPT Atlas エージェントモード更新 OpenAIのブラウザでエージェントモードを強化。自動タスク実行とプライバシーコントロールを追加。 OpenAI公式
Anthropic Claude Code ウェブ/モバイル版 AnthropicがClaude Codeをブラウザ/アプリでリリース。コマンドライン不要でコード生成を容易に。 Anthropic公式
Bitget Wallet トランザクション更新 Bitget Walletがアドレスブック・セキュリティチェックを追加。Web3トランザクションを安全・迅速化。 Bitget Wallet公式
Microsoft Agent Framework MicrosoftがAIエージェント開発フレームワークをリリース。次世代エージェント構築を支援。 Microsoft公式