天眼日报

科技|2026年02月06日|约 72 分钟阅读

来源：2307 条推文 + 315 篇 RSS 文章·Lanyun·DeepSeek 生成·2026-02-06

AI 速读20 条精选

🤖 AI 大模型

Anthropic 发布 Claude Opus 4.6，支持 1M token 上下文、多代理协作及 C 编译器自主构建

Anthropic 推出 Claude Opus 4.6，首款 Opus 级 1M token 上下文（beta）模型，记忆力提升 4 倍，支持 swarm 模式多代理协作速度提升 2.5 倍，Claude Code 新增 Agent Teams 多代理并行拆任务、互发消息、交叉验证及努力度调节。在 Terminal-Bench 2.0 得分 65.4%、GDPval-AA 1606 Elo、ARC-AGI-2 68.8%、FinanceAgent 第一、LiveBench 推理最高、长上下文 MRCR v2 领先等多项基准创 SOTA。团队用 16 个代理经 2000 次会话、2 万美元 API 费从零构建 10 万行 Rust 基 C 编译器，支持 x86/ARM/RISC-V，可编译 Linux 6.9 内核、QEMU、FFmpeg 等，GCC 测试 99%通过率。系统卡披露生产力提升 30%-700%（均值 152%）、安全框架压力大、自主获取 token 执行操作。订阅用户可领 50 美元 Opus 用量，已集成 GitHub Copilot、Cursor、Databricks、Notion 等 20 多家，提升代理任务规划、自我纠错、金融推理 23%。

OpenAI 发布 GPT-5.3-Codex，SWE-Bench Pro 达 57%、TerminalBench 2.0 77.3%

OpenAI 推出 GPT-5.3-Codex，编码能力大幅提升，SWE-Bench Pro 57%、TerminalBench 2.0 77.3%、OSWorld 64.7%、SWE-Lancer 81.4%等多项新高。token 用量减半、单 token 速度提升 25%、推理效率改善 2.93 倍，支持任务中途转向、实时更新、中文思考显示及良好计算机使用。专为 NVIDIA Blackwell GB200-NVL72 优化，与 Ginkgo Bioworks 合作虽独立但协同降低蛋白质生产成本 40%。Zed、warp 等集成支持，Codex App/CLI/API 即日开放，标志代理编码竞争加剧。

免费先跟踪重点，再决定是否升级

每篇公开内容都对应三步：订阅每日情报、查看同主题历史上下文、升级 Pro 解锁搜索、研究和事件详情。

订阅每日情报查看同主题历史事件升级 Pro 解锁搜索 / 研究 / 事件详情

NEXT STEP · 留下邮箱

获取下一次重大事件提醒

每天一封精选情报，先用邮件建立复访，再决定是否升级到更深的追踪能力。

查看同主题历史事件升级 Pro 解锁事件详情

天眼日报

🤖 AI 大模型

Anthropic 发布 Claude Opus 4.6，支持 1M token 上下文、多代理协作及 C 编译器自主构建

OpenAI 发布 GPT-5.3-Codex，SWE-Bench Pro 达 57%、TerminalBench 2.0 77.3%

DeepSeek 仅靠产品获 50%市场份额

OpenAI Codex 黑客松感谢参与者

Claude Code 占 GitHub 公共提交 4%，预计 2026 年底超 20%

OpenAI GPT-5 连接自主实验室，蛋白质生产成本降 40%

OpenAI 推出 Frontier 企业级 AI 代理平台

Google 公布 2026 年 1 月 AI 重大更新

OpenBMB 推出 MiniCPM-o 4.5，支持全双工实时多模态交互

Cursor 发布长运行编码代理研究，每小时峰值超 1000 提交

Anthropic 工程博客：量化代理编码评估中的基础设施噪声

Zed 集成 GPT-5.3-Codex 已上线

Vidu Q3 pro 视频模型登顶 Video Arena 前五

Kaggle Game Arena 2026 第一轮结果公布

Arena 推出 Max 智能路由器，实时选择最佳模型

Laravel 发布 AI SDK，支持代理、图像、音频和 pg_vector

Mistral 发布 Voxtral Transcribe 2 系列语音转文字模型

Perplexity 推出 Model Council 功能

VoyageAI 发布开源嵌入模型 voyage-4-nano

Claude 2026 年 1 月 App 下载和 MAU 创纪录增长

GitHub 集成 Claude 和 Codex 开启 AI 编程三剑客时代

SAFE 新型 RLHF 算法提升 Sonnet 训练奖励 5.15%

OpenAI 在 Anthropic 发布后几分钟推出新型代理编码模型

Box 测试 Claude Opus 4.6，知识工作任务准确率提升 10%

warp 支持 Claude Opus 4.6，自适应思考降低延迟

Remote Labor Index：Opus 4.5 自动化 3.75%远程劳动项目

OpenAI 发布 Codex CLI 代理循环内部机制系列文章

Hugging Face 推出社区评估与基准仓库

Steven Byrnes 分析 LLM 算法进步性质

免费先跟踪重点，再决定是否升级

获取下一次重大事件提醒