02月06日 · 科技日报

天眼日报

科技|2026年02月06日|36 分钟阅读
来源:1563 条推文 + 336 篇 RSS 文章·Lanyun·DeepSeek 生成·2026-02-06
分享
科技 日报封面
AI 速读21 条精选

🤖 AI 大模型

Anthropic 发布 Claude Opus 4.6,支持 1M token 上下文、多代理协作和 Agent Teams

Anthropic 发布 Claude Opus 4.6,首个 Opus 级支持 1M token 上下文窗口,对话接近上限时自动摘要压缩旧内容,支持多代理协作与深度思考、新增 Agent Teams 模式允许添加角色、消息通信、会议讨论,并行/串行任务,自纠错及更好代理编码调试。需环境变量 CLAUDE_CODE_EXPERIMENTAL_AGENT_TEAMS:1 启用。Cloudflare 和 ZenMux 已接入,订阅用户获 50 美元额外额度。

Claude Opus 4.6 在 SimpleBench 基准测试中排名第 2

Claude Opus 4.6 在 SimpleBench 基准测试中排名第 2,比 Opus 4.5 提升 5.6%,展示编码与代理能力增强。

Anthropic 用 Claude Opus 4.6 代理团队构建 Rust C 编译器,编译 Linux 6.9 内核

Anthropic 工程博客披露 16 个 Claude Opus 4.6 代理并行工作,从零用 Rust 写 C 编译器,耗 2000 会话、2 万美元 API 费,产出 10 万行代码。支持 x86/ARM/RISC-V 架构,通过 99% GCC 折磨测试,编译 Linux 6.9 内核、QEMU/FFmpeg/SQLite/PostgreSQL/Redis 及 Doom 游戏。在长任务基准 METR 上 50%成功时长达 6.6 小时,SWE-bench 得分 80.8%。开源项目:https://t.co/LkpLcy0d0X。

Claude Opus 4.6 原生生成可编辑 PowerPoint PPTX

Claude Opus 4.6 单提示生成原生 OOXML PPTX,支持 PowerPoint 编辑,参考网站风格,排版设计感强。颠覆 HTML/图 PPT/模板流派,兼容性编辑性最佳。

Alibaba Qwen 登顶 Apple 中国 App Store 免费榜首

Alibaba Qwen 通过 25 元奶茶券促销,中午登顶 Apple 中国 App Store 免费榜,Tencent Yuanbao 第二,ByteDance Doubao 第三。

Anthropic Claude Opus 4.6 发现开源项目 500 个高危漏洞

Anthropic 测试 Claude Opus 4.6 在开源代码库中识别 500 个严重漏洞,支持 Python 运行和可视化输出,已推动补丁合并。模型通过阅读代码分析弱点,如缓冲区溢出和 GIF 压缩 bug。

Claude Code 占 GitHub 公开提交 4%,一个月翻倍预计 2026 年达 20%

SemiAnalysis 数据显示 Claude Code 占 GitHub 公开提交 4%,一个月增长 2 倍,预计 2026 年达 20%。人类编写提交即将少数,标志 AI 主导软件开发。

Claude Opus 4.6 金融分析能力大幅提升

Anthropic 发布 Claude Opus 4.6 系统卡,Vending-Bench 2 模拟 1 年售货机业务结束资金 8017.59 美元,超 Gemini 3 Pro 的 5478.2 美元;内部 Real-World Finance 评测平均 64.1%,较 Opus 4.5 提升 5.7pp;Vals AI 基准 Finance Agent 60.7%、TaxEval 76.0%。

OpenAI 发布 GPT-5.3-Codex,SWE-Bench Pro 得分 57%

OpenAI 推出 GPT-5.3-Codex,SWE-Bench Pro 得分 57%、TerminalBench 2.0 达 76%、OSWorld 64%;METR 长任务基准 50%成功时长 6.6 小时;速度提升 25%,令牌消耗减半,支持实时交互、全栈开发从查资料到部署。TypingMind 已集成,支持长时编码。

GPT-5.3-Codex 一 prompt 生成 Three.js Minecraft 克隆

GPT-5.3-Codex 用单 prompt“Make a minecraft clone in HTML using Three JS”生成完整 Minecraft 克隆,支持详细 Three.js 实现。

Qwen3-Coder-Next 一提示生成完整 Flappy Bird 游戏

ollama 分享 Qwen3-Coder-Next 单提示生成 HTML 版 Flappy Bird 游戏,支持本地运行。命令:ollama pull qwen3-coder-next,云端 ollama pull qwen3-coder-next:cloud。展示 0:05 起生成,0:26 运行。

OpenAI 发布 Frontier 平台,支持企业 AI Agent 部署和监督

OpenAI Frontier 平台提供共享语义层、工具访问和治理执行,帮助 Agent 处理多系统任务。部署案例优化生产从 6 周减至 1 天,销售时间增 90%。

Anthropic 未来三年算力赶上 OpenAI

SemiAnalysis 报告显示 Anthropic 未来三年新增算力相当于 OpenAI 总量。

TypeScript 之父 Anders Hejlsberg:AI 时代别折腾新语言,IDE 将让位给 Agent

Anders Hejlsberg 表示 TypeScript 适合 AI 工作流,因其训练数据丰富。团队用 Go 重写编译器,性能提升 10 倍。未来工具将从 IDE 转向 Agent,人类负责监督。

科技投资大佬:AI 时代,钱就可以解决问题,这是前所未见的

Ben Horowitz 在 a16z 播客中称 AI 时代金钱能解决前所未见的问题。


EVENT-DRIVEN INTELLIGENCE

免费先跟踪重点,再决定是否升级

每篇公开内容都对应三步:订阅每日情报、查看同主题历史上下文、升级 Pro 解锁搜索、研究和事件详情。

分享

NEXT STEP · 留下邮箱

获取下一次重大事件提醒

每天一封精选情报,先用邮件建立复访,再决定是否升级到更深的追踪能力。