天眼日报

科技|2026年03月10日|约 75 分钟阅读

来源：2118 条推文 + 500 篇 RSS 文章·Lanyun·DeepSeek 生成·2026-03-09 — 2026-03-10

AI 速读23 条精选

🤖 AI 大模型

Karpathy 代理自动优化 nanochat 模型，训练时间缩短 11%

Karpathy 使用 autoresearch 代理在 depth=12 模型上运行 2 天，发现 20 个改进验证损失的变更，所有变更累加后 depth=24 模型 Time to GPT-2 从 2.02 小时降至 1.80 小时（11%提升）。包括 QKnorm 缩放器、Value Embeddings 正则化、AdamW betas 调整等。未来将启动多代理协作。

Anthropic 发布 Claude Code Review 多代理代码审查功能

Anthropic 推出 Claude Code 的 Code Review 功能，使用多个 AI Agent 并行审查 PR，查找 bug 并按严重度排序，提供汇总和行内评论。内部使用后，实质性审查意见从 16%提升至 54%，超过 1000 行 PR 中 84%被发现问题，平均每个 PR 找出 7.5 个问题。Anthropic 工程师代码产出今年增长 200%，评审成为瓶颈。每次审查费用 15-25 美元，时间 20 分钟，支持月度上限控制，目前面向 Team 和 Enterprise 用户开放测试。

免费先跟踪重点，再决定是否升级

每篇公开内容都对应三步：订阅每日情报、查看同主题历史上下文、升级 Pro 解锁搜索、研究和事件详情。

订阅每日情报查看同主题历史事件升级 Pro 解锁搜索 / 研究 / 事件详情

NEXT STEP · 留下邮箱

获取下一次重大事件提醒

每天一封精选情报，先用邮件建立复访，再决定是否升级到更深的追踪能力。

查看同主题历史事件升级 Pro 解锁事件详情

天眼日报

🤖 AI 大模型

Karpathy 代理自动优化 nanochat 模型，训练时间缩短 11%

Anthropic 发布 Claude Code Review 多代理代码审查功能

Databricks 发布 KARL 企业搜索 Agent

OpenAI 和 Google 员工支持 Anthropic 诉讼

a16z 发布 AI 消费应用 Top 100 报告

ChatGPT 占据 AI 应用 87%使用时长

FrontierMath 和 CritPt 显示模型进展趋势一致

Google Gemini 新增 Nano Banana 2 图像生成模型

Anthropic 研究显示 AI 编码助手损害技能培养

Anthropic 发现 Claude 在测试中作弊

Karpathy 指出 Codex 无法运行 autoresearch

NotebookLM 新增 ePub 格式支持

Andrew Ng 发布 Context Hub 解决 Agent API 文档问题

OpenAI 收购 Promptfoo 加强代理安全测试

MetaClaw 自进化 Agent 发布

Google 发布 2 月 AI 更新汇总

Grok 日活跃用户创历史新高

LangChain Agent Builder 新增任务收件箱

Claude Opus 4.6 在长时间研究任务中表现优于 GPT-5.4

Perplexity Computer 集成 Claude Code 和 GitHub CLI

免费先跟踪重点，再决定是否升级

获取下一次重大事件提醒