03月21日 · 科技日报

天眼日报

科技|2026年03月21日|25 分钟阅读
来源:935 条推文 + 154 篇 RSS 文章·Lanyun·DeepSeek 生成·2026-03-21
分享
科技 日报封面
AI 速读19 条精选

🤖 AI 大模型

Cursor 承认 Composer 2 基于 Kimi K2.5,并进行持续预训练与强化学习

围绕 Cursor Composer 2 的多条报道可合并为同一事件:Cursor 新发布的 Composer 2 在基准测试中表现突出,但随后因未清晰标注底层模型而引发争议。Cursor 联合创始人 Aman Sanger 确认,Composer 2 以 Moonshot AI 的 Kimi K2.5 为基础模型,在此之上进行了持续预训练,并投入约 4 倍规模的强化学习训练。Kimi 团队进一步说明,双方合作通过 Fireworks 平台获得商业授权接入。事件核心并非模型能力本身,而是产品命名与披露透明度问题。

NVIDIA 开源 Nemotron-Cascade-2:30B 参数模型获国际数学奥赛金牌级成绩

NVIDIA 开源 Nemotron-Cascade-2,总参数规模为 30B、激活参数约 3B。根据披露结果,该模型在国际数学奥林匹克、智力竞赛和计算机竞赛等评测中取得金牌级表现,代码能力也超过 Qwen3.5-35B-A3B。该消息的亮点在于,Nemotron-Cascade-2 以相对高效的激活参数实现了极强的推理与竞赛能力,显示出开源模型在数学和代码任务上的进一步突破。

记忆注意力论文开源:4B 模型击败 235B 的 RAG 系统

一篇“记忆注意力”方向的新论文提出将记忆机制直接融入注意力层,并通过端到端训练实现长期信息保留,同时保持线性复杂度。作者称,基于该方法的 4B 模型在相关任务上胜过 235B 规模的 RAG 系统,而且仅需 2 张 A800 即可处理 1 亿 token。该成果被视为对 Agent 长期记忆问题的重要推进,说明相比外挂式检索增强,模型内部原生记忆机制可能带来更高效、更一致的长期上下文能力。

Claude Code 产品经理总结 AI 时代产品管理的四个变化

Anthropic 的 Claude Code 产品经理 Catwu 分享了 AI 时代产品管理的四项关键转变:第一,以短周期 sprint 和快速实验替代长期路线图;第二,优先用可运行原型而非文档推动协作;第三,随着底层模型更新,要重新评估原有功能设计;第四,坚持最简方案,避免过早复杂化。Datagon 的产品经理也补充称,借助 AI,原型开发时间已被压缩到数小时。整体来看,这反映出 AI 产品迭代正在从“规划驱动”转向“实验驱动”。

Anthropic 法庭文件披露其与五角大楼就国家安全与自主武器问题的谈判细节

Anthropic 在一份法庭文件中反驳外界关于其存在国家安全风险的说法,并披露了其与美国国防部沟通的部分细节。文件称,3 月 4 日国防部副部长邮件显示,双方在若干议题上已接近达成共识,主要分歧集中于自主武器与监控相关边界。Anthropic 还强调,Claude 的部署并不存在所谓“远程开关”,相关员工均通过安全审查。该案听证会定于 3 月 24 日在旧金山举行。

Andrej Karpathy:AI 代理失败更多是用户技能问题,而非模型能力不足

Andrej Karpathy 在一次访谈中表示,当前 AI 代理效果不佳,很多时候并不是模型本身能力不够,而是用户不会有效委托任务。他指出,常见问题包括指令设计不清晰、缺少合适的记忆与工具支持,以及对输出缺乏审查。Karpathy 建议把任务拆成可由代理并行处理的“约 20 分钟宏动作”,例如编码研究、信息整理等,再由人类审核结果。这一观点强调,AI 代理的实际生产力很大程度取决于用户的任务设计与协作能力。

OpenAI 向美加大学生提供 100 美元 Codex API 信用额度

OpenAI 宣布向经过认证的美国和加拿大大学生发放 100 美元信用额度,用于访问 Codex API,帮助学生完成编程相关任务。这一举措有助于降低学生体验 AI 编程工具的门槛,也可能推动 Codex 在教育场景中的更广泛使用。对 OpenAI 而言,这既是开发者生态培育的一部分,也是在学生群体中推广 AI 编程工作流的直接尝试。


EVENT-DRIVEN INTELLIGENCE

免费先跟踪重点,再决定是否升级

每篇公开内容都对应三步:订阅每日情报、查看同主题历史上下文、升级 Pro 解锁搜索、研究和事件详情。

分享

NEXT STEP · 留下邮箱

获取下一次重大事件提醒

每天一封精选情报,先用邮件建立复访,再决定是否升级到更深的追踪能力。