03月21日 · 科技日报

天眼日报

科技|2026年03月21日|50 分钟阅读
来源:2206 条推文 + 0 篇 RSS 文章·Lanyun·DeepSeek 生成·2026-03-20 — 2026-03-21
分享
科技 日报封面
AI 速读22 条精选

🤖 AI 大模型

Claude Code 2.1.81 发布:新增 --bare 标志、优化针对性文件读取,并包含多项 CLI 与系统提示更新

ClaudeCodeLog 报告 Claude Code 2.1.81 已发布。此次更新新增 --bare 标志,可跳过钩子、LSP 和插件同步,以提升自动化场景下的启动与执行速度;同时改进读取工具,优先对已知文件进行局部读取,减少返回内容体积。更新还提到助手会遵守“无记忆”请求,不存储相关记忆。整体版本包含 27 项 CLI 变更与 2 项系统提示更新。另有预告称该版本还将增强桌面 DOM 元素选择、React 组件名与 props 识别能力。

Cursor Composer 2 被确认基于 Kimi K2.5:从争议曝光到官方澄清,Fireworks AI 提供合作基础设施

围绕 Cursor Composer 2 的底层模型来源,多条信息已相互印证并形成完整脉络:最初有开发者通过模型路径与分词器线索,怀疑其基于 Moonshot AI 的 Kimi K2.5,且未充分披露,甚至引发许可证合规争议;随后 Cursor 团队与 Lee Robinson 出面确认,Composer 2 的确以 Kimi K2.5 为基座模型,在此基础上进行了持续预训练与更大规模强化学习,算力规模约为基座阶段的 4 倍,并通过 Fireworks AI 的授权合作与推理基础设施接入。Moonshot AI 方面也公开祝贺并确认商业合作关系。该事件因此从“未披露争议”演变为“官方承认合作与技术路线”的完整公告链路。

Poe 上线小米 MiMo V2 系列模型:覆盖快速任务、多模态分析与 100 万 Token 长上下文

Poe 已上线小米 MiMo V2 系列模型,包括 MiMo-V2-Flash、MiMo-V2-Omni 和 MiMo-V2-Pro。Flash 面向快速文档总结与代码重构场景;Omni 支持混合媒体分析;Pro 则主打超长上下文能力,提供 100 万 token 上下文窗口,适用于长代码库分析、多步代理和复杂长文档处理。该系列目前已在 Poe 应用与 API 中可用,意味着小米模型生态正在进一步扩大其在通用 AI 平台上的分发覆盖面。

Ollama 支持本地运行 NVIDIA Nemotron-Cascade 2,NVIDIA 同步发布该开源 30B MoE 模型

NVIDIA 已在 Hugging Face 发布 Nemotron-Cascade 2,随后 Ollama 也宣布支持本地运行该模型,可通过 ollama run nemotron-cascade-2 直接调用,或结合 OpenClaw 启动。该模型为 30B 级 MoE 架构,实际激活约 3B 参数,支持多模态生成,并被称在推理与代理能力上可媲美参数量高出约 20 倍的模型。相关宣传还提到其在 IMO 与 IOI 2025 任务上达到金牌级表现。整体上,这一事件兼具“模型开源发布”与“本地部署支持落地”两层意义。

PyTorch 2.10 优化 Intel Core Ultra Series 3 与 Arc B 系列 GPU,本地推理与视觉训练性能提升

PyTorch 2.10 宣布针对 Intel Core Ultra Series 3 处理器和 Arc B 系列 GPU 做出优化,平台性能可达 120 XMX TOPs。在示例中,Llama 3.2 3B 模型的首 token 延迟约为 242.29ms,后续 token 延迟约 27.24ms;视觉模型训练则可获得约 1.4 至 1.7 倍加速。这表明 PyTorch 正持续强化对新一代 Intel AI PC 与消费级图形硬件的适配能力,为端侧与本地 AI 工作负载提供更实用的性能基础。

LlamaParse 推出官方 Agent Skill:支持 40 多种代理解析复杂文档

LlamaIndex 为 LlamaParse 推出官方 Agent Skill,旨在让代理系统更方便地处理复杂文档内容。该能力支持表格、图表、图像等非纯文本信息解析,并已提供演示与文档,适配 40 多种代理框架或代理形态。此举强化了文档理解链路中的结构化抽取与多模态解析能力,有助于提升企业知识库、报告分析、研究助手等场景的自动化水平。

小米 MiMo V2 持续扩展能力与影响力:Pro 在 Arena 排名靠前,Omni 上线 Vision Arena 测试

小米 MiMo V2 系列近期出现两项独立但相关的进展。其一,MiMo V2 Pro 在 Code Arena 的代理 Web 开发任务中进入前 6,总榜第 13,在 Arena Expert 中排名第 10,并在物理、社会科学和商业等类别进入前 20,显示出较强的综合与代码能力。其二,MiMo V2 Omni 已上线 Vision Arena,可在 Battle Mode 中接受开发者投票测试,用于评估视觉推理表现。两项信息共同表明 MiMo V2 正同时推进代码、通用推理与视觉多模态能力验证。

Claude Code 权限确认可通过 alias 永久跳过,适合自动化执行场景

有用户分享 Claude Code 的权限确认配置技巧:可通过在 ~/.bashrc 中添加 alias claude='claude --dangerously-skip-permissions',并执行 source ~/.bashrc 使之生效,从而避免每次启动时重复确认工具调用权限。该方法主要面向自动化执行、脚本化工作流和高频使用场景,但由于参数本身涉及跳过权限确认,使用时仍需结合本地环境安全策略谨慎评估。

Claude 桌面应用新增 Projects 功能:在 Cowork 中支持本地项目导入与管理

Anthropic 更新 Claude 桌面应用,在 Cowork 中引入 Projects 功能。用户可一键导入现有项目,也可新建项目进行组织管理;相关文件与指令保存在本地电脑中。该更新进一步增强了 Claude 桌面端围绕项目级上下文的使用体验,更适合持续性协作、代码或文档工作流,以及需要在本地维护资料与指令的用户。

BioReason Pro 发布:面向蛋白质功能预测的多模态推理模型

Bo Wang 团队联合 ARC Institute 和 Genophoria 发布 BioReason Pro,多模态推理模型聚焦蛋白质功能预测任务。相关介绍称,该模型试图在 AlphaFold 之后进一步补足“从蛋白质序列到功能理解”的关键空白。此类模型若能在结构、序列与实验信息之间建立更可靠的推理链路,将对生物医学研究、蛋白质工程和药物研发带来重要应用价值。

Google DeepMind 的 AlphaProof 论文登上 Nature:与 AlphaGeometry 结合达到 IMO 银牌水平

Google DeepMind 的 AlphaProof 相关研究论文已发表于 Nature。论文介绍了 AlphaProof 与 AlphaGeometry 结合后,在国际数学奥林匹克(IMO)题目上达到银牌级表现的技术路径。核心创新在于利用强化学习循环,将自然语言表述与符号推理过程更有效地桥接起来,为形式化数学证明与自动定理证明系统提供了新的可扩展方案。

谢赛宁谈世界模型与 LLM:世界模型更接近真实推演,语言模型受制于监督与数据叙事

在一次播客访谈中,谢赛宁围绕世界模型与大型语言模型的差异表达了鲜明观点。他认为世界模型关注的是对“下一状态”的预测,更接近真实物理与环境反馈,例如手放到火上会痛;而 LLM 本质上服务于沟通与语言生成,高度依赖监督信号与海量数据扩展。按照这一观点,当前硅谷对 LLM 的叙事过于强势,可能遮蔽了世界模型这一更具长期潜力但仍处于探索阶段的方向。

MidBrain 开源 SmartSearch:面向长时记忆检索的 SOTA 方法,CPU 可运行且无需 LLM

MidBrain 开源 SmartSearch,定位于 AI 代理的长时程记忆检索。该方法在 LoCoMo 上达到 93.5%、在 LongMemEval-S 上达到 88.4%,达到当前最优水平。其特点包括 CPU-only、无需 LLM,并可将 token 消耗减少约 8.5 倍。论文重点描述了记忆检索如何从传统检索方式演进为更具学习能力的系统,对需要持续记忆、多轮上下文保持和低成本部署的代理应用具有实际意义。

Mistral Small 4 发布:119B MoE 模型支持混合推理、图像输入与 256K 上下文

Mistral AI 推出 Mistral Small 4。该模型为 119B MoE 架构,活跃参数约 6.5B,支持混合推理模式、图像输入以及 256K 上下文窗口。在 Artificial Analysis Intelligence Index 中,其推理模式得分为 27,超过 Mistral Large 3 的 23 分;在 MMMU-Pro 上得分 57%。模型采用 Apache 2.0 许可,显示出 Mistral 在兼顾性能、开放性与多模态能力上的持续推进。


EVENT-DRIVEN INTELLIGENCE

免费先跟踪重点,再决定是否升级

每篇公开内容都对应三步:订阅每日情报、查看同主题历史上下文、升级 Pro 解锁搜索、研究和事件详情。

分享

NEXT STEP · 留下邮箱

获取下一次重大事件提醒

每天一封精选情报,先用邮件建立复访,再决定是否升级到更深的追踪能力。