天眼早报
🤖 AI 大模型
𝕏 Goodfire AI 发布 Manifold Steering 论文,提出神经网络控制新框架
Goodfire AI团队发表《Manifold Steering》论文,提出激活流形几何而非单一向量才是控制神经网络行为的合适对象。研究在530M 参数 Llama-3上验证,显示沿弯曲路径转向优于线性向量,为大模型可解释性提供新的数学框架和视觉化证据。
𝕏 OpenAI 推出 ChatGPT 个人财务预览,可连接 1.2 万多家金融机构
OpenAI向美国 Pro 用户开放ChatGPT 个人财务预览,用户可通过Plaid连接12000 多家金融机构,查看余额、交易、投资和负债,并围绕预算、订阅、消费分析和省钱建议向模型提问。
𝕏 Anthropic Mythos 5 天内串联 2 个 macOS 内核漏洞
Anthropic Mythos帮助研究人员在5 天内发现2 个未知 macOS 内核漏洞,并将漏洞组合成可绕过内存完整性保护的提权利用链,展示了 AI 辅助漏洞研究在内核安全场景中的实际能力。
𝕏 Infinity-Parser2 开源模型登顶 ParseBench 文档理解榜
INF发布Infinity-Parser2-Pro 35B与Flash 2B,基于500 万合成解析样本和 Joint RL 训练,在 ParseBench 文档理解榜取得领先,面向复杂文档解析和结构化理解场景提供新开源选择。
𝕏 马斯克称 Grok V9 基础模型达到 1.5T 参数
马斯克称内部完成的Grok V9是1.5T 参数基础模型,并针对 Blackwell 硬件优化;目前公开版Grok 4.2仍基于 0.5T 参数的 V8,显示 xAI 下一代基础模型规模将显著扩大。
𝕏 OpenAI 重组产品线,ChatGPT 与 Codex 将合并为统一体验
Greg Brockman正式接管 OpenAI 产品战略,ChatGPT、Codex和 API 业务并入核心产品团队,Codex 负责人Thibault Sottiaux升任平台主管,预示 OpenAI 将把对话、编程和开发者接口整合为更统一的产品体验。
𝕏 中国 AI 实验室开源 1 万亿参数推理模型 Ring-2.6-1T
Ring-2.6-1T采用 MoE 架构,每 token 激活63B 参数,提供MIT 许可、262K 上下文和 66K 输出,并可接入 Claude Code,为开源推理模型提供了更大参数规模和更长上下文选择。
𝕏 30B-A3B 推理模型在物理和数学奥赛评测达金牌水平
研究团队发布30B-A3B 推理模型,在IPhO评测中直接达到金牌水平,并通过测试时自验证在IMO/USAMO取得金牌级表现,显示中等规模推理模型在高难度科学与数学竞赛任务上的潜力。
𝕏 Notion Custom Agents 案例:AI 自动处理 70% 非核心工作
Notion分享Brainlabs使用Custom Agents自动化处理日常琐事的案例,将团队约**70%**的时间从非核心工作中释放出来,使成员能更专注于核心任务,展示 Agent 在企业工作流中的落地效果。
𝕏 Raycast 2.0 Beta 上线,语音输入深度集成工作流
Raycast推出2.0 Beta版本,免费开放语音输入功能,并加入Custom Instructions、App Context 感知和 Auto Styling,可根据邮件、代码或会议纪要自动调整输出格式,让语音操作更深度融入系统原生工作流。
𝕏 GPT-5.5 在 GDPval-AA 工作任务评测中预计 98% 胜过 Claude 4 Sonnet
Artificial Analysis称GPT-5.5在 GDPval-AA 工作任务评测中,预计有**98%**概率胜过一年前领先的Claude 4 Sonnet;评测覆盖 9 个行业、44 个职业任务,反映模型在真实工作任务上的竞争变化。
𝕏 开源 Skill 可将 15+ 内容源转换为播客、PPT 或思维导图
一款开源Skill支持将公众号、YouTube、PDF 等15+种内容源自动转换为播客、PPT 或思维导图,并具备覆盖300+站点的付费墙绕过能力,可直接安装至Claude Code或 Codex 以提升信息获取效率。
𝕏 微软在 Hugging Face 发布 3.8B 文生图模型 Lens
Microsoft Lens在 Hugging Face 发布,是一款3.8B 参数文生图模型,支持最高1440×1440分辨率生成,为高分辨率图像生成场景提供新的开放模型选择。
🔵 苹果与 OpenAI 合作关系趋紧,OpenAI 评估法律行动
Apple与OpenAI两年前达成的 AI 合作出现紧张,OpenAI 认为交易带来的收益未达预期,并准备评估可能的法律行动;该变化显示大型平台与模型公司的合作关系正在面临商业分配和战略控制权压力。
𝕏 Grok 新增 Teams、Salesforce、Box 企业连接器
Grok上线Microsoft Teams、Salesforce、Box三项企业连接器,可在聊天记录、客户管理和文件检索等场景中调用企业数据,增强其面向组织知识库和工作流的企业级能力。
𝕏 Claude Code 2.1.143 发布,新增 33 项 CLI 变更
Claude Code 2.1.143带来33 项 CLI 变更,重点强化插件依赖管理、Token 成本估算和后台会话保持等能力,改善开发者在命令行环境中使用 Claude Code 的稳定性和可控性。
𝕏 NVIDIA 公布 Nemotron 3 新模型训练信息
NVIDIA公布 Nemotron 3 系列训练信息,其中Nemotron 3 Super为120B参数、使用25T tokens预训练;Ultra 版本约 500B 参数,两者均使用 NVFP4,显示其面向高效大模型训练和推理的路线。
𝕏 百度提出智能体时代新指标 DAA
李彦宏在Baidu Create 2026提出**DAA(日活智能体)**指标,用于衡量智能体时代的活跃度与价值创造,并进一步阐述智能体、个人与组织协同演化所需的全栈基础设施。
𝕏 Qwen3.6 MTP GGUF 在 Unsloth 运行速度提升至 1.8 倍
Unsloth称Qwen3.6 MTP GGUF借助 llama.cpp 参数更新,运行速度由 1.4 倍提升至1.8 倍,体现本地推理栈在模型格式和底层参数优化后的性能改进。
𝕏 MoE 模型路由、专家选择与负载均衡机制图解
MoE模型通过Router为 token 选择 top-K 专家,并依靠噪声、容量上限等机制缓解专家过选和负载不均问题;该图解重点说明专家选择与负载均衡在稀疏模型训练和推理中的作用。
𝕏 MiniMax M2.7 接入 OrcaRouter,兼容 OpenAI API
MiniMax M2.7上线OrcaRouter,开发者可通过单一OpenAI 兼容 API调用该模型,降低接入和迁移成本,并便于在已有 OpenAI 生态工具链中进行模型替换或对比测试。
𝕏 xAI 支持在 Hermes Agent 中使用 SuperGrok 订阅
xAI宣布Grok 订阅可在Nous Research Hermes Agent中使用,使订阅用户能够在第三方 Agent 环境里调用 Grok 能力,扩展 Grok 从自有产品到外部智能体工具链的使用场景。
EVENT-DRIVEN INTELLIGENCE
免费先跟踪重点,再决定是否升级
每篇公开内容都对应三步:订阅每日情报、查看同主题历史上下文、升级 Pro 解锁搜索、研究和事件详情。