天眼早报
🤖 AI 大模型
𝕏 NVIDIA 开源 Nemotron 3 Nano Omni 全模态模型,最高带来 9.2 倍吞吐提升
NVIDIA开源全模态理解模型 Nemotron 3 Nano Omni,采用 30B-A3B 混合 Mamba-Transformer-MoE 架构,统一处理文本、图像、视频与音频四种模态,并支持 256K 长上下文。综合多条披露信息,该模型面向企业级 AI Agent 与轻量多模态部署场景,在多文档与视频处理上的系统吞吐量最高可达同级开源替代方案的 7.4 倍 与 9.2 倍,官方还同步推动 Hugging Face 与演示生态落地。
𝕏 DeepSeek V4 发布:编码能力比肩 Claude Opus 4.7,支持 100 万上下文
DeepSeek V4正式发布,Pro 与 Flash 两个版本在 SWE-bench Verified 编码基准上分别达到 80.6% 和 80.8%,表现已可与 Claude Opus 4.7 持平。该模型同时提供原生 100 万 token 上下文,价格仅为对标模型的 1/7 至 1/90,在高性能代码生成与长上下文处理上具备明显性价比优势。
𝕏 AntLingAGI 发布 Ling-2.6-flash,即时指令与低延迟智能体模型上线
AntLingAGI发布 Ling-2.6-flash 模型,总参数 104B、激活参数 7.4B,定位于低延迟的智能体工作流与即时指令场景。该模型发布首日即获得 SGLang 与 vLLM 支持,说明其在推理部署生态中的兼容性较强,适合需要快速响应与工程落地的应用。
𝕏 DeepSeek 正式采用 TileLang 作为官方技术栈
DeepSeek已正式将 TileLang 纳入官方技术栈。相关信息显示,TileLang 首位作者 Lei Wang 与 DeepSeek V4 作者名单存在直接关联,进一步印证双方技术协同正在加强。此举被外界视为 DeepSeek 在编译与底层优化体系上加速布局,也体现其对 非 CUDA 硬件生态的持续投入。
𝕏 Poolside 发布首批公开模型 Laguna M.1 与 XS.2,XS.2 采用 Apache 2.0 开源
Poolside 发布首批公开基础模型 Laguna M.1 与 Laguna XS.2。其中 XS.2 为开放权重版本,采用 33B MoE 架构、3B 激活参数,专为代理式编码与长周期任务设计,并采用 Apache 2.0 许可;模型已在 Hugging Face 与 OpenRouter 等渠道开放获取或试用。这是 Poolside 首次公开其基础模型体系。
𝕏 Kimi K2.6 升至 Vals Index 开源权重模型第一
在 Vals Index 基准评测中,Kimi K2.6 升至开源权重模型 第 1、总榜 第 8。评测认为其以更低价格接近多款闭源模型表现,说明该模型在性能与成本之间取得了较强平衡,也进一步提升了其在开源模型竞争格局中的地位。
𝕏 OpenAI 研究人员称 GPT-5.4 Pro 协助解决 60 年未解数学问题
OpenAI研究人员透露,一个悬而未决长达 60 年 的 Erdős 数学问题,在 GPT-5.4 Pro 的帮助下获得解决。这被视为 AI 在高阶数学研究中的重要里程碑,显示前沿模型已不只是执行常规推理任务,而是开始参与具有原创性与学术价值的问题探索。
𝕏 Claude 新增 Blender 连接器,可直接操作 3D 场景
Claude 接入新的 Blender 连接器,可直接调试场景、构建工具并批量修改对象。这意味着模型能力正进一步延伸到 3D 内容 生产与场景编辑工作流中,有望提升建模、动画与资产管理等环节的自动化程度。
𝕏 Mistral Medium 3.5-128B 模型现身 GitHub
Mistral-Medium-3.5-128B 模型已在 GitHub 上被发现,显示 Mistral 可能正在准备新的开源大语言模型版本。现有信息仍较为有限,但该模型命名与参数规模已引发社区关注。
OpenAI 预测 8 美元 ChatGPT Go 订阅用户今年将达 1.12 亿
OpenAI 预测,更便宜的 8 美元 档位 ChatGPT Go 订阅服务今年将拥有 1.12 亿 用户;相比之下,旗舰 Plus 套餐用户数预计将下降 80% 至约 900 万。这一预测显示 OpenAI 可能正把增长重点转向更大规模的大众化低价订阅市场。
𝕏 Fireworks AI 上线 DeepSeek V4 Pro,称已修复输出损坏问题
Fireworks AI 表示已与 DeepSeek、SGLang、vLLM 联调 2 天,修复参考代码输出损坏问题后,正式提供 DeepSeek V4 Pro。这条信息属于模型发布后的部署与服务化进展,反映出新模型在第三方推理平台上的适配速度。
EVENT-DRIVEN INTELLIGENCE
免费先跟踪重点,再决定是否升级
每篇公开内容都对应三步:订阅每日情报、查看同主题历史上下文、升级 Pro 解锁搜索、研究和事件详情。