天眼早报

科技|2026年04月03日|约 208 分钟阅读

来源：4921 条推文 + 849 篇 RSS 文章·Lanyun·BatchV2 生成·2026-04-02 — 2026-04-03

AI 速读26 条精选

🤖 AI 大模型

𝕏 Arcee 发布 Trinity-Large-Thinking 开源推理模型

Arcee 正式发布 Trinity-Large-Thinking 开源推理模型，该模型采用 400B 总参数/13B 激活参数 架构，训练使用 17 万亿 token，上下文窗口达 51.2 万。模型以 Apache 2.0 许可证在 Hugging Face 开放权重，并已在 Arcee API、OpenRouter 上线。其主打企业可检查、后训练、自托管与蒸馏能力，基准测试中 GPQA-D 得分 76.3，PinchBench 达 91.9，AIME25 高达 96.3，API 定价为每百万 token 0.90 美元，旨在提供高阶推理与企业级可控性。

𝕏 Claude Code 自动模式向企业版与 API 用户开放

Claude Code 的 Auto mode（自动模式）现已正式向 Enterprise 计划 和 API 用户 开放。用户可以通过更新后的客户端运行 claude --enable-auto-mode 命令来启用此功能，实现代码执行的自动化。此外，Claude Code 还新增了 NO_FLICKER 实验渲染模式，支持终端 鼠标事件，可通过环境变量 CLAUDE_CODE_NO_FLICKER=1 开启以提升体验。同时，Claude iOS 与 Android 移动端应用支持将会话“传送”到本地 CLI，实现了跨设备无缝接力，便于开发者在移动场景下继续处理复杂的 Claude Code 任务。

𝕏 智谱发布 GLM-5V-Turbo 视觉编程多模态模型

智谱 AI 推出 GLM-5V-Turbo 视觉编程模型，原生支持 图像、视频、设计稿、文档布局 等多模态输入，提供 200K 上下文 窗口。该模型主打 视觉编程、工具调用与 GUI Agent 场景，深度适配 Claude Code 与 OpenClaw 协议。目前 GLM-5V-Turbo 已接入 Vision Arena 进行真实视觉推理对比，并在 OpenRouter、Cline 等平台上线。此外，智谱还发布了 GLM-skills 框架，将 OCR、多模态理解等原子能力封装为可插拔模块，进一步扩展了模型的 Agent 调用场景。

𝕏 Arena 新增模型性价比 Pareto 前沿图

LMSYS Chatbot Arena 为文本、视觉、搜索、文档及代码榜单新增了 Pareto 前沿图（帕累托前沿图）。该图表直观展示了各模型在性能与价格之间的平衡位置，列出了包括 Claude Opus 4.6、Gemini 3.1 Pro Preview 等在内的主流模型数据，帮助用户更科学地选择性价比最优的模型方案。

𝕏 阿里通义千问发布 Qwen3.6-Plus 正式版

阿里巴巴 正式发布 Qwen3.6-Plus 模型，默认提供 100 万 token 上下文窗口，主打 Agentic Coding（智能体编程）、多模态视觉增强与通用能力提升。该模型在 Terminal-Bench 2.0 得分 61.6，超过 Opus 4.5 的 59.3；在 SWE-bench 和 Claw-Eval 上表现优异，代码能力逼近顶级闭源模型。定价极具竞争力，低至 每百万 token 2 元（约为 Claude 的十分之一），并已上线 阿里云百炼、OpenRouter 及 Qoder。后续还将有更多 Qwen3.6 系列模型开源，并支持开源自部署。

𝕏 微软 Foundry 发布 MAI 模型家族

微软在 Foundry 平台正式上线 MAI 模型家族，覆盖转录、语音与图像生成三大领域。其中包括支持 25 种语言 的 MAI-Transcribe-1、自然语音生成的 MAI-Voice-1 以及最强图像模型 MAI-Image-2。这些模型全面赋能开发者构建企业级 AI 应用，标志着微软在垂直领域大模型生态上的重要布局。

𝕏 Google Veo 3.1 Lite 价格大降

Google 推出 Veo 3.1 Lite 定价策略，大幅降低视频生成成本。720p 视频生成降至 $0.05/秒，1080p 降至 $0.08/秒。这一降价举措将显著降低 AI 视频制作门槛，推动行业内容生产效率提升，使高质量视频生成更加普及。

vLLM 原生支持提取隐藏状态以训练 Spec Decoding 草稿模型

vLLM v0.18.0+ 版本新增隐藏状态提取功能，兼容 Eagle-3 训练路径，并接入 **

阿里发布 Qwen3.6-Plus，强化真实世界智能体、编程与百万级上下文能力

阿里千问正式发布Qwen3.6-Plus，重点增强编程、Agent 工具调用与真实工作流表现，默认支持100 万 Token 上下文，并已兼容 Claude Code 协议，可用于代码生成、终端自动化、视觉 Agent 等场景。综合多方信息，该模型在 SWE-bench、Terminal-Bench 2.0 等评测中接近 Claude Opus 4.5 水平，同时在长代码库理解与低成本高性价比编码方面被重点强调。

𝕏 Qwen3.6-Plus 在代码代理与 Code Arena 表现突出

开发者实测显示，Qwen3.6-Plus 接入 Claude Code 后，已能较完整地完成需求拆解、代码修改与测试执行等代理式编码流程。与此同时，Qwen 3.6 Plus Preview 进入 Code Arena 第 8 名，并推动阿里千问在 React 榜单位列实验室前列，说明其在真实编码交互与公开竞技评测中均展现出较强竞争力。

𝕏 Qwen3.6-Plus 上线 OpenRouter，并将登陆 Fireworks 提供推理与微调

Qwen3.6-Plus 已在 OpenRouter 上线，可直接调用测试；同时 阿里 Qwen 宣布与 Fireworks 合作，模型即将登陆其平台，支持推理服务与微调能力。两项进展表明该模型正快速扩展第三方平台可用性，提升开发者接入便利度与商业部署弹性。

𝕏 Qwen3.6-Plus 结束预览并开放正式版免费试用

Qwen3.6-Plus 已结束预览版阶段，现已转为正式版上线，并提供免费试用入口。该更新意味着此前已在编码、Agent 与长上下文方面获得关注的模型，开始从预览测试走向更稳定的正式服务形态，便于更多开发者与企业进行实际验证。

智谱发布 GLM-5V-Turbo，多模态视觉能力面向 Coding 与 Agent 场景

智谱 AI 推出GLM-5V-Turbo，定位为面向多模态理解的视觉模型，支持约 200K 上下文，可直接理解设计稿截图并生成前端代码，适用于图像理解、智能体感知与多模态 Coding 场景。多条信息均指出，这是智谱对视觉理解产品矩阵的进一步补强。

𝕏 Together Research 开源 Aurora，用强化学习加速推理

Together Research 发布Aurora 推理加速方案，采用强化学习实现自适应 speculative decoding。其核心卖点是在不同样本与阶段动态调整推测策略，相比静态方案可实现约 1.25 倍 提速，展示了在推理侧通过学习式调度进一步优化吞吐与延迟的思路。

𝕏 Skywork Matrix-Game 3.0 开源实时交互世界模型

Skywork Matrix-Game 3.0 已全开源，支持 720p 40FPS 实时生成、5B 模型 与分钟级记忆一致性，并可扩展至 28B MoE。该模型聚焦可交互世界建模与长时一致性，显示出在实时仿真、游戏 AI 与可持续环境建模方向上的技术推进。

𝕏 Vals AI 发布自研模型 Vals-4.1，并承认自评存在利益冲突

Vals AI 宣布推出Vals-4.1，并明确承认“自评自测”存在利益冲突，同时开放在线体验。该表态在模型发布信息中较为少见，既体现其主打评测与能力验证场景，也反映出公司试图在模型评估透明性方面主动披露潜在偏差。

𝕏 Arcee AI 开源 Trinity-Large-Thinking，支持自托管与蒸馏

Arcee AI 发布Trinity-Large-Thinking，已上线 Arcee API，并以 Apache 2.0 协议在 Hugging Face 开放权重。该模型主打可检查、可后训练、可自托管与可蒸馏，面向企业在可控部署、模型定制与后续优化上的实际需求。

𝕏 OpenAI 前员工称新基础模型 Spud 凝结近两年研究

Greg Brockman 表示，新基础模型 Spud 凝结了约两年研究成果，核心投入集中在 GPU 基础设施 与训练框架扩展。虽然公开信息仍有限，但该表态暗示 OpenAI 正在围绕新一代基础模型长期铺设底层训练与系统能力。

𝕏 Seedance 2.0 API 开放申请，Pro 版本需加白

Seedance 2.0 已开放API申请，基础并发为 20，Pro 与 Fast 分别为 10。其中 Pro 模型需申请加白，海外主体最低 10 万美元 可申请接入。该动作意味着 Seedance 2.0 开始从展示与榜单成绩走向更正式的商用接口开放。

Google 发布 Gemma 4 开源模型家族，转向 Apache 2.0 并覆盖端侧到 31B

Google DeepMind 正式发布Gemma 4 开源模型家族，提供 E2B、E4B、26B MoE、31B 等多个版本，支持最高 256K 上下文、原生多模态输入、函数调用与 140+语言，并采用更商业友好的 Apache 2.0 许可。该系列同时强调从手机、浏览器、笔记本到服务器的广泛部署能力，是 Google 在开放权重路线上的一次重要升级。

𝕏 Gemma 4 首轮评测与榜单表现亮眼，31B 版本进入开源榜前三

多方评测显示，Gemma 4 31B 在 GPQA Diamond 上取得 85.7%，接近同级最优开源模型；同时其已登上 Arena 开源榜前列，在相关榜单中拿下第 3 和第 6名。外界普遍认为，Gemma 4 以相对更小的参数规模取得高排名，提升了 Google 在美国开源模型阵营中的竞争位置。

𝕏 Gemma 4 首日接入 vLLM 与 SGLang，快速扩展推理生态

vLLM 与 SGLang 均宣布首日支持Gemma 4。其中 vLLM 提供 256K 上下文、视觉与音频多模态能力，并覆盖主流 GPU 与 Google TPU；SGLang 则覆盖 E2B/E4B/26B/31B 等多个版本。两大推理框架同步适配，说明 Gemma 4 在开源部署生态中的落地速度较快。

𝕏 Gemma 4 可在浏览器、本地 Mac、Android Studio 与 Jetson 上运行

围绕Gemma 4 的端侧与本地部署能力，社区已展示其可借助 transformers.js 在浏览器中100%本地运行，也可在3 年前 Mac上本地推理；同时其可作为 Android Studio 中的离线代理，并已登陆 NVIDIA Jetson 全系平台，覆盖从 Orin Nano 到 Thor。上述进展强化了 Gemma 4 面向边缘、离线与隐私敏感场景的实用价值。

微软发布 MAI 系列三款自研模型，覆盖转写、语音与图像生成

微软发布 MAI-Transcribe-1、MAI-Voice-1 和 MAI-Image-2 三款自研基础模型，并通过 Microsoft Foundry 开放，意在降低对 OpenAI 的依赖，补齐自有多模态模型版图。多条信息显示，这组发布覆盖语音转写、语音生成与图像生成三大方向，是微软强化基础模型自主能力的重要动作。

微软称 MAI-Transcribe-1 在 25 种语言转写表现领先

MAI-Transcribe-1 面向25 种语言语音转写，微软称其在 FLEURS WER 评测中达到领先表现，平均词错率约 3.8%-3.9%，并在多语言场景中优于 Whisper-large-v3。该模型是微软此次 MAI 系列发布中最强调量化指标的一项成果。

微软称 MAI-Image-2 跻身图像生成 Arena 前三

MAI-Image-2 在第三方 Arena 图像生成榜单进入前三，并正逐步向 Copilot、必应图像创作者及 MAI Playground 用户开放。该成绩意味着微软自研图像模型已具备相当竞争力，并开始向自家产品体系渗透。

𝕏 OpenAI 将 ChatGPT 语音模式接入 CarPlay

OpenAI 宣布ChatGPT 已支持 CarPlay，面向运行 iOS 26.4+ 的 iPhone 用户分批开放，使语音助手能力进入车载场景。多条报道均强调，这是 ChatGPT 语音模式在汽车使用环境中的一次重要扩展，进一步丰富了其日常移动端应用边界。

🔵 OpenAI 收购科技媒体 TBPN，罕见进军媒体业务

OpenAI 已确认收购科技播客与媒体品牌 TBPN。公开信息显示，该节目仍将维持工作日固定直播，这是 OpenAI 较少见的媒体并购动作。外界普遍解读为其试图扩大在 AI 议题中的公众影响力与话语权，而不仅限于模型与产品层面的布局。

𝕏 Dreamina Seedance 2.0 登顶视频生成榜单

ByteDance Seed 的 Dreamina Seedance 2.0 登上 Artificial Analysis Video Arena 榜首，支持最长 15 秒 视频、原生立体声音频，以及文生视频、图生视频等多种输入形式。该成绩进一步巩固了其在视频生成模型竞争中的领先位置。

𝕏 Arena 开放近 3 年完整榜单数据集

Arena 已开放完整排行榜历史数据，覆盖近3 年、10 个 Arena 与数百个模型评分结果，可按日期与机构进行切片分析。对于研究者、模型厂商与行业观察者而言，这将有助于更系统地回顾模型竞争格局与排名演化。

𝕏 Google 回顾 3 月 AI 更新，涵盖 Gemini 3.1 与 Lyria 3 Pro

Google 发布 3 月 AI 更新汇总，回顾了 Gemini 3.1 Flash-Lite、Flash Live、Lyria 3 Pro 以及 Google Maps 十年来最大升级等内容。该信息更偏月度进展综述，展示 Google 在模型、生成式媒体与产品应用层面的多线推进。

𝕏 Gemini API 新增 Flex 与 Priority 推理层级

Gemini API 新增 Flex 与 Priority 两种推理服务层级：前者可降低约 50% 成本，后者则以更高价格换取更高可靠性，价格大约高出 80%。该调整体现出 Google 正细化 API 商业分层，以同时满足成本敏感型与稳定性敏感型客户需求。

𝕏 OpenAI 将 Codex 改为按量计费独立席位，并下调 ChatGPT Business 年付价格

OpenAI 将 Codex 从 ChatGPT 捆绑权益调整为按 token 计费的独立席位，团队无需再整包购买 ChatGPT 才能使用；同时 ChatGPT Business 年付价格从 25 美元 下调至 20 美元，并附带一定额度。此举反映其在企业产品打包方式与商业化定价上的重新平衡。

𝕏 Claude 的电脑操作功能登陆 Windows

Anthropic 宣布，Claude Cowork 与 Claude Code Desktop 的电脑操作功能现已支持 Windows。这意味着 Claude 在桌面自动化与本地协作场景中的适用范围进一步扩大，不再局限于此前的部分平台环境。

Anthropic 处理 Claude Code 泄露失误，误删约 8100 个 GitHub 仓库

Anthropic 在处理 Claude Code 源代码泄露相关版权下架请求时发生重大操作失误，意外删除约 8100 个 GitHub 仓库。公司承认系误判，已撤回大部分请求，仅保留对单一仓库的处理。事件发生在其筹备 IPO 期间，不仅暴露内容治理与自动化执行流程的风险，也对品牌声誉和开发者关系造成明显冲击。

𝕏 Google DeepMind 发布 Gemma 4：同规模领先的开源多模态模型

Google DeepMind 发布 Gemma 4 系列，包含 E2B、E4B、31B、26B MoE 四个变体，支持文本、图像、音频输入与 256k Token 上下文，并采用 Apache 2.0 许可开源。该系列延续 Gemma 在轻量与开放上的定位，同时把能力扩展到多模态与长上下文场景，进一步强化 Google 在开源模型生态中的影响力。

EVENT-DRIVEN INTELLIGENCE

免费先跟踪重点，再决定是否升级

每篇公开内容都对应三步：订阅每日情报、查看同主题历史上下文、升级 Pro 解锁搜索、研究和事件详情。

订阅每日情报查看同主题历史事件升级 Pro 解锁搜索 / 研究 / 事件详情

NEXT STEP · 留下邮箱

获取下一次重大事件提醒

每天一封精选情报，先用邮件建立复访，再决定是否升级到更深的追踪能力。

查看同主题历史事件升级 Pro 解锁事件详情