04月03日 · 科技早报

天眼早报

科技|2026年04月03日|208 分钟阅读
来源:4921 条推文 + 849 篇 RSS 文章·Lanyun·BatchV2 生成·2026-04-02 — 2026-04-03
分享
AI 速读26 条精选

🤖 AI 大模型

𝕏 Arcee 发布 Trinity-Large-Thinking 开源推理模型

Arcee 正式发布 Trinity-Large-Thinking 开源推理模型,该模型采用 400B 总参数/13B 激活参数 架构,训练使用 17 万亿 token,上下文窗口达 51.2 万。模型以 Apache 2.0 许可证在 Hugging Face 开放权重,并已在 Arcee APIOpenRouter 上线。其主打企业可检查、后训练、自托管与蒸馏能力,基准测试中 GPQA-D 得分 76.3PinchBench91.9AIME25 高达 96.3,API 定价为每百万 token 0.90 美元,旨在提供高阶推理与企业级可控性。

𝕏 Claude Code 自动模式向企业版与 API 用户开放

Claude CodeAuto mode(自动模式)现已正式向 Enterprise 计划API 用户 开放。用户可以通过更新后的客户端运行 claude --enable-auto-mode 命令来启用此功能,实现代码执行的自动化。此外,Claude Code 还新增了 NO_FLICKER 实验渲染模式,支持终端 鼠标事件,可通过环境变量 CLAUDE_CODE_NO_FLICKER=1 开启以提升体验。同时,Claude iOS 与 Android 移动端应用支持将会话“传送”到本地 CLI,实现了跨设备无缝接力,便于开发者在移动场景下继续处理复杂的 Claude Code 任务。

𝕏 智谱发布 GLM-5V-Turbo 视觉编程多模态模型

智谱 AI 推出 GLM-5V-Turbo 视觉编程模型,原生支持 图像、视频、设计稿、文档布局 等多模态输入,提供 200K 上下文 窗口。该模型主打 视觉编程、工具调用与 GUI Agent 场景,深度适配 Claude Code 与 OpenClaw 协议。目前 GLM-5V-Turbo 已接入 Vision Arena 进行真实视觉推理对比,并在 OpenRouterCline 等平台上线。此外,智谱 还发布了 GLM-skills 框架,将 OCR、多模态理解等原子能力封装为可插拔模块,进一步扩展了模型的 Agent 调用场景。

𝕏 Arena 新增模型性价比 Pareto 前沿图

LMSYS Chatbot Arena 为文本、视觉、搜索、文档及代码榜单新增了 Pareto 前沿图(帕累托前沿图)。该图表直观展示了各模型在性能与价格之间的平衡位置,列出了包括 Claude Opus 4.6Gemini 3.1 Pro Preview 等在内的主流模型数据,帮助用户更科学地选择性价比最优的模型方案。

𝕏 阿里通义千问发布 Qwen3.6-Plus 正式版

阿里巴巴 正式发布 Qwen3.6-Plus 模型,默认提供 100 万 token 上下文窗口,主打 Agentic Coding(智能体编程)、多模态视觉增强与通用能力提升。该模型在 Terminal-Bench 2.0 得分 61.6,超过 Opus 4.5 的 59.3;在 SWE-benchClaw-Eval 上表现优异,代码能力逼近顶级闭源模型。定价极具竞争力,低至 每百万 token 2 元(约为 Claude 的十分之一),并已上线 阿里云百炼OpenRouterQoder。后续还将有更多 Qwen3.6 系列模型开源,并支持开源自部署。

𝕏 微软 Foundry 发布 MAI 模型家族

微软Foundry 平台正式上线 MAI 模型家族,覆盖转录、语音与图像生成三大领域。其中包括支持 25 种语言MAI-Transcribe-1、自然语音生成的 MAI-Voice-1 以及最强图像模型 MAI-Image-2。这些模型全面赋能开发者构建企业级 AI 应用,标志着微软在垂直领域大模型生态上的重要布局。

𝕏 Google Veo 3.1 Lite 价格大降

Google 推出 Veo 3.1 Lite 定价策略,大幅降低视频生成成本。720p 视频生成降至 $0.05/秒1080p 降至 $0.08/秒。这一降价举措将显著降低 AI 视频制作门槛,推动行业内容生产效率提升,使高质量视频生成更加普及。

vLLM 原生支持提取隐藏状态以训练 Spec Decoding 草稿模型

vLLM v0.18.0+ 版本新增隐藏状态提取功能,兼容 Eagle-3 训练路径,并接入 **

阿里发布 Qwen3.6-Plus,强化真实世界智能体、编程与百万级上下文能力

阿里千问正式发布Qwen3.6-Plus,重点增强编程、Agent 工具调用与真实工作流表现,默认支持100 万 Token 上下文,并已兼容 Claude Code 协议,可用于代码生成、终端自动化、视觉 Agent 等场景。综合多方信息,该模型在 SWE-bench、Terminal-Bench 2.0 等评测中接近 Claude Opus 4.5 水平,同时在长代码库理解与低成本高性价比编码方面被重点强调。

𝕏 Qwen3.6-Plus 在代码代理与 Code Arena 表现突出

开发者实测显示,Qwen3.6-Plus 接入 Claude Code 后,已能较完整地完成需求拆解、代码修改与测试执行等代理式编码流程。与此同时,Qwen 3.6 Plus Preview 进入 Code Arena 第 8 名,并推动阿里千问在 React 榜单位列实验室前列,说明其在真实编码交互与公开竞技评测中均展现出较强竞争力。

𝕏 Qwen3.6-Plus 上线 OpenRouter,并将登陆 Fireworks 提供推理与微调

Qwen3.6-Plus 已在 OpenRouter 上线,可直接调用测试;同时 阿里 Qwen 宣布与 Fireworks 合作,模型即将登陆其平台,支持推理服务与微调能力。两项进展表明该模型正快速扩展第三方平台可用性,提升开发者接入便利度与商业部署弹性。

𝕏 Qwen3.6-Plus 结束预览并开放正式版免费试用

Qwen3.6-Plus 已结束预览版阶段,现已转为正式版上线,并提供免费试用入口。该更新意味着此前已在编码、Agent 与长上下文方面获得关注的模型,开始从预览测试走向更稳定的正式服务形态,便于更多开发者与企业进行实际验证。

智谱发布 GLM-5V-Turbo,多模态视觉能力面向 Coding 与 Agent 场景

智谱 AI 推出GLM-5V-Turbo,定位为面向多模态理解的视觉模型,支持约 200K 上下文,可直接理解设计稿截图并生成前端代码,适用于图像理解、智能体感知与多模态 Coding 场景。多条信息均指出,这是智谱对视觉理解产品矩阵的进一步补强。

𝕏 Together Research 开源 Aurora,用强化学习加速推理

Together Research 发布Aurora 推理加速方案,采用强化学习实现自适应 speculative decoding。其核心卖点是在不同样本与阶段动态调整推测策略,相比静态方案可实现约 1.25 倍 提速,展示了在推理侧通过学习式调度进一步优化吞吐与延迟的思路。

𝕏 Skywork Matrix-Game 3.0 开源实时交互世界模型

Skywork Matrix-Game 3.0全开源,支持 720p 40FPS 实时生成、5B 模型 与分钟级记忆一致性,并可扩展至 28B MoE。该模型聚焦可交互世界建模与长时一致性,显示出在实时仿真、游戏 AI 与可持续环境建模方向上的技术推进。

𝕏 Vals AI 发布自研模型 Vals-4.1,并承认自评存在利益冲突

Vals AI 宣布推出Vals-4.1,并明确承认“自评自测”存在利益冲突,同时开放在线体验。该表态在模型发布信息中较为少见,既体现其主打评测与能力验证场景,也反映出公司试图在模型评估透明性方面主动披露潜在偏差。

𝕏 Arcee AI 开源 Trinity-Large-Thinking,支持自托管与蒸馏

Arcee AI 发布Trinity-Large-Thinking,已上线 Arcee API,并以 Apache 2.0 协议在 Hugging Face 开放权重。该模型主打可检查、可后训练、可自托管与可蒸馏,面向企业在可控部署、模型定制与后续优化上的实际需求。

𝕏 OpenAI 前员工称新基础模型 Spud 凝结近两年研究

Greg Brockman 表示,新基础模型 Spud 凝结了约两年研究成果,核心投入集中在 GPU 基础设施 与训练框架扩展。虽然公开信息仍有限,但该表态暗示 OpenAI 正在围绕新一代基础模型长期铺设底层训练与系统能力。

𝕏 Seedance 2.0 API 开放申请,Pro 版本需加白

Seedance 2.0 已开放API申请,基础并发为 20,Pro 与 Fast 分别为 10。其中 Pro 模型需申请加白,海外主体最低 10 万美元 可申请接入。该动作意味着 Seedance 2.0 开始从展示与榜单成绩走向更正式的商用接口开放。

Google 发布 Gemma 4 开源模型家族,转向 Apache 2.0 并覆盖端侧到 31B

Google DeepMind 正式发布Gemma 4 开源模型家族,提供 E2B、E4B、26B MoE、31B 等多个版本,支持最高 256K 上下文、原生多模态输入、函数调用与 140+语言,并采用更商业友好的 Apache 2.0 许可。该系列同时强调从手机、浏览器、笔记本到服务器的广泛部署能力,是 Google 在开放权重路线上的一次重要升级。

𝕏 Gemma 4 首轮评测与榜单表现亮眼,31B 版本进入开源榜前三

多方评测显示,Gemma 4 31BGPQA Diamond 上取得 85.7%,接近同级最优开源模型;同时其已登上 Arena 开源榜前列,在相关榜单中拿下第 3 和第 6名。外界普遍认为,Gemma 4 以相对更小的参数规模取得高排名,提升了 Google 在美国开源模型阵营中的竞争位置。

𝕏 Gemma 4 首日接入 vLLM 与 SGLang,快速扩展推理生态

vLLMSGLang 均宣布首日支持Gemma 4。其中 vLLM 提供 256K 上下文、视觉与音频多模态能力,并覆盖主流 GPU 与 Google TPU;SGLang 则覆盖 E2B/E4B/26B/31B 等多个版本。两大推理框架同步适配,说明 Gemma 4 在开源部署生态中的落地速度较快。

𝕏 Gemma 4 可在浏览器、本地 Mac、Android Studio 与 Jetson 上运行

围绕Gemma 4 的端侧与本地部署能力,社区已展示其可借助 transformers.js 在浏览器中100%本地运行,也可在3 年前 Mac上本地推理;同时其可作为 Android Studio 中的离线代理,并已登陆 NVIDIA Jetson 全系平台,覆盖从 Orin Nano 到 Thor。上述进展强化了 Gemma 4 面向边缘、离线与隐私敏感场景的实用价值。

微软发布 MAI 系列三款自研模型,覆盖转写、语音与图像生成

微软 发布 MAI-Transcribe-1MAI-Voice-1MAI-Image-2 三款自研基础模型,并通过 Microsoft Foundry 开放,意在降低对 OpenAI 的依赖,补齐自有多模态模型版图。多条信息显示,这组发布覆盖语音转写、语音生成与图像生成三大方向,是微软强化基础模型自主能力的重要动作。

微软称 MAI-Transcribe-1 在 25 种语言转写表现领先

MAI-Transcribe-1 面向25 种语言语音转写,微软称其在 FLEURS WER 评测中达到领先表现,平均词错率约 3.8%-3.9%,并在多语言场景中优于 Whisper-large-v3。该模型是微软此次 MAI 系列发布中最强调量化指标的一项成果。

微软称 MAI-Image-2 跻身图像生成 Arena 前三

MAI-Image-2 在第三方 Arena 图像生成榜单进入前三,并正逐步向 Copilot、必应图像创作者及 MAI Playground 用户开放。该成绩意味着微软自研图像模型已具备相当竞争力,并开始向自家产品体系渗透。

𝕏 OpenAI 将 ChatGPT 语音模式接入 CarPlay

OpenAI 宣布ChatGPT 已支持 CarPlay,面向运行 iOS 26.4+ 的 iPhone 用户分批开放,使语音助手能力进入车载场景。多条报道均强调,这是 ChatGPT 语音模式在汽车使用环境中的一次重要扩展,进一步丰富了其日常移动端应用边界。

🔵 OpenAI 收购科技媒体 TBPN,罕见进军媒体业务

OpenAI 已确认收购科技播客与媒体品牌 TBPN。公开信息显示,该节目仍将维持工作日固定直播,这是 OpenAI 较少见的媒体并购动作。外界普遍解读为其试图扩大在 AI 议题中的公众影响力与话语权,而不仅限于模型与产品层面的布局。

𝕏 Dreamina Seedance 2.0 登顶视频生成榜单

ByteDance SeedDreamina Seedance 2.0 登上 Artificial Analysis Video Arena 榜首,支持最长 15 秒 视频、原生立体声音频,以及文生视频、图生视频等多种输入形式。该成绩进一步巩固了其在视频生成模型竞争中的领先位置。

𝕏 Arena 开放近 3 年完整榜单数据集

Arena 已开放完整排行榜历史数据,覆盖近3 年10 个 Arena 与数百个模型评分结果,可按日期与机构进行切片分析。对于研究者、模型厂商与行业观察者而言,这将有助于更系统地回顾模型竞争格局与排名演化。

𝕏 Google 回顾 3 月 AI 更新,涵盖 Gemini 3.1 与 Lyria 3 Pro

Google 发布 3 月 AI 更新汇总,回顾了 Gemini 3.1 Flash-LiteFlash LiveLyria 3 Pro 以及 Google Maps 十年来最大升级等内容。该信息更偏月度进展综述,展示 Google 在模型、生成式媒体与产品应用层面的多线推进。

𝕏 Gemini API 新增 Flex 与 Priority 推理层级

Gemini API 新增 FlexPriority 两种推理服务层级:前者可降低约 50% 成本,后者则以更高价格换取更高可靠性,价格大约高出 80%。该调整体现出 Google 正细化 API 商业分层,以同时满足成本敏感型与稳定性敏感型客户需求。

𝕏 OpenAI 将 Codex 改为按量计费独立席位,并下调 ChatGPT Business 年付价格

OpenAICodex 从 ChatGPT 捆绑权益调整为按 token 计费的独立席位,团队无需再整包购买 ChatGPT 才能使用;同时 ChatGPT Business 年付价格从 25 美元 下调至 20 美元,并附带一定额度。此举反映其在企业产品打包方式与商业化定价上的重新平衡。

𝕏 Claude 的电脑操作功能登陆 Windows

Anthropic 宣布,Claude CoworkClaude Code Desktop电脑操作功能现已支持 Windows。这意味着 Claude 在桌面自动化与本地协作场景中的适用范围进一步扩大,不再局限于此前的部分平台环境。

Anthropic 处理 Claude Code 泄露失误,误删约 8100 个 GitHub 仓库

Anthropic 在处理 Claude Code 源代码泄露相关版权下架请求时发生重大操作失误,意外删除约 8100GitHub 仓库。公司承认系误判,已撤回大部分请求,仅保留对单一仓库的处理。事件发生在其筹备 IPO 期间,不仅暴露内容治理与自动化执行流程的风险,也对品牌声誉和开发者关系造成明显冲击。

𝕏 Google DeepMind 发布 Gemma 4:同规模领先的开源多模态模型

Google DeepMind 发布 Gemma 4 系列,包含 E2B、E4B、31B、26B MoE 四个变体,支持文本、图像、音频输入与 256k Token 上下文,并采用 Apache 2.0 许可开源。该系列延续 Gemma 在轻量与开放上的定位,同时把能力扩展到多模态与长上下文场景,进一步强化 Google 在开源模型生态中的影响力。


EVENT-DRIVEN INTELLIGENCE

免费先跟踪重点,再决定是否升级

每篇公开内容都对应三步:订阅每日情报、查看同主题历史上下文、升级 Pro 解锁搜索、研究和事件详情。

分享

NEXT STEP · 留下邮箱

获取下一次重大事件提醒

每天一封精选情报,先用邮件建立复访,再决定是否升级到更深的追踪能力。