04月26日 · 科技晚报

天眼晚报

科技|2026年04月26日|103 分钟阅读
来源:974 条推文 + 359 篇 RSS 文章·Lanyun·BatchV2 生成·2026-04-26
分享
AI 速读17 条精选

🤖 AI 大模型

𝕏 罗福莉:AI 已从预训练主导转向后训练主导的 Agent 时代

罗福莉 在长访谈中表示,AI 范式已从 Chat 时代 转向 Agent 时代,行业重点正由预训练转向后训练与智能体能力建设。她还透露,小米 MiMo 团队约 100 人,训练 1T 参数 模型的核心团队仅数人;研究、预训练、后训练的用卡比例也已从过去约 3:5:1 变化为接近 3:1:1

DeepSeek V4 预览版上线并开源,支持 1M 上下文并推出 V4-Pro API 限时折扣

DeepSeek V4 预览版已同步上线并开源,提供 V4-ProV4-Flash 两个版本,均标配 1M 上下文;其中 Pro 为 1.6T 参数/49B 激活,官方强调长上下文成本显著下降。与此同时,V4-Pro API 开启限时 2.5 折 优惠,输出价格降至 0.87 美元/百万 token,并补充了 Claude Code 与 OpenCode 的接入指引。

💹 国家超算互联网上线 DeepSeek-V4 限时免费对话服务

国家超算互联网 于 4 月 26 日推出 DeepSeek-V4 限时免费服务,支持 百万 Token 超长上下文,面向企业、科研机构和个人开发者开放体验。这一消息聚焦于公共算力平台侧的试用开放,与模型发布或商业 API 降价属于不同事件。

𝕏 Lovart 上线 Kling 3.0 4K,主打原生 4K 视频生成

Lovart 宣布上线 Kling 3.0 4K,称其为首个 原生 4K 视频模型,面向大屏展示与专业工作流,强调主体、风格、色彩与情绪的一致性。该更新反映出视频生成模型正进一步向高分辨率和专业制作场景渗透。

𝕏 OpenAI 确认 Codex 已并入主模型体系,GPT-5.5 持续强化智能体编程能力

OpenAI 开发者体验负责人 Romain Huet 表示,GPT-5.4Codex 已并入主模型体系,不再作为独立模型线推进;在此基础上,GPT-5.5 将继续强化 agentic coding 与 computer use 能力,反映出 OpenAI 正把编程与操作能力整合进统一主模型路线。

𝕏 阿里云百炼上线 Qwen-Image-2.0-Pro,整合文生图与图像编辑

阿里云百炼 上线 Qwen-Image-2.0-Pro,将文生图与图像编辑能力整合到同一模型中,支持 多语言文字渲染 与最高 2K 分辨率 输出,API 定价为 0.075 美元/张。该更新体现了 Qwen 在多模态图像生成方向的产品化推进。

🔵 DeepSeek V4 延期发布,被指转向更深度整合国产芯片生态

彭博 援引与 央视 关联账号消息,DeepSeek V4 延迟发布,背后可能是更深度整合 中国国产芯片生态 的战略调整。该报道讨论的是发布时间与底层算力生态选择,和 V4 预览版上线、API 促销或免费体验并非同一公告,应单独保留。

𝕏 GPT-5.5 在长上下文评测登顶,早期编码反馈称更快更稳

GPT-5.5128k 长上下文测试 Context Arena 中取得 91.7% 的 AUC,显著高于 GPT-5.4 的 80.6%。与此同时,早期用户反馈称,GPT-5.5 相比 GPT-5.4 在 xhigh 模式下更快,代码输出更精炼,低中档推理也更稳定,被评价为当前表现很强的编码模型。

𝕏 蚂蚁百灵 2.6 系列模型上线,提供 1T 规划版与 Flash 高速版

蚂蚁百灵 2.6 已提供 1T 规划模型与 Flash 高速模型,其中 Flash 速度可达 340 tokens/s;月底后平台仍提供每日 50 万 tokens 免费额度。该系列更新同时覆盖复杂规划与高吞吐推理两类需求,强调实用部署与成本可控。

罗福莉:中美顶尖大模型代差约 2-3 个月,竞争重点转向研究与低成本推理

罗福莉 表示,中美顶尖 大模型 的差距约为 2-3 个月,未来竞争重点将更多转向研究能力与低成本推理。该观点讨论的是全球模型竞争格局,与其关于 Agent 时代和训练范式变化的访谈属于不同信息点,应分开保留。

𝕏 OpenAI 发布临床评测基准 HealthBench Professional

OpenAI 发布 HealthBench Professional,面向临床助手评测场景,包含由医生整理的对话数据以及跨专科评分规则。该基准意在提升医疗 AI 系统在专业环境下的可比性与可测性,为临床助手模型评估提供更规范的参考框架。

𝕏 Qwen 被提及已发布 3.6 27B 模型版本

消息称 Qwen 已发布 3.6 27B 模型版本,但当前披露信息较少,除版本号与参数规模外,尚缺乏更完整的官方说明、评测表现或产品定位细节,因此信息增量相对有限。

𝕏 OpenRouter 用户称 Kimi K2.6 通过个人编码基准测试

有开发者表示,通过 OpenRouter 调用 Kimi K2.6 已通过其个人编码基准测试,并认为该模型“确有实力”,显示其在代码场景具备一定竞争力。不过这仍属于个人测试反馈,样本范围和评测标准有限,信息价值应适度看待。


EVENT-DRIVEN INTELLIGENCE

免费先跟踪重点,再决定是否升级

每篇公开内容都对应三步:订阅每日情报、查看同主题历史上下文、升级 Pro 解锁搜索、研究和事件详情。

分享

NEXT STEP · 留下邮箱

获取下一次重大事件提醒

每天一封精选情报,先用邮件建立复访,再决定是否升级到更深的追踪能力。