04月21日 · 科技晚报

天眼晚报

科技|2026年04月21日|175 分钟阅读
来源:1407 条推文 + 522 篇 RSS 文章·Lanyun·BatchV2 生成·2026-04-21
分享
AI 速读18 条精选

🤖 AI 大模型

𝕏 Kimi K2.6 正式开源,编码与智能体基准刷新开源纪录

Kimi K2.6 正式开源,采用 1T 参数 MoE/32B 激活 架构,支持 256k 上下文、原生图像与视频输入,主打长程编码与 Agent 场景。官方公布其在 SWE-bench Pro 58.6Terminal-Bench 2.0 66.7、SWE-bench Verified 80.2、DeepSearchQA 92.5,并称可扩展到 300 个子智能体、协调 4000 步,还支持 12 小时连续执行,显示其在开源代码模型中的综合能力显著提升。

𝕏 Kimi K2.6 在 Artificial Analysis 评测中位列开源权重模型第一梯队

MoonshotKimi K2.6 Artificial Analysis 智能指数中拿到 54 分、全榜第 4,仅次于 Anthropic、Google、OpenAI,同时位列开源权重模型前列。相关信息还提到其 GDPval-AA 代理任务 Elo 从 1309 提升到 1520,并具备 256k 上下文、原生图像和视频输入能力,说明该模型不只在代码场景突出,也在通用智能与代理评测中进入头部区间。

𝕏 Zapier 联合 Prime Intellect 发布 AutomationBench,前沿模型在真实工作流任务中得分均低于 10%

Zapier 联合 Prime Intellect 发布 AutomationBench,并在 Environments Hub 上提供基准,覆盖 6 个领域、47 个工具、600 个任务,用于评估模型在真实自动化工作流中的代理能力。测试结果显示,当前前沿模型总体得分均低于 10%。这一结果说明,尽管模型在公开基准上持续进步,但距离复杂、跨工具、端到端自动化的真实生产环境仍有明显差距。

𝕏 GitHub Copilot 暂停个人付费新用户注册,并调整模型与订阅策略

GitHub Copilot 4 月 20 日 起暂停 Student、Pro、Pro+ 新用户注册,仅保留 Free 开放;现有用户仍可升级。与此同时,Opus 已从 Pro 移除,后续 Pro+ 也将移除 4.5 与 4.6。此次调整显示 GitHub 正重新梳理个人订阅结构与模型供给策略,可能与成本控制及产品定位优化有关。

𝕏 Google 将 AI Studio 纳入 AI Pro/Ultra 订阅,并开放 NanoBanana Pro 与 Gemini Pro

Google 宣布将 Google AI Studio 纳入 Google AI Pro/Ultra 订阅,用户无需再单独开 API Key 或绑定信用卡,即可获得更高调用额度与实验环境访问。与此同时,Google AI Studio 还向订阅用户开放 NanoBanana ProGemini Pro,支持如 4K 照片生成 等高级能力。这表明 Google 正将其开发者平台与消费级订阅体系进一步打通。

𝕏 Kimi K2.6 登顶 open-weight Vals Index, 总榜升至第 7

Kimi K2.6 Vals Index 开源权重榜升至 第 1 名,总榜排名 第 7,成为近期国产开放模型的重要成绩。相关信息还提到评测使用官方 API,并给出了 temperature 1、top_p 0.95 等参数设置。该结果与其在代码与代理基准上的表现相互印证,表明 Kimi K2.6 在开源权重模型中的综合竞争力已进入全球第一梯队。

OpenAI 为 macOS 版 Codex 推出 Chronicle 开发者记忆功能

OpenAI Codex 推出研究预览功能 Chronicle,可自动捕获近期屏幕上下文,为后续对话构建“开发者记忆”,减少重复解释项目背景。该功能面向 macOS 版 Codex,原始截图会在 6 小时 后自动删除,兼顾上下文利用与隐私控制,显示 OpenAI 正探索将编程助手从单轮问答扩展为持续记忆式协作。

福布斯中国发布 2026 AI50 榜单,OpenAI 与 Anthropic 领衔

福布斯中国 发布 2026 AI50 榜单OpenAIAnthropic 继续领跑。榜单显示,50 家上榜公司累计融资 3056 亿美元,其中前两家合计 2426 亿美元。这一数据反映出头部 AI 公司仍在资本与行业关注度上高度集中,也凸显全球 AI 竞争格局的马太效应。

𝕏 Kimi K2.6 可在双 M3 Ultra 本地跑通完整 1T 参数 VLM

Kimi K2.6 发布约 1 小时 后,已有开发者通过 MLX两台 M3 Ultra 上跑通完整 1T 参数 VLM。这一进展显示苹果硬件上的大模型本地部署能力进一步增强,也让超大规模开源模型在个人或小团队环境中的可实验性明显提升。

𝕏 Kimi K2.6 本地运行性能接近头部闭源模型

开发者称 Kimi K2.6 在评测中超过 Opus 4.6,与前三头部模型仅差 3 分,且已经可以在个人本地硬件运行。这一结果凸显开源代码模型正继续逼近前沿闭源能力,也让本地部署在高性能编码与智能体场景中的可行性进一步提高。

GPT-Image-2 已在 ChatGPT 全量上线

OpenAI 已将 GPT-Image-2ChatGPT 中全量开放,图像生成能力从灰度测试进入普遍可用阶段,用户可直接在聊天界面生成图片。此举意味着 OpenAI 正把图像模型更深地整合进主应用入口,降低普通用户使用门槛,并进一步强化 ChatGPT 的多模态体验。

𝕏 Qwen3.6 Plus 在 Code Arena 升至第 7,通义实验室编码排名升至第 3

Qwen3.6 PlusCode Arena 最新榜单升至 第 7 名,并推动 通义实验室 在编码方向的实验室排名升至 第 3。这一成绩说明阿里系模型在代码生成与编程评测中的竞争力持续增强,也反映实验室整体在编码赛道上的系统性进步。

🔵 Mistral 称企业定制 AI 需求正在全球升温

Mistral AI 首席营收官表示,公司已转向 全栈 AI,当前收入主要来自全球大型客户部署定制模型,重点需求覆盖 企业工作流 与网络安全。这一表态反映出生成式 AI 商业化正在从通用模型能力竞争,转向面向企业场景的定制交付、集成服务和行业解决方案。

𝕏 Anthropic 限量开放网络安全模型 Mythos,NSA 等约 40 家机构获访问权限

据报道,AnthropicMythos Preview 已向约 40 家机构 限量开放,访问方包括 NSA,英国 AI Security Institute 也确认获得权限。该模型主打漏洞扫描与网络安全任务,显示 Anthropic 正将专用安全模型面向政府和机构场景试点落地,而非面向大众市场全面开放。

𝕏 Ollama 为 Kimi K2.6 扩容 Blackwell GPU 云推理

Ollama Kimi K2.6 增加 NVIDIA Blackwell GPU 资源,支持 OpenClaw、Hermes Agent 和 Claude Code 等调用场景。此次扩容说明 Kimi K2.6 的云端需求正在上升,也有助于提升其在 Agent 和编程工作流中的实际部署表现。

𝕏 阿里通义实验室发布 Fun-ASR 1.5 方言识别模型

Fun-ASR 1.5 支持 30 种语言、汉语七大方言及 20 多种地方口音,在方言场景下 CER 较上代下降 56.2%,古诗词转写字符准确率达 97%。这说明通义实验室在语音识别的多语言、多方言与细分垂类场景上继续推进,也为更本地化的语音交互和内容转写提供了基础能力。

𝕏 亚马逊拟向 Anthropic 追加 50 亿美元投资

亚马逊 表示将向 Anthropic 追加投资 50 亿美元,若达到商业里程碑,总投资额最高可达 250 亿美元。这一动作反映出云厂商对头部模型公司的绑定仍在加深,也可能进一步巩固 Anthropic 与 AWS 在模型训练、推理和企业销售上的协同关系。

𝕏 Kimi K2.6 开源协议被指对商业使用更友好

有开发者指出 Kimi K2.6 的开源协议对商用相对宽松:在 月活 1 亿以下月收入 2000 万美元以下 的情况下几乎无额外限制,并被拿来与 MiniMax M2.7 对比,认为其更利于商业落地。若这一解读被广泛接受,将提升企业在实际产品中采用 Kimi K2.6 的意愿。

𝕏 Kimi K2.6 与 FireworksAI 达成 Day 0 首发合作

FireworksAI 成为 Kimi K2.6 的 Day 0 合作伙伴,首发即提供模型的 推理微调 服务。对开发者而言,这降低了从模型评估到实际部署的门槛,也说明 Kimi K2.6 在发布之初就同步进入主流云端推理生态。

𝕏 Ollama 实测 Kimi K2.6 云端速度最高达 114.3 tok/s

OllamaKimi K2.6:cloud 进行了三次速度测试,结果分别达到 77.9、114.3、86.3 tok/s,首 token 延迟约 788-1117ms。该数据为开发者评估云端可用性提供了更具体的参考,也说明该模型除基准成绩外,在实际推理吞吐上已有较强表现。

𝕏 上海发布数字经济试点方案,支持大模型与多模态基础设施

上海 提出建设战略性 数据语料基础设施,支持大参数与多模态基础模型,并推动通用 AI、智能软件和计算系统突破。该方案反映出地方层面正从单点产业扶持转向更系统的底层能力建设,希望在数据、模型与算力协同上形成长期竞争力。

𝕏 Gemini in Chrome 扩展至更多亚太国家

Gemini in Chrome扩展至 日本、韩国、新加坡 等更多亚太市场,用户可在浏览器内直接使用页面摘要,并调用 GmailGoogle Maps 等服务。此举意味着 Google 正继续推进浏览器原生 AI 助手的区域覆盖,把 Gemini 更深地嵌入日常上网与生产力场景。

𝕏 8 个本地开源模型实测:Gemma 4 跑分高,但千问在 Agent 场景更稳

基于 Mac Studio 的一组实测对 8 个本地模型 进行了比较,结论是 Gemma 4 跑分较高,但在 Agent 工具调用上不如 千问 稳定,后者生态也更成熟。这类结果提醒开发者,模型选择不能只看静态跑分,真实工具调用、工作流稳定性与生态适配往往对落地更关键。

𝕏 Kimi K2.6 已接入 Notion

Notion 已上线 Kimi K2.6,将这一开源权重模型直接提供给用户调用与试用。此举意味着 Kimi K2.6 不仅停留在模型发布和跑分阶段,也开始进入实际生产力工具生态,便于更广泛用户在文档、知识管理与工作流场景中体验其能力。

𝕏 Kimi K2.6 上线 HuggingChat

Kimi K2.6 已接入 HuggingChat,开发者和普通用户可直接在线体验该开源模型。随着其登陆主流模型体验平台,Kimi K2.6 的可访问性进一步提高,也有助于其在国际开源社区中扩大测试与采用范围。

𝕏 Ollama 新增 Kimi K2.6 云端运行入口

Ollama 提供 kimi-k2.6:cloud 运行入口,便于开发者快速调用 Kimi K2.6 的云端版本。相比本地部署,这一方式更适合快速试用、集成与验证,也为后续性能测试和云推理扩容提供了基础。


EVENT-DRIVEN INTELLIGENCE

免费先跟踪重点,再决定是否升级

每篇公开内容都对应三步:订阅每日情报、查看同主题历史上下文、升级 Pro 解锁搜索、研究和事件详情。

分享

NEXT STEP · 留下邮箱

获取下一次重大事件提醒

每天一封精选情报,先用邮件建立复访,再决定是否升级到更深的追踪能力。