04月22日 · 科技早报

天眼早报

科技|2026年04月22日|160 分钟阅读
来源:1497 条推文 + 236 篇 RSS 文章·Lanyun·BatchV2 生成·2026-04-21 — 2026-04-22
分享
AI 速读16 条精选

🤖 AI 大模型

🔵 SpaceX 获得以 600 亿美元收购 Cursor 的选择权,并宣布深度合作

SpaceX 宣布与 Cursor 深度合作开发编程与知识工作 AI,并获得在今年稍后以 600 亿美元 收购 Cursor 的权利;若不收购,则需支付 100 亿美元 合作对价。合作被描述为将结合 Cursor 的开发者分发能力与 Colossus 级算力资源,是一笔同时涵盖战略协作与潜在并购的重磅交易。

𝕏 Google 推出 Gemini API 版 Deep ResearchDeep Research Max

Google 通过 Gemini API / Interactions API 推出 Deep ResearchDeep Research Max 两种研究代理配置,均基于 Gemini 3.1 Pro。新版本支持任意 MCP 接入、原生图表与信息图生成、研究规划、多模态输入及实时进度流,可连接网页、企业文档和专业数据源。官方披露 Max 在 DeepSearchQA 93.3%HLE 54.6%,并支持 PDF、CSV、图片、音视频等输入,面向长周期、可引用的深度研究工作流。

𝕏 OpenAI 正式发布 ChatGPT Images 2.0,并同步开放 gpt-image-2 API

OpenAI 正式推出 ChatGPT Images 2.0,面向 ChatGPTCodex 用户开放,底层模型 gpt-image-2 也已进入 API。官方称这是首个具备“思考”能力的图像模型,支持联网检索、单提示生成多图、自检输出、可扫描二维码,以及更强的文本渲染、版式控制、图像编辑与多语言生成能力,面向生产级图像工作流。

𝕏 Kimi K2.6 开源发布,代码与 Agent 能力大幅提升

月之暗面 发布开源模型 Kimi K2.6,采用 1T 参数 MoE 架构,在 SWE-Bench Pro 上取得 58.6%,并披露 BrowseComp 83.2 等成绩。官方强调其支持 12 小时连续执行4000+ 工具调用300 并行 sub agents 协作,主打代码生成与复杂 Agent 工作流。开发者实测显示其后端与任务编排能力明显增强,已被视作接近顶级闭源模型的开源权重方案。

𝕏 GPT-Image-2 登顶 Image Arena 三项榜单,文生图领先第二名 242 分

GPT-Image-2Image Arena 三项榜单同时排名第一:文生图 1512 分、单图编辑 1513 分、多图编辑 1464 分。其中文生图领先第二名 242 分,创下该榜单迄今最大差距;单图编辑和多图编辑也分别保持明显领先,显示 OpenAI 新图像模型在生成质量与编辑能力上已形成显著优势。

𝕏 Codex 活跃用户两周内从 300 万增至 400 万,并重置限流

Sam Altman 表示 Codex 活跃用户已达 400 万,距离突破 300 万 不到两周,意味着短时间内新增逾 100 万 用户。OpenAI 同时宣布当日将再次重置速率限制,反映出产品需求快速增长、使用强度持续攀升,也说明 Codex 在开发者中的渗透仍在显著扩大。

𝕏 OpenAI 预告 GPT-Image-2 发布演示,称“这不是截图”

OpenAI 在正式发布前通过官方预告为 GPT-Image-2 造势,宣布将于 12pm PT 进行发布演示,并以“这不是截图”作为视觉悬念,暗示新一代图像生成模型在真实感与界面级画面生成上达到更高水平。这是一次明确指向产品上线前的官方预热,与后续正式发布构成前后连续事件。

𝕏 Anthropic Claude Opus 4.7 Thinking 登顶 Code Arena 榜首

AnthropicClaude Opus 4.7 ThinkingCode Arena 榜单升至第 1,较上一代 Opus 4.6 / Opus 4.6 Thinking 高出 27 分,较非 Anthropic 模型 GLM-5.1 高出 40 分。相关信息还提到其同时拿下 React 榜首,显示该思维链版本在真实世界编码与前端任务中的综合能力显著提升。

𝕏 Moonshot AI 开源 FlashKDA,H20 上预填充提速最高 2.22 倍

Moonshot AI 开源 FlashKDA,这是基于 CUTLASS 的 Kimi Delta Attention 实现。在 H20 上,相对基线或 flash-linear-attention,可实现 1.72×–2.22× 的 prefill 加速,说明团队不仅发布模型,也在底层注意力内核与推理效率上持续推进,为长上下文和高吞吐部署提供支撑。

𝕏 Kimi K2.6 接入 Warp,主打更快工具调用与低成本任务执行

Warp 已接入 Kimi K2.6,官方称其在早期测试中表现出更快的工具调用速度,并能以较低成本完成真实编码与任务执行流程。这一接入进一步验证 Kimi K2.6 在开发者终端与 Agent 型产品中的适配性,显示其不仅在基准上强势,也在商用场景中具备竞争力。

𝕏 Codex 推出本地记忆研究预览 Chronicle

Codex 新增 Chronicle 研究预览,可记录屏幕帧、OCR 文本与文件路径,并将这些上下文整理为本地记忆文件,帮助模型更好理解当前工作流。相关信息显示该能力面向 macOS Pro 用户,原始数据支持 6 小时自动删除,强调在增强上下文理解的同时兼顾本地处理与隐私控制。

🔵 Anthropic Mythos 模型遭未授权访问,公司称系统暂未受影响

Anthropic 新模型 Mythos 被少量未授权用户访问。公司表示暂无证据显示非法访问影响其系统,但相关报道指出,Anthropic 认为该模型能力较强,可能助长危险网络攻击,因此这一事件也引发了外界对前沿模型访问控制与安全治理的进一步关注。

𝕏 Microsoft 发布 CUAVerifierBench,用于评测计算机使用代理验证器

MicrosoftHugging Face 发布 CUAVerifierBench,包含 260 条 带人工标注的代理轨迹,专门用于评测计算机使用代理(Computer Use Agent)的验证能力。该数据集为代理执行结果的自动审查、正确性判断和安全性评估提供了更标准化的基准。

𝕏 腾讯 发布 MegaStyle 数据集,覆盖 140 万张风格图像

腾讯 发布 MegaStyle 数据集,包含 140 万张 图像,由 17 万 风格提示词与 40 万 内容提示词配对生成,用于提升图像风格一致性与多样性研究。该数据集为风格化图像生成提供了更大规模的训练与评测资源,有助于推进可控视觉生成方向的发展。

𝕏 OpenRouter 揭晓神秘模型 Elephant Alpha 实为 Ling-2.6-flash

OpenRouter 公布神秘模型 Elephant Alpha 的真实身份为 AntLingAGILing-2.6-flash。该模型在隐测期间登上平台热门榜,官方表示将继续提供 1 周免费 试用。此次揭晓既解释了此前匿名模型的来源,也为开发者评估其性能、定位与后续可用性提供了明确线索。

𝕏 Claude 上线 Live Artifacts,支持实时仪表盘与数据自动刷新

Claude 上线 Live Artifacts,可连接真实应用与文件并自动刷新数据,支持版本历史,已向所有付费计划开放。该能力让 Claude 生成的 artifact 不再只是静态展示,而是能演化为实时更新的仪表盘和交互式工作界面,进一步扩展其在分析、运营和内部工具场景中的实用性。

𝕏 Kimi K2.6 上线 Baseten 推理平台

Kimi K2.6 发布首日即接入 Baseten,支持 KV-aware routingNVFP4 on Blackwell、多模态分层缓存与 prefill-decode 解耦等推理优化能力。该合作表明模型在发布初期便获得推理平台支持,有助于其在企业部署和高性能推理场景中的快速落地。

𝕏 LongSpeech 数据集发布,聚焦长音频理解评测

**LongSpeech** 公开发布,包含 10 万+ 段约 10 分钟 音频,覆盖 8 项任务,用于评测音频 LLM 的长语音理解能力。该数据集瞄准当前多模态模型在长时音频处理上的核心瓶颈,为长语音问答、摘要、检索和复杂理解任务提供更系统的基准。

𝕏 Claude Cowork 支持实时刷新图表数据

Claude Cowork 新增实时图表能力,用户修改本地 Excel 数据后,图表可自动刷新,无需重新生成。该更新表明 Anthropic 正在增强 Claude 在办公分析与协作场景中的“活数据”处理能力,让模型生成内容从静态产物转向可联动、可更新的工作组件。

Claude Code 已从 Anthropic Pro 套餐中移除

Anthropic 更新 Claude 定价页,原本属于 Pro 计划的 Claude Code 已不再包含在该订阅层级中。此举意味着 Claude Code 的商业化定位可能正在调整,开发者后续使用该能力时,可能需要关注新的套餐划分或独立付费方案。

𝕏 Fastino 发布 Pioneer,主打专用模型更快更易用

Fastino 发布 Pioneer,定位为专用 AI 模型平台,强调更快推理、持续改进与更低使用门槛,并面向模型开发者开放试用。其核心思路是通过更聚焦的专用模型路线,在性能、成本和易部署性之间取得更优平衡。


EVENT-DRIVEN INTELLIGENCE

免费先跟踪重点,再决定是否升级

每篇公开内容都对应三步:订阅每日情报、查看同主题历史上下文、升级 Pro 解锁搜索、研究和事件详情。

分享

NEXT STEP · 留下邮箱

获取下一次重大事件提醒

每天一封精选情报,先用邮件建立复访,再决定是否升级到更深的追踪能力。