天眼早报

科技|2026年05月19日|约 88 分钟阅读

来源：1227 条推文 + 282 篇 RSS 文章·Lanyun·BatchV2 生成·2026-05-18 — 2026-05-19

AI 速读14 条精选

🤖 AI 大模型

𝕏 Cursor 发布 Composer 2.5：基于 Kimi K2.5 微调，强化长任务编程能力

Cursor推出Composer 2.5模型，底座为Moonshot Kimi K2.5，具备1T总参数与256K上下文，强化长任务和复杂指令遵循。在 Terminal-Bench 上达到 Claude Opus 4.7 的 69.4%，SWE-Bench Multilingual 超越 GPT-5.5；采用 Targeted RL 技术，并计划联合 SpaceXAI 训练更大规模模型。

𝕏 Meta 发布 AIRA：双智能体自主搜索神经架构，24 小时内超越 Llama 3.2

Meta发布新论文展示AIRA系统，由 AIRA-Compose 规划宏观架构、AIRA-Design 实现底层机制。该系统在24 小时计算预算内，于350M 至 3B参数规模下均超越 Llama 3.2，证明将策略与执行分离可显著提升神经架构搜索效率。

英伟达 Vera CPU 已交付 OpenAI、Anthropic、SpaceXAI 和 OCI

英伟达首批Vera CPU已送达Anthropic、OpenAI、SpaceXAI、OCI等客户，标志其面向 AI 数据中心的新一代 CPU 平台进入交付阶段。其中 OCI 计划自2026 年起部署数十万颗，用于支撑大规模 AI 基础设施。

马斯克起诉 OpenAI 案败诉，称将上诉至第九巡回法院

美国加州奥克兰联邦法院陪审团裁定，马斯克针对OpenAI和Sam Altman的诉讼超过诉讼时效，1500 亿美元索赔主张被驳回，核心指控未获实质审理。马斯克随后表示将向第九巡回法院提起上诉。

𝕏 HiDream 开源 8B 图像模型，采用像素级统一 Transformer

HiDream-O1-Image开源8B图像模型，采用统一 Transformer直接处理像素，支持最高2048×2048图像生成。在 LongText-Bench 中英文测试中分别达到 0.979/0.978，强调高分辨率生成与长文本渲染能力。

𝕏 商汤开源 SenseNova U1，统一处理图像与文本生成

商汤开源SenseNova U1，提供8B与38B-A3B MoE两版，支持文生图、图像编辑和图文交错生成等任务。官方称其在 H100 上推理速度从 23 秒降至 2 秒，展示统一多模态生成模型的效率提升。

𝕏 GPT-5.4 Nano 配合验证器循环，SWE-bench Verified 达 76.4%

Dair AI分享新研究，GPT-5.4 Nano结合Critic-Comparator循环机制，在SWE-bench Verified测试中取得 76.4% 准确率，接近 Gemini 3 Pro 和 Claude Opus 4.5 Thinking。核心方法是从弱模型的 k=8 候选补丁中筛选并验证，而非直接询问模型。

𝕏 Dell 与 Hugging Face 合作推进企业本地 AI 与开源模型部署

Hugging Face与Dell在 Dell Technologies World 主旨演讲中宣布合作，聚焦企业级本地 AI部署与开源模型落地。双方将围绕企业基础设施、模型交付和本地化运行方案，降低组织部署开源大模型的门槛。

𝕏 Qwen 3.7 Preview 上线 Arena，文本与视觉榜单排名上升

Alibaba Qwen的Qwen 3.7 Max Preview在Text Arena总榜排名第 13，实验室排名升至第 6；Qwen 3.7 Plus Preview在 Vision Arena 排名第 16，实验室排名升至第 5。细分赛道中，数学第 7、软件与 IT 第 9、编程第 10，显示文本与视觉能力同步提升。

𝕏 Dell Enterprise Hub 新增多款开源大模型一键部署

Dell Enterprise Hub新增Kimi K2.6、DeepSeek V4 Pro、GLM 5.1等模型，适配 PowerEdge XE9780 与 NVIDIA B300。该更新面向企业私有化部署场景，提供更便捷的一键部署路径。

𝕏 NVIDIA 开源 SANA-WM 世界模型，消费级 GPU 可生成 60 秒 720p 视频

NVIDIA SANA-WM为26 亿参数开源世界模型，可由图像、文本和6-DoF轨迹生成最长60 秒 720p可控视频。该模型强调在单张消费级 GPU 上运行，降低长视频世界模型生成的硬件门槛。

🔵 Meta 将 7000 名员工转岗 AI 岗位，裁员前启动组织重组

Meta内部备忘录显示，公司将把7000 名员工重新分配至AI 相关岗位，同时本周晚些时候还计划进行裁员。此举显示 Meta 正在进一步把组织资源向 AI 业务集中。

𝕏 马耳他向居民免费提供一年 ChatGPT Plus

马耳他成为首个向居民提供ChatGPT Plus一年免费订阅的国家，居民需完成一门免费课程以解锁权益，海外马耳他公民也可参与。该计划把 AI 工具订阅与基础培训绑定，意在提升全民 AI 使用能力。

𝕏 ModelScope 发布 Diffusion Templates，开源 11 个视觉控制模板

ModelScope开源Diffusion Templates，包含11 个模板与1.2TB数据集，面向扩散模型视觉控制任务。该项目为图像生成、编辑和控制类应用提供可复用训练模板与配套数据资源。

𝕏 OpenRouter 上线 xAI Grok 创意模型栈

OpenRouter上线3 个 Grok 模型，覆盖图像生成与编辑、1-15 秒视频生成以及20 多语言 TTS。该模型栈面向创意生成场景，扩展了 OpenRouter 平台上的 xAI 多模态能力。

𝕏 PolyAI 发布 Raven 3.5 和两款语音 AI 产品

PolyAI称Raven 3.5在4 项客服基准超过 GPT-5，端到端延迟低于300ms。同时公司发布两款语音 AI 产品，主打客服场景中的低延迟、高质量对话体验。

𝕏 字节开源 Lance 统一多模态模型

ByteDance开源Lance，采用视频、图像、解码器各3B参数架构，定位为统一多模态模型。该模型面向视频与图像理解生成场景，尝试用模块化结构整合多种视觉能力。

𝕏 Nous 发布 9B 工具调用与智能体编码模型

NousResearch推出9B模型，面向工具调用和智能体编码任务。在 SWE-bench 样本上得分53.33%，HermesAgent 达到85，显示小规模模型在代理式任务中的性能潜力。

𝕏 llama.cpp 为 Qwen3.6 系列加入 MTP 支持

llama.cpp为Qwen3.6加入MTP支持，用于提升本地推理性能。该更新有助于 Qwen3.6 系列在本地运行框架中的效率优化，尤其面向开发者与端侧部署场景。

🔶 苹果拟在 WWDC 展示 iOS 27，加入 AI 写作和自然语言快捷指令

苹果计划在6 月 WWDC发布iOS 27，新增 AI 写作、自然语言快捷指令和壁纸生成等功能。该更新显示苹果将继续把生成式 AI 能力嵌入系统级工具与用户日常操作中。

𝕏 Qwen3.6-27B 已可 100% 运行在 WebGPU 上

Qwen3.6-27B实现100% WebGPU运行，展示浏览器端大模型推理可行性。该进展说明较大规模模型也可通过 WebGPU 在本地浏览器环境中完成推理，为端侧和 Web AI 应用提供新路径。

𝕏 Claude Design 全套餐 token 上限翻倍

Anthropic宣布Claude Design所有套餐的token 上限翻倍，提升设计生成与多轮修改空间。该调整面向使用 Claude Design 进行视觉和设计内容生成的用户，直接增加可用上下文与输出容量。

𝕏 ParseBench 发布企业文档理解基准，覆盖复杂表格与版式

ParseBench测试前沿模型对企业文档、密集表格、图表和复杂版式的理解能力，面向文档解析与信息抽取场景。该基准可用于衡量模型在真实企业材料中的结构化理解表现。

EVENT-DRIVEN INTELLIGENCE

免费先跟踪重点，再决定是否升级

每篇公开内容都对应三步：订阅每日情报、查看同主题历史上下文、升级 Pro 解锁搜索、研究和事件详情。

订阅每日情报查看同主题历史事件升级 Pro 解锁搜索 / 研究 / 事件详情

NEXT STEP · 留下邮箱

获取下一次重大事件提醒

每天一封精选情报，先用邮件建立复访，再决定是否升级到更深的追踪能力。

查看同主题历史事件升级 Pro 解锁事件详情