天眼早报
🤖 AI 大模型
𝕏 Cursor 发布 Composer 2.5:基于 Kimi K2.5 微调,强化长任务编程能力
Cursor推出Composer 2.5模型,底座为Moonshot Kimi K2.5,具备1T总参数与256K上下文,强化长任务和复杂指令遵循。在 Terminal-Bench 上达到 Claude Opus 4.7 的 69.4%,SWE-Bench Multilingual 超越 GPT-5.5;采用 Targeted RL 技术,并计划联合 SpaceXAI 训练更大规模模型。
𝕏 Meta 发布 AIRA:双智能体自主搜索神经架构,24 小时内超越 Llama 3.2
Meta发布新论文展示AIRA系统,由 AIRA-Compose 规划宏观架构、AIRA-Design 实现底层机制。该系统在24 小时计算预算内,于350M 至 3B参数规模下均超越 Llama 3.2,证明将策略与执行分离可显著提升神经架构搜索效率。
英伟达 Vera CPU 已交付 OpenAI、Anthropic、SpaceXAI 和 OCI
英伟达首批Vera CPU已送达Anthropic、OpenAI、SpaceXAI、OCI等客户,标志其面向 AI 数据中心的新一代 CPU 平台进入交付阶段。其中 OCI 计划自2026 年起部署数十万颗,用于支撑大规模 AI 基础设施。
马斯克起诉 OpenAI 案败诉,称将上诉至第九巡回法院
美国加州奥克兰联邦法院陪审团裁定,马斯克针对OpenAI和Sam Altman的诉讼超过诉讼时效,1500 亿美元索赔主张被驳回,核心指控未获实质审理。马斯克随后表示将向第九巡回法院提起上诉。
𝕏 HiDream 开源 8B 图像模型,采用像素级统一 Transformer
HiDream-O1-Image开源8B图像模型,采用统一 Transformer直接处理像素,支持最高2048×2048图像生成。在 LongText-Bench 中英文测试中分别达到 0.979/0.978,强调高分辨率生成与长文本渲染能力。
𝕏 商汤开源 SenseNova U1,统一处理图像与文本生成
商汤开源SenseNova U1,提供8B与38B-A3B MoE两版,支持文生图、图像编辑和图文交错生成等任务。官方称其在 H100 上推理速度从 23 秒降至 2 秒,展示统一多模态生成模型的效率提升。
𝕏 GPT-5.4 Nano 配合验证器循环,SWE-bench Verified 达 76.4%
Dair AI分享新研究,GPT-5.4 Nano结合Critic-Comparator循环机制,在SWE-bench Verified测试中取得 76.4% 准确率,接近 Gemini 3 Pro 和 Claude Opus 4.5 Thinking。核心方法是从弱模型的 k=8 候选补丁中筛选并验证,而非直接询问模型。
𝕏 Dell 与 Hugging Face 合作推进企业本地 AI 与开源模型部署
Hugging Face与Dell在 Dell Technologies World 主旨演讲中宣布合作,聚焦企业级本地 AI部署与开源模型落地。双方将围绕企业基础设施、模型交付和本地化运行方案,降低组织部署开源大模型的门槛。
𝕏 Qwen 3.7 Preview 上线 Arena,文本与视觉榜单排名上升
Alibaba Qwen的Qwen 3.7 Max Preview在Text Arena总榜排名第 13,实验室排名升至第 6;Qwen 3.7 Plus Preview在 Vision Arena 排名第 16,实验室排名升至第 5。细分赛道中,数学第 7、软件与 IT 第 9、编程第 10,显示文本与视觉能力同步提升。
𝕏 Dell Enterprise Hub 新增多款开源大模型一键部署
Dell Enterprise Hub新增Kimi K2.6、DeepSeek V4 Pro、GLM 5.1等模型,适配 PowerEdge XE9780 与 NVIDIA B300。该更新面向企业私有化部署场景,提供更便捷的一键部署路径。
𝕏 NVIDIA 开源 SANA-WM 世界模型,消费级 GPU 可生成 60 秒 720p 视频
NVIDIA SANA-WM为26 亿参数开源世界模型,可由图像、文本和6-DoF轨迹生成最长60 秒 720p可控视频。该模型强调在单张消费级 GPU 上运行,降低长视频世界模型生成的硬件门槛。
🔵 Meta 将 7000 名员工转岗 AI 岗位,裁员前启动组织重组
Meta内部备忘录显示,公司将把7000 名员工重新分配至AI 相关岗位,同时本周晚些时候还计划进行裁员。此举显示 Meta 正在进一步把组织资源向 AI 业务集中。
𝕏 马耳他向居民免费提供一年 ChatGPT Plus
马耳他成为首个向居民提供ChatGPT Plus一年免费订阅的国家,居民需完成一门免费课程以解锁权益,海外马耳他公民也可参与。该计划把 AI 工具订阅与基础培训绑定,意在提升全民 AI 使用能力。
𝕏 ModelScope 发布 Diffusion Templates,开源 11 个视觉控制模板
ModelScope开源Diffusion Templates,包含11 个模板与1.2TB数据集,面向扩散模型视觉控制任务。该项目为图像生成、编辑和控制类应用提供可复用训练模板与配套数据资源。
𝕏 OpenRouter 上线 xAI Grok 创意模型栈
OpenRouter上线3 个 Grok 模型,覆盖图像生成与编辑、1-15 秒视频生成以及20 多语言 TTS。该模型栈面向创意生成场景,扩展了 OpenRouter 平台上的 xAI 多模态能力。
𝕏 PolyAI 发布 Raven 3.5 和两款语音 AI 产品
PolyAI称Raven 3.5在4 项客服基准超过 GPT-5,端到端延迟低于300ms。同时公司发布两款语音 AI 产品,主打客服场景中的低延迟、高质量对话体验。
𝕏 字节开源 Lance 统一多模态模型
ByteDance开源Lance,采用视频、图像、解码器各3B参数架构,定位为统一多模态模型。该模型面向视频与图像理解生成场景,尝试用模块化结构整合多种视觉能力。
𝕏 Nous 发布 9B 工具调用与智能体编码模型
NousResearch推出9B模型,面向工具调用和智能体编码任务。在 SWE-bench 样本上得分53.33%,HermesAgent 达到85,显示小规模模型在代理式任务中的性能潜力。
𝕏 llama.cpp 为 Qwen3.6 系列加入 MTP 支持
llama.cpp为Qwen3.6加入MTP支持,用于提升本地推理性能。该更新有助于 Qwen3.6 系列在本地运行框架中的效率优化,尤其面向开发者与端侧部署场景。
🔶 苹果拟在 WWDC 展示 iOS 27,加入 AI 写作和自然语言快捷指令
苹果计划在6 月 WWDC发布iOS 27,新增 AI 写作、自然语言快捷指令和壁纸生成等功能。该更新显示苹果将继续把生成式 AI 能力嵌入系统级工具与用户日常操作中。
𝕏 Qwen3.6-27B 已可 100% 运行在 WebGPU 上
Qwen3.6-27B实现100% WebGPU运行,展示浏览器端大模型推理可行性。该进展说明较大规模模型也可通过 WebGPU 在本地浏览器环境中完成推理,为端侧和 Web AI 应用提供新路径。
𝕏 Claude Design 全套餐 token 上限翻倍
Anthropic宣布Claude Design所有套餐的token 上限翻倍,提升设计生成与多轮修改空间。该调整面向使用 Claude Design 进行视觉和设计内容生成的用户,直接增加可用上下文与输出容量。
𝕏 ParseBench 发布企业文档理解基准,覆盖复杂表格与版式
ParseBench测试前沿模型对企业文档、密集表格、图表和复杂版式的理解能力,面向文档解析与信息抽取场景。该基准可用于衡量模型在真实企业材料中的结构化理解表现。
EVENT-DRIVEN INTELLIGENCE
免费先跟踪重点,再决定是否升级
每篇公开内容都对应三步:订阅每日情报、查看同主题历史上下文、升级 Pro 解锁搜索、研究和事件详情。