天眼晚报
🤖 AI 大模型
月之暗面完成新一轮融资,Kimi 模型集成至 Cursor
月之暗面完成新一轮融资,国智投、北京人工智能基金和中国移动等国资机构入股;其最新Kimi 模型已集成至代码编辑器Cursor,用于提升 AI 编程能力与效率。这一事件同时反映国产大模型融资与 AI 编程生态结合加速。
Anthropic 复盘 Claude Code 六周质量下降并完成修复
Anthropic复盘Claude Code六周质量下降,指出异常由三项产品调整叠加造成:3 月 4 日推理强度下调、3 月 26 日缓存漏洞、4 月 16 日系统提示词限制。官方称v2.1.116已修复相关问题,并为受影响用户重置订阅额度。
𝕏 Cursor 发布 Composer 2.5,基于 Kimi K2.5 强化代码代理能力
Cursor发布Composer 2.5,基于Kimi K2.5开源底座后训练,并与xAI合作优化,主打长周期任务、多文件重构、复杂指令遵循和协作式代码代理。官方称其输入价格约为 Opus 的 1/10、输出价格约为 1/30,同级能力成本效率最高提升 10 倍。
𝕏 ModelScope 开源 35B 科学多模态模型 Intern-S2-Preview
ModelScope开源Intern-S2-Preview,这是一款面向科学场景的35B参数多模态模型,在科学基准上对标万亿级 Intern-S1-Pro,并采用Apache 2.0许可发布,降低科研多模态模型的使用和二次开发门槛。
𝕏 Claude 推出自托管沙盒与 MCP 隧道,面向企业私有网络 Agent
Anthropic在Code with Claude London发布自托管沙盒公测和MCP 隧道预览,支持企业在私有网络内运行托管 Agent,并让 Claude 更安全地连接内部系统、工具和数据环境,面向企业级代码代理与自动化部署场景。
𝕏 MiniCPM-V 4.6 开源并登顶 Hugging Face 趋势榜
OpenBMB开源MiniCPM-V 4.6,登顶Hugging Face Trending;模型主打端侧多模态,支持 SGLang、vLLM、llama.cpp、Ollama 等部署方式,并称仅用 Qwen3.5-0.8B 2.5% token预算取得更高分。
𝕏 OpenAI Codex 接入戴尔本地 AI 基础设施
OpenAI Codex接入Dell AI Factory与 AI Data Platform,企业可在本地机房读取数据、部署测试推理,并以私有化方式运行 AI 编码相关工作负载。戴尔称该方案两年成本较公有云低87%,面向重视数据驻留与成本控制的企业。
𝕏 Anthropic 收购 Stainless,强化 Claude Agent 软件集成能力
Anthropic收购Stainless,后者长期为官方 Claude API 生成 SDK,并提供SDK、CLI、MCP 服务器等工具链。此次收购将补强 Claude Agent 与真实软件系统的连接能力,提升开发者集成、工具调用和企业落地体验。
𝕏 Odyssey 发布 Agora-1 实时多智能体世界模型预览
Odyssey推出Agora-1研究预览,支持人类与 AI 在同一模拟世界中实时互动,并以GoldenEye死亡竞赛形式开放试玩。该模型展示了多智能体实时世界模拟方向的进展,重点在交互式环境、角色行为和可试玩体验。
𝕏 HiDream 开源 8B 图像模型 O1-Image
HiDream-O1-Image为8B参数图像模型,采用像素级统一 Transformer 路线,支持文生图、图像编辑、个性化生成和故事板创作,最高可生成2048×2048图像,面向开源图像生成与创意工作流。
𝕏 llama.cpp 为 Qwen3.6 加入 MTP 支持,本地推理提速
llama.cpp新增Qwen3.6系列MTP支持,A10G 上 dense 生成吞吐从25 tok/s提升到 45 tok/s,约提升 78%。用户可通过两个 llama-server 参数开启该能力,改善本地大模型推理速度。
AgentScope Java 1.1.0 发布 Harness 架构
AgentScope Java 1.1.0发布Harness架构,新增工作区运行环境、抽象文件系统、上下文管理和子 Agent隔离执行能力,面向企业级智能体开发场景,强化 Agent 的可控运行、文件访问和多子任务管理。
openJiuwen 开源多智能体协作框架 JiuwenSwarm
openJiuwen发布开源JiuwenSwarm,提出Coordination Engineering理念,面向多 Agent 分工、协作与技能复用。该框架关注复杂任务中的智能体组织方式,试图为多智能体系统提供更工程化的协作抽象。
𝕏 Claude Code 新增 Fast Mode,默认使用 Opus 4.7
Claude Code新增Fast Mode,快速模式默认使用Opus 4.7,响应速度约提升2.5 倍,但需要额外付费;其输入/输出价格升至 30/150 美元每百万 token,约为标准 Opus 档位的六倍。
𝕏 GBrain v0.36.1 加入 Hindsight 预测追踪与评测
GBrain v0.36.1新增Hindsight预测追踪,采用MIT 许可并开放 LongMemEval 评测。该版本围绕长期记忆和预测能力提供更完整的评估路径,方便开发者跟踪模型或 Agent 在长上下文任务中的表现。
Hermes Agent 框架支持 Skills 自进化与多平台网关
Hermes Agent支持10+平台、20+模型提供商、持久化 Memory 和Skills 自进化,并提供多平台网关能力。该框架概览展示了其在模型接入、记忆管理和技能扩展方面的定位,但更多属于框架能力梳理。
𝕏 Grok 支持 Skills,内置办公文档处理能力
Grok新增Skills,内置DOCX、PPTX、XLSX、PDF等办公文档处理技能,并支持用户导入或创建 Skills。该能力使 Grok 更接近可扩展办公 Agent,可通过技能机制处理常见文档和工作流任务。
𝕏 Odyssey 展示 Starchild-1 实时多模态世界模型
Odyssey展示Starchild-1,可实时生成同步画面与声音,体现其在实时多模态世界模型方向的探索。该模型重点展示视觉与音频同步生成能力,与 Agora-1 的多智能体互动场景属于不同产品演示。
𝕏 Qwen3.7 预览版上线,预计 5 月 20 日发布
阿里巴巴 Qwen团队预计在5 月 20 日发布Qwen3.7系列,Max 与 Plus 预览版已进入 Arena。该版本距离 Qwen3.6 发布时间较近,社区关注后续实测效果、开源进展与模型迭代速度。
EVENT-DRIVEN INTELLIGENCE
免费先跟踪重点,再决定是否升级
每篇公开内容都对应三步:订阅每日情报、查看同主题历史上下文、升级 Pro 解锁搜索、研究和事件详情。