天眼早报
🤖 AI 大模型
𝕏 论文提出“大模型睡眠”机制提升推理准确率
CMU与UMD联合发表的论文《Language Models Need Sleep》提出了一种sleep-like consolidation**机制。该机制通过在清空 KV 缓存前进行多次离线前向传播,将上下文固化为 fast weights,从而使多跳推理准确率提升了52%。
𝕏 OpenRouter 年化处理量达 1.5 千万亿 Token
OpenRouter年化处理量达到1.5 千万亿 Token,这一数据约为Google API的15%-30%、OpenAI的20%-40%。相较于一年前,其处理量增长了15 倍,显示出其在模型聚合与分发领域的强劲增长势头。
𝕏 Anthropic 黑客松冠军开源 Claude Code 完整工作台
Everything Claude Code项目正式开源,这是 Anthropic 黑客松的冠军作品。它包含61 个 Agent**、246 个 Skills及76 个预设命令,支持Claude Code、Cursor、Codex与OpenCode,旨在搭建持续运行的 AI 编程工作台。
小米 MiMo-V2.5 系列 API 永久降价最高降幅 99%
小米 MiMo宣布V2.5 系列 API自5 月 26 日 18:00 PDT**起永久降价,最高降幅达99%。同时,Token Plan 的同价可用量提升至5-8 倍。此次大幅降价旨在降低开发者门槛,加速 AI 应用落地。
𝕏 Gemini 3.5 Flash 评测:速度达 280 tokens/s 但成本升至 5 倍
Artificial Analysis测试显示,Gemini 3.5 Flash的输出速度最高可达280 tokens/s**,GDPVal-AA 评分达到1650 ELO。然而,其成本也大幅上升,约为Gemini 3 Flash的5 倍,性价比面临挑战。
𝕏 vLLM 合并 Rust 前端预处理吞吐提升约 5 倍
vLLM正式合并了Rust 前端**,用户可通过环境变量启用。在预处理重负载测试中,新架构达到837 req/s,而默认 Python 版本仅为162 req/s,性能提升约5 倍,显著优化了推理效率。
𝕏 中国限制民营 AI 顶尖人才海外旅行
彭博社**报道称,中国将阿里巴巴、DeepSeek等民营 AI 企业的顶尖研究人员纳入出境审批范围。部分工程师因被视为敏感国家技术持有人,其海外旅行受到严格限制,这标志着对核心 AI 人才流动管控的进一步收紧。
𝕏 Qwen3.7 Max 登上 Code Arena 前端榜第 4
Qwen3.7 Max在Code Arena: Frontend榜单首秀即排名第 4**,成为榜单中排名最高的中国实验室模型。其在前端智能体任务上的表现已追平Claude Opus 4.6,展现了国产模型在代码生成领域的强大实力。
𝕏 OpenAI 被曝面向本地小商家开发 ChatGPT 广告
OpenAI被曝正在拓展ChatGPT 广告**业务,目标客户包括洗车店、干洗店等本地商家。据称,公司计划今年通过广告实现24 亿美元的收入,试图开辟新的商业化增长点。
𝕏 Runway 推出 Project Luxo 展示全 AI 短片
Runway正式推出Project Luxo**项目,展示了由单人使用不到1 个月时间完成的10 分钟全 AI 短片《The Rogue》。该项目展示了当前生成式视频技术在长视频叙事和制作效率上的重大突破。
𝕏 Uber CEO:90%工程师使用 AI 产出显著提升
Uber** CEO Dara Khosrowshahi透露,公司内部**90%**的工程师都在使用 AI 工具。其中前**30%**的重度用户提交的代码变更数量最多,显示出 AI 在提升工程效率和产出方面的显著作用。
EVENT-DRIVEN INTELLIGENCE
免费先跟踪重点,再决定是否升级
每篇公开内容都对应三步:订阅每日情报、查看同主题历史上下文、升级 Pro 解锁搜索、研究和事件详情。