天眼早报

科技|2026年05月05日|约 77 分钟阅读

来源：1102 条推文 + 200 篇 RSS 文章·Lanyun·BatchV2 生成·2026-05-04 — 2026-05-05

AI 速读19 条精选

🤖 AI 大模型

𝕏 Google 发布 DFlash 技术，LLM 推理速度提升 3.13 倍

Google联合 UCSD 团队推出DFlash（扩散式推测解码），在 Google Cloud TPUs 上将LLM 推理速度提升3.13 倍。该方法试图突破传统自回归解码瓶颈，为大规模模型部署提供更高吞吐、更低延迟的新路径。

𝕏 OpenAI 成立估值 100 亿美元的 AI 部署合资公司，已获超 40 亿美元融资

OpenAI成立面向企业 AI 落地的The Deployment Company，估值约100 亿美元，已从 TPG、Brookfield、Bain 等 19 家投资方筹集超过 40 亿美元。该项目聚焦帮助企业部署内部智能体、改造业务流程，显示头部模型公司正从模型 API 进一步延伸到企业级 AI 实施服务。

𝕏 DeepMind CEO：未来 6 至 12 个月小模型价值将超过大模型

Demis Hassabis认为，未来 6 至 12 个月内，小模型会因成本、速度和边缘部署优势而更具实际价值，并可能成为更主流的应用选择。他还提出“爱因斯坦测试”，强调 AI 真正的突破不应只是模式匹配，而应体现创造力与科学发现能力。

𝕏 Anthropic 拟与黑石、高盛等成立 15 亿美元 AI 部署合资公司

Anthropic接近与Blackstone、高盛、Hellman & Friedman 等华尔街机构成立约15 亿美元的 AI 部署合资公司，面向私募股权投资组合公司和中型企业推广 Claude 工作流。该项目将把 Claude 嵌入企业核心业务，并获得 Sequoia、GIC 等机构支持，反映模型公司正加速进入企业流程改造市场。

𝕏 GPT-5.5 在 Blueprint-Bench 2 榜单登顶，领先 Gemini 与 Claude

OpenAI的GPT-5.5在Blueprint-Bench 2基准测试中排名第一，领先 Gemini 3.1 Pro 和 Claude Opus 4.7。测试显示人类表现仍优于模型，同时部分其他模型得分低于随机水平，凸显复杂规划与蓝图理解仍是当前 AI 的重要挑战。

𝕏 LangChain Fleet 新增多模型智能体编排能力

LangChain Fleet新增多模型支持，允许开发者为不同子智能体分配快模型、低价模型或强模型，从而在复杂 Agent 系统中更细粒度地平衡成本、速度与任务质量。该能力适合多智能体协作、工具调用和企业级自动化场景。

Bonsai 1.7B 三值模型在 M4 Max 上实现 442T/s 吞吐

Bonsai 1.7B三值模型演示在M4 Max上实现442T/s推理吞吐，展示了低比特模型在本地硬件上的高效运行潜力。该结果对端侧模型部署、低成本推理和轻量化 AI 应用具有参考价值。

🔵 欧盟洽谈采用 Anthropic Mythos 测试银行系统漏洞

欧盟正与Anthropic讨论让企业和银行接受Mythos AI漏洞测试，以识别金融系统中的潜在风险。该动向表明监管机构开始探索使用前沿 AI 模型对金融基础设施进行安全评估和压力测试。

𝕏 Shopify 称公司代码中 AI 生成比例已超过 50%

Shopify CEO Tobi 表示，公司代码中AI 生成比例已超过50%，内部工具 River 运行在 Slack 中，用于支持工程协作与开发流程。这一披露显示 AI 编程工具已在部分互联网公司进入大规模日常生产环节。

𝕏 豆包 App 付费版曝光：月费或分 68 元、200 元、500 元三档

豆包 App订阅声明显示，其付费版可能推出68 元、200 元、500 元三档月费版本。该信息暗示豆包正在准备更清晰的商业化分层，可能围绕模型能力、使用额度或高级功能进行差异化定价。

𝕏 Google 披露 4 月 AI 进展：Gemma 4 下载量超 5 亿次

Google汇总 4 月 AI 进展，包括第八代TPU、Gemini 企业智能体平台、Google Vids 每月 10 条免费视频，以及Gemma 4下载量超过 5 亿次。这些更新覆盖模型生态、企业应用、视频工具和 AI 基础设施多个方向。

𝕏 Xiaomi MiMo Orbit 面向全球发放 100 万亿 Token 权益

Xiaomi MiMo Orbit计划在4 月 28 日至 5 月 28 日期间发放100T Credits，面向全球 AI 用户开放申请。该活动可为开发者和 AI 用户提供大规模 Token 额度，用于体验或测试小米 MiMo 相关模型能力。

𝕏 Warp Agent 新增自动开放权重模型路由模式

Warp Agent推出auto open-weights模式，可按任务复杂度自动路由至前沿开放权重模型，以降低 token 成本并改善开发体验。该功能适合在代码生成、调试和自动化任务中按需选择不同能力与价格的模型。

𝕏 OpenRouter 上线免费 LLM 响应缓存，降低重复请求成本

OpenRouter上线免费LLM 响应缓存能力，可减少重复请求带来的成本，尤其适合多模型 API 调用、测试评估和高频相似请求场景。该功能有助于开发者在不改变上层应用逻辑的情况下优化推理支出。

Anthropic 与 FIS 合作开发银行反金融犯罪 AI 代理

Anthropic与FIS合作开发面向银行的AI 代理，用于帮助金融机构打击金融犯罪。该合作聚焦银行合规、风险识别和反金融犯罪流程，属于 AI 在金融行业垂直场景中的落地应用。

EVENT-DRIVEN INTELLIGENCE

免费先跟踪重点，再决定是否升级

每篇公开内容都对应三步：订阅每日情报、查看同主题历史上下文、升级 Pro 解锁搜索、研究和事件详情。

订阅每日情报查看同主题历史事件升级 Pro 解锁搜索 / 研究 / 事件详情

NEXT STEP · 留下邮箱

获取下一次重大事件提醒

每天一封精选情报，先用邮件建立复访，再决定是否升级到更深的追踪能力。

查看同主题历史事件升级 Pro 解锁事件详情