05月06日 · 科技晚报

天眼晚报

科技|2026年05月06日|89 分钟阅读
来源:1276 条推文 + 464 篇 RSS 文章·Lanyun·BatchV2 生成·2026-05-06
分享
AI 速读17 条精选

🤖 AI 大模型

🔶 Anthropic 承诺五年投入 2000 亿美元采购谷歌云服务与芯片

Anthropic宣布未来五年将在谷歌云累计投入2000 亿美元,以获取高达5 吉瓦的服务器算力。该协议将支撑 Claude Mythos 等模型训练,也使谷歌云业务储备收入中约 40% 来自这一单一客户。

𝕏 OpenAI 全量发布 GPT-5.5 Instant,并设为 ChatGPT 默认模型

OpenAI正式将 GPT-5.5 Instant 设为 ChatGPT 默认模型,面向所有用户开放,API 也可调用。新版本在医学、法律、金融等高风险场景中显著降低幻觉,虚假陈述较 GPT-5.3 减少52.5%,同时优化图片理解、文档解析和回答简洁度,并新增记忆来源可视化,允许用户更新、删除或取消关联相关记忆。

𝕏 SubQ 发布 1200 万 token 上下文模型,称 100 万 token 场景快 52 倍

SubQ发布基于SSA次二次稀疏注意力架构的前沿模型,支持1200 万 token上下文。在 B200 GPU 上,其 100 万 token 预填充速度据称较 FlashAttention-2 快 52.2 倍,成本低于 Opus 的 5%;不过相关性能数据仍需第三方复现验证。

🔵 中国大基金拟领投 DeepSeek 首轮融资,估值约 450 亿美元

中国大基金正洽谈领投DeepSeek首轮融资,目标估值约450 亿美元;腾讯也在讨论参与。报道还称梁文锋持股约89.5%,融资资金可能用于扩大算力资源和员工期权安排,该消息最早由金融时报披露并获彭博转引。

🔶 Kimi 即将完成 20 亿美元融资,投后估值突破 200 亿美元

月之暗面旗下Kimi即将完成新一轮20 亿美元融资,由美团龙珠领投,中国移动参投,投后估值突破 200 亿美元。本轮融资使其半年内累计融资超过 39 亿美元,成为大模型领域融资最多的公司之一。

Anthropic 发布面向金融服务企业的 Claude Agent 套件

Anthropic推出面向金融服务企业的Claude Agent套件,包括10 款面向银行和华尔街客户的智能体,覆盖融资演示、投行简报、估值审查、财务结账、信贷备忘录起草和合规流转等场景。该方案支持 Claude Cowork 与 Claude Code 部署,并优化了 Claude 在微软 365中的使用体验,同时扩大与 Dun & Bradstreet 的合作。

𝕏 Claude Code 2.1.129 新增插件 URL 导入与错误追踪 ID

Anthropic发布 Claude Code 2.1.129 版本,新增 --plugin-url 参数,支持从 URL 快速安装插件。此次更新还修复终端输出同步、OAuth 刷新竞态条件等 27 项问题,并在策略拒绝错误中增加 API Request ID,便于开发者定位和调试问题。

Google 为 Gemma 4 发布 MTP 草稿器,推理最高提速 3 倍

Google AIGemma 4发布MTP drafters,通过多 Token 预测与推测性解码提升推理效率,31B Dense 等模型推理最高提速3 倍,额外显存开销约 1GB,并声称不牺牲输出质量。该能力面向低延迟聊天、语音交互和端侧硬件等场景。

𝕏 腾讯混元 Hy3 preview 在 OpenRouter 周榜登顶

腾讯混元 Hy3 preview发布两周后,在OpenRouter周榜处理3.66 万亿 tokens,周增298%,占全平台 15.4% 份额。该表现显示其在开放模型路由平台上的调用量快速增长。

𝕏 谷歌、微软和 xAI 同意向美国政府提前提交 AI 模型

谷歌微软xAI同意在公开发布 AI 模型前,向特朗普政府提供早期版本,供美国政府评估模型功能与安全性。这意味着主要模型厂商将在发布流程中引入更前置的政府审查与风险评估环节。

𝕏 MiniMax-M2.7 接入 6 家推理服务商,SambaNova 输出达 435 token/s

MiniMax-M2.7已接入6 家推理服务商,其中SambaNova输出速度达到435 token/s,Fireworks 价格约为 0.22 美元/百万 token,处于性价比前沿。此次上线扩大了模型在第三方推理平台上的可用性。

𝕏 Perplexity 推出面向金融专业人士的 Computer 产品

Perplexity Computer面向金融专业人士推出,集成MorningstarPitchBook等数据源,提供35 种金融工作流,旨在把研究、分析和数据查询整合到 AI 驱动的专业工作台中。

𝕏 OpenAI Agents SDK 升级长时运行 Agent 能力

OpenAI Agents SDK新增沙箱运行、开源harness和可控记忆管理,强化长时运行 Agent 的测试、隔离执行与状态管理能力。这有助于开发者更稳定地构建可持续执行任务的智能体应用。

𝕏 vLLM 为 Gemma 4 系列提供首日 MTP 支持

vLLM上线Gemma 4系列 MTP 支持,并提供 Docker 镜像,方便开发者快速部署相关推理加速能力。该支持延续 Google MTP 草稿器的性能收益,解码性能最高可提升3 倍

𝕏 OpenDesign 开源项目上线,提供本地部署的 Claude Design 替代方案

开发者推出 OpenDesign 开源项目,作为 Claude Design 的平替方案。该项目支持本地部署并自由接入各类模型,可生成 PPT、Web 页面及 GUI 界面,为设计工作流提供低成本、高自由度的替代选择。

𝕏 Anthropic 披露 Claude 对话中约 6% 涉及人生决策咨询

Anthropic数据显示,Claude约**6%**对话涉及人生决策咨询,包括工作选择、搬家、冲突处理等议题。该数据反映出通用 AI 助手正在从信息查询扩展到更具个人化和情境化的建议场景。

𝕏 商汤称 SenseNova U1 生图成本仅为 OpenAI 图像模型十分之一

商汤科技SenseNova U1生图成本仅为ChatGPT Images 2.0的十分之一,并正将相关业务重点转向东南亚、中东和巴西市场。该表态强调其在图像生成成本与海外商业化上的竞争策略。

𝕏 中国移动发布 AI-eSIM,尝试在芯片层接入云端大模型

中国移动发布AI-eSIM,尝试在芯片层集成 AI 能力,使设备可调用云端大模型。该方案将通信身份、终端能力与模型服务进一步结合,探索更底层的智能连接入口。


EVENT-DRIVEN INTELLIGENCE

免费先跟踪重点,再决定是否升级

每篇公开内容都对应三步:订阅每日情报、查看同主题历史上下文、升级 Pro 解锁搜索、研究和事件详情。

分享

NEXT STEP · 留下邮箱

获取下一次重大事件提醒

每天一封精选情报,先用邮件建立复访,再决定是否升级到更深的追踪能力。