天眼晚报

科技|2026年05月21日|约 73 分钟阅读

来源：1466 条推文 + 461 篇 RSS 文章·Lanyun·BatchV2 生成·2026-05-21

AI 速读10 条精选

🤖 AI 大模型

𝕏 OpenAI 推理模型被称自主推翻 Erdős 1946 年平面单位距离猜想

OpenAI通用推理模型被称找到反例，推翻数学家 Erdős 于 1946 年提出的平面单位距离问题相关猜想，并给出优于传统网格的新构造。该结果据称已由外部顶级数学家验证，标志着 AI 可能从数学辅助工具迈向能独立发现新路径的研究者角色。

𝕏 Anthropic Q2 营收翻倍并首次实现经营性盈利

Anthropic宣布第二季度营收达到 109 亿美元，较第一季度增长超过两倍，并首次实现经营性盈利。这一里程碑打破了前沿大模型公司只能依赖烧钱换增长的叙事，也为行业确立了更清晰的商业化可行性标杆。

𝕏 Cursor 发布 Composer 2.5，编码智能体评测第三且单任务成本仅 0.07 美元

Cursor发布新一代代码智能体 Composer 2.5，在 Artificial Analysis 编码 Agent 指数中得 62 分、排名第三。其标准模式单任务成本仅 0.07 美元，Fast 模式为 0.44 美元，同时 SWE-Bench-Pro-Hard-AA 得分提升至 47%，显著改善代码生成的成本效益。

𝕏 Google 发布 Gemini 3.5 Flash，编码与 Agent 任务表现超过 3.1 Pro

Google在 I/O 大会上推出 Gemini 3.5 Flash，定位为高性价比的代理与编码模型。Demis Hassabis 称其在编码和 Agent 任务上优于 3.1 Pro，速度提升 4 倍，在 Antigravity 中可达 800 tokens/秒，成本降至同类模型一半以下。

𝕏 Pluralis 发布 Agora，可用分散消费级 GPU 预训练模型

Pluralis发布 Agora 预训练栈，面向非同机房、分散式消费级 GPU 的大模型训练场景。官方称其在该环境下比 Megatron-LM 快 15 倍，相较 H100 上 TorchTitan 的算力效率仅低 1.5 倍，为低成本分布式预训练提供新路径。

𝕏 腾讯混元开源 Hy-MT2 多语种翻译模型，1.8B 量化版仅 440MB

腾讯混元开源多语种翻译模型 Hy-MT2，支持 33 种语言 和 5 种中文方言互译。其 1.8B 轻量版经 1.25-bit 量化 后仅约 440MB，可在 Apple A15 等移动芯片上本地离线推理，降低端侧翻译部署门槛。

𝕏 阿里 Qwen3.7 Max 智能指数升至 56.6，上下文扩至 100 万 token

Qwen3.7 Max在 Artificial Analysis 智能指数中得分 56.6，较 4 月的 Qwen3.6 Max Preview 提升 4.8 分。该模型上下文窗口扩展至 100 万 token，显示阿里最新旗舰模型正进一步接近前沿模型梯队。

𝕏 商汤开源 SenseNova U1，多模态图文一体模型强化复杂视觉生成

商汤开源 SenseNova U1，采用 MoT 架构并去掉视觉编码器和 VAE，在单一模型中同时处理图文理解与生成。该模型将多模态生成视为统一问题而非链式调用，信息图任务比 Qwen-Image-2.0 和 Seedream-4.5 快约 2 倍，适合海报、图表等复杂视觉内容生成。

𝕏 Google 推出 Antigravity CLI，统一 Gemini CLI 与多智能体工具生态

Google宣布将 Gemini CLI 正式迁移至全新的 Antigravity CLI 命令行工具，整合为统一的多智能体平台。用户需在 6 月 18 日 前完成迁移，以适配未来基于 Antigravity 构建的工具生态和开发工作流。

𝕏 Stability AI 发布 Stable Audio 3.0，开放权重音频模型支持无 GPU 作曲

Stability AI推出开放权重音频模型 Stable Audio 3.0，支持最长 6 分钟 的变量长度音频生成和完整歌曲创作。该模型可在便携设备上无需 GPU 运行，支持 LoRA 自定义训练，输出内容可在年收入 100 万美元以内商业化使用。

𝕏 Cohere 开源 Command A+，以 Apache 2.0 发布企业级大模型

Cohere发布并开源 Command A+，称其为公司当前最强大的大语言模型。该模型具备 218B 总参数和 25B 激活参数，采用 Apache 2.0 许可证，强调高性能多语言能力与低硬件资源部署，面向企业级开源商用场景。

𝕏 Hugging Face 开源基因组基础模型 Carbon，处理速度提升 275 倍

Hugging Face开源基因组基础模型 Carbon，采用独特的 6 碱基分词器技术。相比最佳现有模型，其处理速度提升 275 倍，使得在单块 GPU 上 2 天内 完成人类全基因组模拟成为可能，有望加速生物医学研究。

xAI 2025 年收入 32 亿美元、运营亏损 64 亿美元

SpaceX招股文件披露，xAI 2025 年收入 32 亿美元、运营亏损 64 亿美元；相比之下，2024 年收入为 26.2 亿美元、亏损 15.6 亿美元。数据体现 xAI 收入增长的同时，训练与基础设施投入仍带来高额亏损。

𝕏 Google 披露 AI Token 处理量两年增长超 300 倍

Google披露其平台月处理 Token 从 2024 年 5 月 9.7T 增至 2026 年 5 月 3.2Q+。这一增长超过 300 倍，反映 Gemini 与相关 AI 服务调用规模快速扩大，也显示云端模型推理需求持续上升。

𝕏 Google 推出 Gemini Omni，支持视频多轮编辑与角色替换

Google推出 Gemini Omni，可根据视频、图片和自然语言生成或编辑内容。该模型支持 角色替换、背景修改和多轮一致性编辑，面向更复杂的图像与视频生成工作流。

白宫拟发布 AI 与网络安全行政令，强化尖端模型审查

特朗普政府最早可能在 5 月 21 日 发布 AI 与网络安全行政令，要求联邦机构强化 AI 尖端模型 安全审查。该政策若落地，将进一步提高美国政府对前沿模型风险、网络安全与合规评估的监管力度。

𝕏 Atomic Chat 展示 MTP 技术，本地 Qwen 推理速度翻倍

Atomic Chat展示 MTP（多令牌预测） 技术在本地 LLM 部署中的加速效果。在 RTX 5090 双卡环境下，Qwen 27B 推理速度从 51 提升至 117 tokens/s，MoE 35B 也从 218 提升至 267 tokens/s，且准确率无损。

𝕏 Google AI Studio 支持原生 Android 开发，可用提示词生成应用

Google AI Studio新增 原生 Android 开发支持，允许开发者通过自然语言提示词构建应用。该能力将 Gemini 相关开发流程进一步延伸到移动端原生应用场景，降低 Android 原型开发和功能生成门槛。

𝕏 Google Antigravity 全档位速率限制提升 3 倍

Google Antigravity将所有档位的速率限制提升 3 倍，方便开发者更高频地测试 3.5 Flash。这一调整有助于降低代理和编码任务实验中的调用瓶颈，提升新模型评测与集成效率。

EVENT-DRIVEN INTELLIGENCE

免费先跟踪重点，再决定是否升级

每篇公开内容都对应三步：订阅每日情报、查看同主题历史上下文、升级 Pro 解锁搜索、研究和事件详情。

订阅每日情报查看同主题历史事件升级 Pro 解锁搜索 / 研究 / 事件详情

NEXT STEP · 留下邮箱

获取下一次重大事件提醒

每天一封精选情报，先用邮件建立复访，再决定是否升级到更深的追踪能力。

查看同主题历史事件升级 Pro 解锁事件详情