05月21日 · 科技晚报

天眼晚报

科技|2026年05月21日|73 分钟阅读
来源:1466 条推文 + 461 篇 RSS 文章·Lanyun·BatchV2 生成·2026-05-21
分享
AI 速读10 条精选

🤖 AI 大模型

𝕏 OpenAI 推理模型被称自主推翻 Erdős 1946 年平面单位距离猜想

OpenAI通用推理模型被称找到反例,推翻数学家 Erdős 于 1946 年提出的平面单位距离问题相关猜想,并给出优于传统网格的新构造。该结果据称已由外部顶级数学家验证,标志着 AI 可能从数学辅助工具迈向能独立发现新路径的研究者角色。

𝕏 Anthropic Q2 营收翻倍并首次实现经营性盈利

Anthropic宣布第二季度营收达到 109 亿美元,较第一季度增长超过两倍,并首次实现经营性盈利。这一里程碑打破了前沿大模型公司只能依赖烧钱换增长的叙事,也为行业确立了更清晰的商业化可行性标杆。

𝕏 Cursor 发布 Composer 2.5,编码智能体评测第三且单任务成本仅 0.07 美元

Cursor发布新一代代码智能体 Composer 2.5,在 Artificial Analysis 编码 Agent 指数中得 62 分、排名第三。其标准模式单任务成本仅 0.07 美元,Fast 模式为 0.44 美元,同时 SWE-Bench-Pro-Hard-AA 得分提升至 47%,显著改善代码生成的成本效益。

𝕏 Google 发布 Gemini 3.5 Flash,编码与 Agent 任务表现超过 3.1 Pro

Google在 I/O 大会上推出 Gemini 3.5 Flash,定位为高性价比的代理与编码模型。Demis Hassabis 称其在编码和 Agent 任务上优于 3.1 Pro,速度提升 4 倍,在 Antigravity 中可达 800 tokens/秒,成本降至同类模型一半以下。

𝕏 Pluralis 发布 Agora,可用分散消费级 GPU 预训练模型

Pluralis发布 Agora 预训练栈,面向非同机房、分散式消费级 GPU 的大模型训练场景。官方称其在该环境下比 Megatron-LM15 倍,相较 H100 上 TorchTitan 的算力效率仅低 1.5 倍,为低成本分布式预训练提供新路径。

𝕏 腾讯混元开源 Hy-MT2 多语种翻译模型,1.8B 量化版仅 440MB

腾讯混元开源多语种翻译模型 Hy-MT2支持 33 种语言 和 5 种中文方言互译。其 1.8B 轻量版经 1.25-bit 量化 后仅约 440MB,可在 Apple A15 等移动芯片上本地离线推理,降低端侧翻译部署门槛。

𝕏 阿里 Qwen3.7 Max 智能指数升至 56.6,上下文扩至 100 万 token

Qwen3.7 MaxArtificial Analysis 智能指数中得分 56.6,较 4 月的 Qwen3.6 Max Preview 提升 4.8 分。该模型上下文窗口扩展至 100 万 token,显示阿里最新旗舰模型正进一步接近前沿模型梯队。

𝕏 商汤开源 SenseNova U1,多模态图文一体模型强化复杂视觉生成

商汤开源 SenseNova U1,采用 MoT 架构并去掉视觉编码器和 VAE,在单一模型中同时处理图文理解与生成。该模型将多模态生成视为统一问题而非链式调用,信息图任务比 Qwen-Image-2.0Seedream-4.5 快约 2 倍,适合海报、图表等复杂视觉内容生成。

𝕏 Google 推出 Antigravity CLI,统一 Gemini CLI 与多智能体工具生态

Google宣布将 Gemini CLI 正式迁移至全新的 Antigravity CLI 命令行工具,整合为统一的多智能体平台。用户需在 6 月 18 日 前完成迁移,以适配未来基于 Antigravity 构建的工具生态和开发工作流。

𝕏 Stability AI 发布 Stable Audio 3.0,开放权重音频模型支持无 GPU 作曲

Stability AI推出开放权重音频模型 Stable Audio 3.0支持最长 6 分钟 的变量长度音频生成和完整歌曲创作。该模型可在便携设备上无需 GPU 运行,支持 LoRA 自定义训练,输出内容可在年收入 100 万美元以内商业化使用。

𝕏 Cohere 开源 Command A+,以 Apache 2.0 发布企业级大模型

Cohere发布并开源 Command A+,称其为公司当前最强大的大语言模型。该模型具备 218B 总参数和 25B 激活参数,采用 Apache 2.0 许可证,强调高性能多语言能力与低硬件资源部署,面向企业级开源商用场景。

𝕏 Hugging Face 开源基因组基础模型 Carbon,处理速度提升 275 倍

Hugging Face开源基因组基础模型 Carbon,采用独特的 6 碱基分词器技术。相比最佳现有模型,其处理速度提升 275 倍,使得在单块 GPU 上 2 天内 完成人类全基因组模拟成为可能,有望加速生物医学研究。

xAI 2025 年收入 32 亿美元、运营亏损 64 亿美元

SpaceX招股文件披露,xAI 2025 年收入 32 亿美元、运营亏损 64 亿美元;相比之下,2024 年收入为 26.2 亿美元、亏损 15.6 亿美元。数据体现 xAI 收入增长的同时,训练与基础设施投入仍带来高额亏损。

𝕏 Google 披露 AI Token 处理量两年增长超 300 倍

Google披露其平台月处理 Token 从 2024 年 5 月 9.7T 增至 2026 年 5 月 3.2Q+。这一增长超过 300 倍,反映 Gemini 与相关 AI 服务调用规模快速扩大,也显示云端模型推理需求持续上升。

𝕏 Google 推出 Gemini Omni,支持视频多轮编辑与角色替换

Google推出 Gemini Omni,可根据视频、图片和自然语言生成或编辑内容。该模型支持 角色替换、背景修改和多轮一致性编辑,面向更复杂的图像与视频生成工作流。

白宫拟发布 AI 与网络安全行政令,强化尖端模型审查

特朗普政府最早可能在 5 月 21 日 发布 AI 与网络安全行政令,要求联邦机构强化 AI 尖端模型 安全审查。该政策若落地,将进一步提高美国政府对前沿模型风险、网络安全与合规评估的监管力度。

𝕏 Atomic Chat 展示 MTP 技术,本地 Qwen 推理速度翻倍

Atomic Chat展示 MTP(多令牌预测) 技术在本地 LLM 部署中的加速效果。在 RTX 5090 双卡环境下,Qwen 27B 推理速度从 51 提升至 117 tokens/s,MoE 35B 也从 218 提升至 267 tokens/s,且准确率无损。

𝕏 Google AI Studio 支持原生 Android 开发,可用提示词生成应用

Google AI Studio新增 原生 Android 开发支持,允许开发者通过自然语言提示词构建应用。该能力将 Gemini 相关开发流程进一步延伸到移动端原生应用场景,降低 Android 原型开发和功能生成门槛。

𝕏 Google Antigravity 全档位速率限制提升 3 倍

Google Antigravity将所有档位的速率限制提升 3 倍,方便开发者更高频地测试 3.5 Flash。这一调整有助于降低代理和编码任务实验中的调用瓶颈,提升新模型评测与集成效率。


EVENT-DRIVEN INTELLIGENCE

免费先跟踪重点,再决定是否升级

每篇公开内容都对应三步:订阅每日情报、查看同主题历史上下文、升级 Pro 解锁搜索、研究和事件详情。

分享

NEXT STEP · 留下邮箱

获取下一次重大事件提醒

每天一封精选情报,先用邮件建立复访,再决定是否升级到更深的追踪能力。