天眼早报

科技|2026年05月20日|约 91 分钟阅读

来源：1813 条推文 + 269 篇 RSS 文章·Lanyun·BatchV2 生成·2026-05-19 — 2026-05-20

AI 速读20 条精选

🤖 AI 大模型

𝕏 Google 发布 Gemini 3.5 Flash，主打智能体、编码与高吞吐

Google在 Google I/O 2026 正式发布 Gemini 3.5 Flash，定位为面向智能体、编码和长任务的高性价比模型。该模型支持 100 万 token 上下文和约 6.5 万 token 输出，在 Terminal-Bench、GDPval-AA、MCP Atlas 等基准上超过上一代 Pro 系列；官方称速度达同级前沿模型 4 倍、成本低于一半，并已在 Gemini App、AI Mode、Gemini API 等渠道开放。

𝕏 Google 推出 Gemini Omni，多模态统一模型聚焦视频生成与编辑

Google DeepMind发布 Gemini Omni，定位为原生多模态统一模型，可接收文本、图像、音频和视频等任意输入，并生成或编辑动态视频场景。模型强调角色一致性、物理理解、自然语言视频编辑和真实世界推理，首批能力面向视频生成、多模态编辑和文本编辑图片；Omni Flash 已向 Google AI Plus、Pro、Ultra 用户开放，并将进入 Flow、YouTube Shorts 与开发者 API。

𝕏 Google 发布 Gemini Spark，推出 24/7 个人 AI 代理

Google在 Google I/O 上推出 Gemini Spark，这是一款基于 Gemini 3.5 的全天候个人 AI Agent。它运行在 Google Cloud 独立虚拟机上，可连接 Gmail、Docs、Sheets 等生态应用，自动总结邮件、回复并协调任务；同时支持长任务执行，未来还将集成 MCP 协议以调用第三方工具。

𝕏 Google Cloud 发布 Managed Agents API，内置代码执行与沙箱环境

Google Cloud推出 Managed Agents，允许开发者通过单次 API 调用创建具备代码执行、网页浏览和文件管理能力的智能体。该功能基于 Antigravity 框架，在隔离 Linux 沙箱中运行 Bash、Python 和 Node.js，并支持挂载 GitHub 仓库。

𝕏 Andrej Karpathy 加入 Anthropic，重返前沿大模型研发

Andrej Karpathy宣布加入 Anthropic，称未来几年是 LLM 前沿研究 的关键形成期，将回到一线研发工作。他曾是 OpenAI 创始成员，并领导过特斯拉 Autopilot 视觉栈；Karpathy 同时表示，未来仍会继续投入 AI 教育相关项目。

𝕏 Hugging Face 开源 Carbon DNA 基础模型，基因组处理速度提升 275 倍

Hugging Face开源 Carbon 系列 DNA 基础模型，采用独特的 6-mer token 技术，使人类全基因组处理时间缩短至 2 天以内，速度比现有 SOTA 模型快 275 倍。模型支持基因序列生成、突变效应预测和蛋白质折叠重构等任务。

𝕏 Cerebras 企业试运行 Kimi K2.6，万亿参数模型约达 1000 tokens/s

Cerebras称已在企业试用中运行 Kimi K2.6 万亿参数模型，第三方评测机构 Artificial Analysis 测得其生成速度约为 1000 tokens/s。这一结果显示专用推理硬件在超大参数模型低延迟部署上的潜力。

𝕏 OpenRouter 上线 Gemini 3.5 Flash，支持 100 万上下文

OpenRouter上线 Gemini 3.5 Flash，支持 100 万上下文 和约 6.5 万 token 输出。其公开价格为每百万输入 token 1.50 美元、每百万输出 token 9 美元，为开发者提供除 Gemini 官方渠道外的模型调用入口。

𝕏 通义实验室发布 Qwen3.5-LiveTranslate，支持 3500+ 语言对实时翻译

通义实验室推出 Qwen3.5-LiveTranslate，新一代实时翻译系统支持 3500+语言对，具备超低延迟、视觉上下文理解和 实时语音克隆 功能。该模型面向跨语言沟通和内容本地化场景，目标是提供更自然的实时多模态翻译体验。

𝕏 Google 披露 Gemini 使用规模：月活超 9 亿，每月处理 3.2 千万亿 token

Google披露 Gemini 产品使用规模快速增长：Gemini App 用户一年内增长超过 2 倍，月活从 2025 年 5 月的 4 亿增至 2026 年 4 月的 9 亿+。Google 还表示，其 AI 生态每月处理约 3.2 千万亿 token，较去年增长约 7 倍。

𝕏 LlamaIndex 集成 Google Agents API，构建文档自动处理工作流

LlamaIndex团队发布模板，将 Google Agents API 与 LlamaParse 结合，使智能体能在沙箱环境中直接处理非结构化文档。开发者只需配置 Git 仓库并安装 CLI，即可让智能体自主读取、解析并输出文档内容，适合自动化文档处理工作流。

𝕏 Anthropic 调整 Sonnet 4.5 停服策略，引发用户抗议

面对用户抗议，Anthropic将 Sonnet 4.5 停服日期从具体日期改为“近期”，并针对部分用户进行 A/B 测试。用户发起请愿活动，目标收集 3000 份签名，并向 FTC 提交投诉，要求保障模型连续性和用户迁移权利。

𝕏 OpenAI 推出 Guaranteed Capacity，企业可锁定长期算力

OpenAI推出 Guaranteed Capacity，为企业关键工作负载提供长期 token 容量和算力确定性。Sam Altman 表示，客户可通过 1 至 3 年 承诺换取折扣 token 和稳定容量，反映 OpenAI 对未来 算力紧张 的持续判断。

𝕏 ModelScope 上线 SenseNova-U1-8B-MoT-Infographic

ModelScope上线 SenseNova-U1-8B-MoT-Infographic，该模型面向信息图理解与生成场景，支持海报、图表和多栏页面等复杂版式。部署方面，Q4 量化版本约需 10-12GB VRAM，适合在较低显存环境中尝试多模态文档与视觉内容处理。

𝕏 Box 评测 Gemini 3.5 Flash：复杂文档任务提升 12 个百分点

Box AI Complex Work Eval显示 Gemini 3.5 Flash 在金融、公共部门、医疗和生命科学等复杂文档任务中均有提升，总分提高 12 个百分点。该评测强调模型在企业文档理解、抽取和分析场景中的实际改进。

𝕏 GitHub Copilot 接入 Gemini 3.5 Flash

GitHub Copilot接入 Gemini 3.5 Flash，面向 VS Code 中的快速智能体编程流程。该集成使开发者可在 Copilot 环境中调用 Google 最新低延迟模型，用于代码生成、编辑和短周期代理式开发。

𝕏 DeepSeek 回应特殊字符异常：属于模型幻觉而非安全问题

DeepSeek回应称，用户输入后出现异常内容属于 模型幻觉，不涉及安全问题或隐私泄露。该说明将相关现象归因于模型生成机制，而非系统被攻击、数据外泄或隐藏提示词泄露。

𝕏 Kaggle Benchmarks 加入 Gemini 3.5 Flash 免费评测

Kaggle Benchmarks新增 Gemini 3.5 Flash，用户可使用自定义任务免费压测该模型，并通过统一 API 与主流模型横向比较。该功能为研究者和开发者提供了更便捷的模型基准测试入口。

𝕏 Cursor 发布 Composer 2.5，强化长任务与复杂指令执行

Cursor推出 Composer 2.5，重点提升长时间任务、复杂指令跟随和代码生成可靠性。官方还临时加倍模型使用额度，以便用户测试新版本在多步骤编程、持续编辑和代理式开发中的表现。

𝕏 马斯克称 Anthropic 的 AI+harness 能力不止于编程

Elon Musk表示，Anthropic 的 AI+harness 能力超越编程场景，并称 Opus 4.7 仍强于 Composer 2.5，但价格更高。这一表态更多是对模型与工具链组合能力的评价，也与近期开发者对代理式编程工具的比较有关。

EVENT-DRIVEN INTELLIGENCE

免费先跟踪重点，再决定是否升级

每篇公开内容都对应三步：订阅每日情报、查看同主题历史上下文、升级 Pro 解锁搜索、研究和事件详情。

订阅每日情报查看同主题历史事件升级 Pro 解锁搜索 / 研究 / 事件详情

NEXT STEP · 留下邮箱

获取下一次重大事件提醒

每天一封精选情报，先用邮件建立复访，再决定是否升级到更深的追踪能力。

查看同主题历史事件升级 Pro 解锁事件详情