05月20日 · 科技早报

天眼早报

科技|2026年05月20日|91 分钟阅读
来源:1813 条推文 + 269 篇 RSS 文章·Lanyun·BatchV2 生成·2026-05-19 — 2026-05-20
分享
AI 速读20 条精选

🤖 AI 大模型

𝕏 Google 发布 Gemini 3.5 Flash,主打智能体、编码与高吞吐

GoogleGoogle I/O 2026 正式发布 Gemini 3.5 Flash,定位为面向智能体、编码和长任务的高性价比模型。该模型支持 100 万 token 上下文和约 6.5 万 token 输出,在 Terminal-Bench、GDPval-AA、MCP Atlas 等基准上超过上一代 Pro 系列;官方称速度达同级前沿模型 4 倍、成本低于一半,并已在 Gemini App、AI Mode、Gemini API 等渠道开放。

𝕏 Google 推出 Gemini Omni,多模态统一模型聚焦视频生成与编辑

Google DeepMind发布 Gemini Omni,定位为原生多模态统一模型,可接收文本、图像、音频和视频等任意输入,并生成或编辑动态视频场景。模型强调角色一致性、物理理解、自然语言视频编辑和真实世界推理,首批能力面向视频生成、多模态编辑和文本编辑图片;Omni Flash 已向 Google AI Plus、Pro、Ultra 用户开放,并将进入 Flow、YouTube Shorts 与开发者 API。

𝕏 Google 发布 Gemini Spark,推出 24/7 个人 AI 代理

Google在 Google I/O 上推出 Gemini Spark,这是一款基于 Gemini 3.5 的全天候个人 AI Agent。它运行在 Google Cloud 独立虚拟机上,可连接 Gmail、Docs、Sheets 等生态应用,自动总结邮件、回复并协调任务;同时支持长任务执行,未来还将集成 MCP 协议以调用第三方工具。

𝕏 Google Cloud 发布 Managed Agents API,内置代码执行与沙箱环境

Google Cloud推出 Managed Agents,允许开发者通过单次 API 调用创建具备代码执行、网页浏览和文件管理能力的智能体。该功能基于 Antigravity 框架,在隔离 Linux 沙箱中运行 Bash、Python 和 Node.js,并支持挂载 GitHub 仓库。

𝕏 Andrej Karpathy 加入 Anthropic,重返前沿大模型研发

Andrej Karpathy宣布加入 Anthropic,称未来几年是 LLM 前沿研究 的关键形成期,将回到一线研发工作。他曾是 OpenAI 创始成员,并领导过特斯拉 Autopilot 视觉栈;Karpathy 同时表示,未来仍会继续投入 AI 教育相关项目。

𝕏 Hugging Face 开源 Carbon DNA 基础模型,基因组处理速度提升 275 倍

Hugging Face开源 Carbon 系列 DNA 基础模型,采用独特的 6-mer token 技术,使人类全基因组处理时间缩短至 2 天以内,速度比现有 SOTA 模型快 275 倍。模型支持基因序列生成、突变效应预测和蛋白质折叠重构等任务。

𝕏 Cerebras 企业试运行 Kimi K2.6,万亿参数模型约达 1000 tokens/s

Cerebras称已在企业试用中运行 Kimi K2.6 万亿参数模型,第三方评测机构 Artificial Analysis 测得其生成速度约为 1000 tokens/s。这一结果显示专用推理硬件在超大参数模型低延迟部署上的潜力。

𝕏 OpenRouter 上线 Gemini 3.5 Flash,支持 100 万上下文

OpenRouter上线 Gemini 3.5 Flash,支持 100 万上下文 和约 6.5 万 token 输出。其公开价格为每百万输入 token 1.50 美元、每百万输出 token 9 美元,为开发者提供除 Gemini 官方渠道外的模型调用入口。

𝕏 通义实验室发布 Qwen3.5-LiveTranslate,支持 3500+ 语言对实时翻译

通义实验室推出 Qwen3.5-LiveTranslate,新一代实时翻译系统支持 3500+语言对,具备超低延迟、视觉上下文理解和 实时语音克隆 功能。该模型面向跨语言沟通和内容本地化场景,目标是提供更自然的实时多模态翻译体验。

𝕏 Google 披露 Gemini 使用规模:月活超 9 亿,每月处理 3.2 千万亿 token

Google披露 Gemini 产品使用规模快速增长:Gemini App 用户一年内增长超过 2 倍,月活从 2025 年 5 月的 4 亿增至 2026 年 4 月的 9 亿+。Google 还表示,其 AI 生态每月处理约 3.2 千万亿 token,较去年增长约 7 倍。

𝕏 LlamaIndex 集成 Google Agents API,构建文档自动处理工作流

LlamaIndex团队发布模板,将 Google Agents APILlamaParse 结合,使智能体能在沙箱环境中直接处理非结构化文档。开发者只需配置 Git 仓库并安装 CLI,即可让智能体自主读取、解析并输出文档内容,适合自动化文档处理工作流。

𝕏 Anthropic 调整 Sonnet 4.5 停服策略,引发用户抗议

面对用户抗议,AnthropicSonnet 4.5 停服日期从具体日期改为“近期”,并针对部分用户进行 A/B 测试。用户发起请愿活动,目标收集 3000 份签名,并向 FTC 提交投诉,要求保障模型连续性和用户迁移权利。

𝕏 OpenAI 推出 Guaranteed Capacity,企业可锁定长期算力

OpenAI推出 Guaranteed Capacity,为企业关键工作负载提供长期 token 容量和算力确定性。Sam Altman 表示,客户可通过 1 至 3 年 承诺换取折扣 token 和稳定容量,反映 OpenAI 对未来 算力紧张 的持续判断。

𝕏 ModelScope 上线 SenseNova-U1-8B-MoT-Infographic

ModelScope上线 SenseNova-U1-8B-MoT-Infographic,该模型面向信息图理解与生成场景,支持海报、图表和多栏页面等复杂版式。部署方面,Q4 量化版本约需 10-12GB VRAM,适合在较低显存环境中尝试多模态文档与视觉内容处理。

𝕏 Box 评测 Gemini 3.5 Flash:复杂文档任务提升 12 个百分点

Box AI Complex Work Eval显示 Gemini 3.5 Flash 在金融、公共部门、医疗和生命科学等复杂文档任务中均有提升,总分提高 12 个百分点。该评测强调模型在企业文档理解、抽取和分析场景中的实际改进。

𝕏 GitHub Copilot 接入 Gemini 3.5 Flash

GitHub Copilot接入 Gemini 3.5 Flash,面向 VS Code 中的快速智能体编程流程。该集成使开发者可在 Copilot 环境中调用 Google 最新低延迟模型,用于代码生成、编辑和短周期代理式开发。

𝕏 DeepSeek 回应特殊字符异常:属于模型幻觉而非安全问题

DeepSeek回应称,用户输入 后出现异常内容属于 模型幻觉,不涉及安全问题或隐私泄露。该说明将相关现象归因于模型生成机制,而非系统被攻击、数据外泄或隐藏提示词泄露。

𝕏 Kaggle Benchmarks 加入 Gemini 3.5 Flash 免费评测

Kaggle Benchmarks新增 Gemini 3.5 Flash,用户可使用自定义任务免费压测该模型,并通过统一 API 与主流模型横向比较。该功能为研究者和开发者提供了更便捷的模型基准测试入口。

𝕏 Cursor 发布 Composer 2.5,强化长任务与复杂指令执行

Cursor推出 Composer 2.5,重点提升长时间任务、复杂指令跟随和代码生成可靠性。官方还临时加倍模型使用额度,以便用户测试新版本在多步骤编程、持续编辑和代理式开发中的表现。

𝕏 马斯克称 Anthropic 的 AI+harness 能力不止于编程

Elon Musk表示,AnthropicAI+harness 能力超越编程场景,并称 Opus 4.7 仍强于 Composer 2.5,但价格更高。这一表态更多是对模型与工具链组合能力的评价,也与近期开发者对代理式编程工具的比较有关。


EVENT-DRIVEN INTELLIGENCE

免费先跟踪重点,再决定是否升级

每篇公开内容都对应三步:订阅每日情报、查看同主题历史上下文、升级 Pro 解锁搜索、研究和事件详情。

分享

NEXT STEP · 留下邮箱

获取下一次重大事件提醒

每天一封精选情报,先用邮件建立复访,再决定是否升级到更深的追踪能力。