天眼早报

科技|2026年05月22日|约 100 分钟阅读

来源：1382 条推文 + 262 篇 RSS 文章·Lanyun·BatchV2 生成·2026-05-21 — 2026-05-22

AI 速读16 条精选

🤖 AI 大模型

𝕏 OpenAI Codex 新增 Appshots 与锁屏远程控制

OpenAI更新Codex，推出Appshots功能，双击 Command 可读取 Mac 应用窗口完整文本上下文而非仅截图。新增锁屏使用模式，支持手机端在Mac 锁屏或熄屏状态下安全远程操控后台任务。配合Goals目标模式，实现跨天复杂任务自动化执行，彻底改变人机交互体验。

𝕏 阿里通义发布 Qwen3.7-Max 并登陆 OpenRouter

阿里巴巴发布闭源模型Qwen3.7-Max，专为智能体长程任务设计，支持35 小时连续自主执行及1158 次工具调用，内核优化使任务提速10 倍。该模型已上线OpenRouter，面向编码、办公生产力及长程自主执行，支持显式提示缓存。同时，本地部署通过MTP技术大幅提速，Qwen 27B从51升至117 tokens/s，35B-A3B 在双卡环境下达267 tokens/s。

𝕏 Google IO 发布 Gemini Omni 模型集成 Flow 平台

Google在 IO 大会上推出 Gemini Omni模型，支持多模态视频生成与音乐创作。新模型集成至 Google Flow（视频）和 Pomelli（品牌内容），支持一键生成网站、品牌手册及Lyria 3 Pro音乐制作，标志着 Google 在多模态生成领域的重大进展。

𝕏 Google 发布 Gemini 3.5 Flash 及定价整合策略

Google正式发布Gemini 3.5 Flash，定位为最强Agent与代码模型，推理速度达同级前沿模型4 倍且成本减半。该模型在APEX-Agents-AA基准中登顶，超越更大尺寸模型。针对定价争议，Logan Kilpatrick确认3.5 Flash将转向代码和 Agent 场景，Gemini CLI将并入Antigravity统一入口。此外，Google AI Studio推出iOS和Android原生应用支持移动端vibe coding，Gemini Daily Brief向美国付费用户开放生成待办简报功能。

𝕏 腾讯开源 Hy-MT2 翻译模型及多语种能力

腾讯混元开源Hy-MT2多语种翻译模型，覆盖33 种语言。其轻量版1.8B经1.25-bit 量化后仅440MB，可在主流移动芯片本地推理；7B 和 30B-A3B 版本性能超越微软等商业 API。该系列模型旨在对标更大通用 LLM 的翻译质量，并在多项任务中达到 SOTA，速度比前代快1.5 倍。

𝕏 Text Arena：GPT-4 级质量成本两年降约 500 倍

Text Arena数据显示，GPT-4 级模型成本从 2023 年约50 美元/百万 token降至约0.10 美元，降幅达500 倍。同时，低价模型与顶级模型的性能差距缩至约60 分，显示行业在性价比上的巨大进步。

𝕏 Cohere Command A+ 开源量化及榜单表现

Cohere Command A+已在Hugging Face提供W4A4 量化版本，官方称显著降低部署占用且性能几乎无损。该模型在Vals Index开放权重模型中排第5，闭源模型综合榜排第18，支持128k上下文和64k输出，展现强大的长文本处理能力。

𝕏 Stability AI 开源 Stable Audio 3.0 中小模型

Stability AI开源Stable Audio 3.0 Small 和 Medium 版本，Large 版本仍保留通过 API 使用。此举降低了音频生成的门槛，允许更多开发者在本地或低成本环境中进行音频创作实验。

𝕏 LongMINT 提出长程 Agent 记忆评测框架

LongMINT提出一种新的长程 Agent 记忆评测框架，专门评估长程 Agent 系统在多目标干扰下的记忆保持与检索能力，为衡量智能体长期任务的可靠性提供了新的标准。

EVENT-DRIVEN INTELLIGENCE

免费先跟踪重点，再决定是否升级

每篇公开内容都对应三步：订阅每日情报、查看同主题历史上下文、升级 Pro 解锁搜索、研究和事件详情。

订阅每日情报查看同主题历史事件升级 Pro 解锁搜索 / 研究 / 事件详情

NEXT STEP · 留下邮箱

获取下一次重大事件提醒

每天一封精选情报，先用邮件建立复访，再决定是否升级到更深的追踪能力。

查看同主题历史事件升级 Pro 解锁事件详情