05月22日 · 科技早报

天眼早报

科技|2026年05月22日|100 分钟阅读
来源:1382 条推文 + 262 篇 RSS 文章·Lanyun·BatchV2 生成·2026-05-21 — 2026-05-22
分享
AI 速读16 条精选

🤖 AI 大模型

𝕏 OpenAI Codex 新增 Appshots 与锁屏远程控制

OpenAI更新Codex,推出Appshots功能,双击 Command 可读取 Mac 应用窗口完整文本上下文而非仅截图。新增锁屏使用模式,支持手机端在Mac 锁屏或熄屏状态下安全远程操控后台任务。配合Goals目标模式,实现跨天复杂任务自动化执行,彻底改变人机交互体验。

𝕏 阿里通义发布 Qwen3.7-Max 并登陆 OpenRouter

阿里巴巴发布闭源模型Qwen3.7-Max,专为智能体长程任务设计,支持35 小时连续自主执行及1158 次工具调用,内核优化使任务提速10 倍。该模型已上线OpenRouter,面向编码、办公生产力及长程自主执行,支持显式提示缓存。同时,本地部署通过MTP技术大幅提速,Qwen 27B51升至117 tokens/s,35B-A3B 在双卡环境下达267 tokens/s

𝕏 Google IO 发布 Gemini Omni 模型集成 Flow 平台

GoogleIO 大会上推出 Gemini Omni模型,支持多模态视频生成与音乐创作。新模型集成至 Google Flow(视频)和 Pomelli(品牌内容),支持一键生成网站、品牌手册及Lyria 3 Pro音乐制作,标志着 Google 在多模态生成领域的重大进展。

𝕏 Google 发布 Gemini 3.5 Flash 及定价整合策略

Google正式发布Gemini 3.5 Flash,定位为最强Agent与代码模型,推理速度达同级前沿模型4 倍且成本减半。该模型在APEX-Agents-AA基准中登顶,超越更大尺寸模型。针对定价争议,Logan Kilpatrick确认3.5 Flash将转向代码和 Agent 场景,Gemini CLI将并入Antigravity统一入口。此外,Google AI Studio推出iOSAndroid原生应用支持移动端vibe codingGemini Daily Brief向美国付费用户开放生成待办简报功能。

𝕏 腾讯开源 Hy-MT2 翻译模型及多语种能力

腾讯混元开源Hy-MT2多语种翻译模型,覆盖33 种语言。其轻量版1.8B1.25-bit 量化后仅440MB,可在主流移动芯片本地推理;7B 和 30B-A3B 版本性能超越微软等商业 API。该系列模型旨在对标更大通用 LLM 的翻译质量,并在多项任务中达到 SOTA,速度比前代快1.5 倍

𝕏 Text Arena:GPT-4 级质量成本两年降约 500 倍

Text Arena数据显示,GPT-4 级模型成本从 2023 年约50 美元/百万 token降至约0.10 美元,降幅达500 倍。同时,低价模型与顶级模型的性能差距缩至约60 分,显示行业在性价比上的巨大进步。

𝕏 Cohere Command A+ 开源量化及榜单表现

Cohere Command A+已在Hugging Face提供W4A4 量化版本,官方称显著降低部署占用且性能几乎无损。该模型在Vals Index开放权重模型中排第5,闭源模型综合榜排第18,支持128k上下文和64k输出,展现强大的长文本处理能力。

𝕏 Stability AI 开源 Stable Audio 3.0 中小模型

Stability AI开源Stable Audio 3.0 Small 和 Medium 版本,Large 版本仍保留通过 API 使用。此举降低了音频生成的门槛,允许更多开发者在本地或低成本环境中进行音频创作实验。

𝕏 LongMINT 提出长程 Agent 记忆评测框架

LongMINT提出一种新的长程 Agent 记忆评测框架,专门评估长程 Agent 系统在多目标干扰下的记忆保持与检索能力,为衡量智能体长期任务的可靠性提供了新的标准。


EVENT-DRIVEN INTELLIGENCE

免费先跟踪重点,再决定是否升级

每篇公开内容都对应三步:订阅每日情报、查看同主题历史上下文、升级 Pro 解锁搜索、研究和事件详情。

分享

NEXT STEP · 留下邮箱

获取下一次重大事件提醒

每天一封精选情报,先用邮件建立复访,再决定是否升级到更深的追踪能力。