天眼晚报
🤖 AI 大模型
𝕏 Google 发布 Gemini Intelligence,Android 升级为主动式 AI 系统
Google正式发布Gemini Intelligence,将Android定位为主动型AI系统。该功能支持跨 App 自动化、Chrome 助手及智能填表,并推出自然语言生成桌面组件的能力。配合即将发布的Googlebook硬件(搭载Magic Pointer),谷歌试图打造深度集成AI的操作系统。首批设备预计今年夏季首发于Galaxy S26与Pixel 10,秋季发售更多机型,标志着手机交互从被动响应转向主动智能服务。
𝕏 Stanford 发布 Shepherd:首个支持 Git 式版本控制的元智能体运行时
Stanford团队推出Shepherd系统,将Agent执行视为函数,引入Task、Effect、Scope、Trace四大概念。支持5 倍速Docker fork、95% KV-cache 利用率,CooperBench 合格率从 28.8% 提升至 54.7%,实现执行过程的完全可复现与分枝优化。该系统为 Meta-Agent 普及提供了关键基础设施。
🔵 Anthropic 拟收购 Stainless 并融资 300 亿美元,估值超 9000 亿
Anthropic正就收购开发者工具公司 Stainless 进行深入谈判,价格至少 3 亿美元。若交易达成,Anthropic将直接掌控竞争对手的模型调用通道。此外,Anthropic正与投资者洽谈新一轮融资,计划筹集至少300 亿美元资金,公司估值可能超过9000 亿美元。这两大动作显示了其在Claude大模型领域的领先地位及扩张野心。
𝕏 OpenAI 推出 Daybreak 守护代码安全,Codex 新增 Computer Use 能力
OpenAI正式发布Daybreak,这是一款专为网络安全团队设计的AI 代理工具,旨在将安全团队的防御效率提升10 倍。同时,OpenAI演示了Codex的Computer Use能力,使其能操作本地图形界面应用,采用独立光标在后台运行。此外,Codex还新增了「OpenAI Developers」插件,允许用户在终端直接创建API Key并调用所有接口,无需手动配置环境。
𝕏 智谱 AI GLM 系列全面接入 Tensorix AI,股价单日暴涨 36.9%
智谱 AI宣布GLM-5.1、GLM-5、GLM-5-Turbo及GLM-5v-Turbo四款模型正式在Tensorix AI平台上线。其中GLM-5.1在长周期智能体任务上达到 SOTA 水平。受市场对其大模型技术突破推动,港股智谱于 5 月 13 日收报1150 港元,单日大涨36.90%,总市值升至5127.20 亿港元。
𝕏 Jina 发布多模态 Embedding 模型 v5-omni,支持四模态检索
Jina正式推出首个统一的多模态Embedding模型Jina-embeddings-v5-omni,支持文本、图像、音频和视频的统一向量表示。提供Small和Nano两个尺寸,支持Matryoshka截断技术。该模型在原有 v5-text 基础上扩展,仅训练0.35%的连接层参数,视觉编码器基于Qwen3.5 ViT,实现了高效的多模态特征提取。
𝕏 MiniMax 桌面端升级为 Mavis,首发多 Agent 团队协作模式
MiniMax将桌面端产品更名为Mavis,新增Agent Teams功能。该功能支持创建多个不同角色的Agent协作完成长任务,采用代码状态机驱动,设 Owner、Worker、Verifier 三类角色,解决单 Agent 处理长任务的上下文过长与阻塞问题。这一升级标志着MiniMax在复杂任务自动化领域的重大突破。
𝕏 阿里开源 Ovis2.6-80B-A3B,文档理解与 OCR 性能领先
ModelScope发布Ovis2.6-80B-A3B多模态大模型,采用Apache 2.0协议。该模型拥有800 亿总参数,30 亿激活参数,在文档理解、OCR 及图表推理任务上表现优异,超越Qwen3-VL-32B等竞品。其核心创新在于“思考图像”机制,能在思维链中主动裁剪重审图像区域,支持64K上下文及2880×2880分辨率。
𝕏 MIT 何恺明团队发布 ELF 语言扩散模型,训练 Token 减少一个数量级
MIT何恺明团队发布ELF(Embedded Language Flows)语言扩散模型,在连续 embedding 空间完成文本生成。该模型仅需约45B训练 token,对比传统方法超500B,在 OpenWebText 评测中表现优异,证明扩散路线在语言建模中可行。该模型未采用自回归路线,仅在最后一步解码为离散 token,无需蒸馏即可取得更低困惑度。
EVENT-DRIVEN INTELLIGENCE
免费先跟踪重点,再决定是否升级
每篇公开内容都对应三步:订阅每日情报、查看同主题历史上下文、升级 Pro 解锁搜索、研究和事件详情。