天眼早报
🤖 AI 大模型
𝕏 智谱开源 GLM-5.1 模型,长时程 Agent 能力大幅提升
智谱 AI正式开源GLM-5.1模型,参数规模达744B,采用 MIT 许可开放权重。该模型在SWE-Bench Pro上跑出 58.4 分,并在 Terminal-Bench、NL2Repo 等评测中位列开源第一,超过 Opus 4.6、GPT-5.4 等模型。此外,它支持长时程Agent自主运行,可连续运行8 小时处理长周期任务,API 已同步上线。同时,GLM 5 Turbo 与 GLM 5.1 在 Design Arena 分别拿到 1355 和 1352 Elo。
𝕏 Anthropic 发布 Claude Mythos Preview 及 Project Glasswing 安全计划
Anthropic发布新前沿模型Claude Mythos Preview,并推出Project Glasswing安全项目。官方称该模型发现软件漏洞的能力超过绝大多数人类安全专家,目前已发现数千个高危漏洞,覆盖主流操作系统、浏览器与关键基础软件。同时,Anthropic 开放了技术报告以说明漏洞与利用链细节。
𝕏 Cognition 发布 SWE-1.6,提升编码模型速度与交互体验
Cognition发布SWE-1.6,在SWE-Bench Pro达到与预览版相当表现,并上线 Windsurf 免费与高速两档模式。
𝕏 Google 下调 Veo 3.1 Fast 价格
Google AI Devs宣布Veo 3.1 Fast已实行降价。
𝕏 AI Agent 核心模型选型指南与分级清单
针对 OpenClaw 等 Agent 的模型选型清单发布:GPT-5.4 等列为第一梯队;MiniMax M2.7 与 Kimi K2.5 适合执行层;Qwen3.6 Plus 与 Llama 4 Maverick 兼顾平衡;Gemma 4 31B 领跑本地推理。
𝕏 开源 AI 记忆系统 MemPalace 发布,实现 100% 长文本召回率
开发者开源本地化 AI 记忆系统MemPalace,引入六层空间结构与AAAK无损压缩语言,将 1950 万 Token 年记忆量压缩至65 万 Token,在LongMemEval基准测试中实现**100%**召回率。
EVENT-DRIVEN INTELLIGENCE
免费先跟踪重点,再决定是否升级
每篇公开内容都对应三步:订阅每日情报、查看同主题历史上下文、升级 Pro 解锁搜索、研究和事件详情。