天眼晚报
🤖 AI 大模型
𝕏 Nous Research 发布 Hermes Agent 0.8 并提升模型稳定性
Nous Research 发布的 Hermes Agent 现已更新至 v0.8 版本,正式原生支持 个人微信 连接。用户可通过扫码实现私聊与群聊连接,覆盖图片、视频及语音消息。该系统具备 自我进化 能力,可将任务自动转化为可复用技能。此外,在 小米 的协助下,团队已显著提升 Hermes 模型的运行稳定性,目前 MiMo V2 Pro 访问已恢复正常。
𝕏 智谱 AI 发布 GLM-5.1:编程与设计任务表现卓越
智谱 AI(Zai_org)发布 GLM-5.1,在 Code Arena 编程评测中位列开源模型第一,与总榜第一的差距缩小至 20 分以内。该模型在设计导向的编程任务中表现优异,性能可比肩 Opus 4.6,但成本仅为其八分之一。
🔵 Artemis II 载人绕月任务圆满成功,宇航员安全返回
NASA 的 Artemis II 载人飞船在完成为期 10 天的绕月飞行后,成功于太平洋溅落。这是人类 50 多年来首次重返月球任务的里程碑,标志着载人登月计划进入新阶段。
𝕏 Anthropic 发布 Claude Managed Agents 公测版
Anthropic 推出 Claude Managed Agents (CMA),引入 Vaults 组件安全管理用户 API 密钥。该架构确保凭证在沙箱外运行,防止 Prompt Injection 导致密钥泄露,目前 Notion 和 Sentry 已接入使用。
𝕏 KellyBench 发布:主流 AI 模型在英超投注中表现欠佳
新发布的 KellyBench 基准测试显示,Claude Opus 4.6 以 -11% 的投资回报率领先,而 GPT-5.4 为 -13.6%,多款模型在长赛季风险管理中资产归零。
🐙 开源 AI 代理管理平台 Multica 发布
Multica 是一款开源的 AI 代理管理平台,支持 Claude Code 和 Codex。它能将 AI 代理转化为团队成员,实现任务自主分配、进度跟踪及技能复用。
𝕏 万亿参数 MoE 架构模型细节披露
新型 MoE 架构模型总参数量达 1 万亿,推理时仅激活 370 亿 参数。该架构使推理速度提升 35 倍,同时能耗降低 40%。
🐙 开源 AI/ML 特征存储库 Feast 更新
Feast 是用于机器学习的开源特征存储,可管理 离线存储 和 在线存储,解决模型训练中的数据泄漏问题,并支持 Snowflake 和 BigQuery 等多种数据源。
🐙 AI 代理专用防检测浏览器服务器 Camofox-browser
camofox-browser 是基于 Camoufox 的 headless 浏览器服务器,专为 AI 代理设计,通过 C++ 级别 的指纹伪造绕过 bot 检测。
𝕏 GBrain 实现 MCP 跨平台支持 Claude 与 ChatGPT
GBrain 更新 MCP 服务,现已支持在 Claude 和 ChatGPT 中直接调用。用户可通过该协议让 AI 访问私有 知识库 和 pgvector 记忆,解决智能体上下文孤岛问题。
𝕏 DeepSeek 披露 Blackwell 架构下 18 倍解码加速
DeepSeek 透露其模型在 Blackwell 架构下可实现 18 倍 峰值解码加速。研究指出,Mythos 级别的编程能力更依赖长上下文和高质量数据而非单纯参数量。
𝕏 百度 Famou-Agent 2.0 登顶 MLE-Bench 榜单
百度智能云 开发的 Famou-Agent 2.0 在 MLE-Bench 测试中刷新 SOTA 纪录,核心升级涵盖进化策略与长短期记忆机制。
𝕏 GemOpus-4 发布:支持 4B 参数本地高效推理
GemOpus-4 模型发布,结合了 Gemma 4 与 Opus 风格的推理能力。该模型拥有 4B 激活参数,在 22.7GB 显存下可实现 75 tok/s 的本地推理速度。
英国央行拟评估 Anthropic Mythos 模型金融风险
英国央行 计划在未来两周内讨论 Anthropic 新模型 Mythos 对金融系统运营韧性的影响。美联储 与 加拿大央行 此前已就该模型可能引发的 网络安全风险 召开紧急会议。
𝕏 MiniMax Music 2.6 全球公测,支持意图控制
MiniMax 发布 Music 2.6,支持通过文字描述控制音乐结构,首个音频生成仅需 20 秒,并提供 14 天每日 500 首的免费额度。
𝕏 GPT-5.4 Pro 采取不透明思考路径策略
市场观察发现 GPT-5.4 Pro 的思考路径(CoT)不再对用户公开,分析认为此举旨在防止竞争对手通过 蒸馏学习 其思维模式。
🔶 OpenAI 指控马斯克在诉讼开庭前制造舆论干扰
OpenAI 在法庭文件中指责 马斯克 提出的新诉求意在扰乱 4 月 27 日 的开庭程序,双方就营利性重组的初衷争议升级。
EVENT-DRIVEN INTELLIGENCE
免费先跟踪重点,再决定是否升级
每篇公开内容都对应三步:订阅每日情报、查看同主题历史上下文、升级 Pro 解锁搜索、研究和事件详情。