天眼晚报
🤖 AI 大模型
𝕏 Google Cloud Next 2026 开源官方 Agent Skills 仓库,覆盖 GCP 生态
Google在 Cloud Next 2026 上发布官方Agent Skills仓库,包含13 个技能,覆盖GCP产品操作、跨任务流程、架构体检、Terraform 配置与 IAM 权限理解。该仓库支持 Claude Code、Cursor 等主流 AI 编程助手,一键安装即可让 AI 更好理解 GCP 生态。
𝕏 Elon Musk 称 Grok v9 基础模型训练完成,参数量达 1.5T
Elon Musk确认Grok v9基础模型训练完成,参数量达到1.5T,基于Blackwell架构训练,数据清洗与训练配方全面重构。他表示 v9 相比 v8 有巨大提升,但当前公开版本底层仍为 v8。
𝕏 Anthropic Claude Mythos Preview 在 UK AISI 网络靶场测试中取得突破
Claude Mythos Preview通过UK AISI两个端到端网络靶场,并在XBOW测试中完成 V8 sandbox 细粒度漏洞任务,显示出其在复杂网络安全任务和漏洞利用链路上的能力提升。
MiniMax 复盘 M2 系列低频 token 遗忘问题,解释模型为何无法生成“马嘉祺”
MiniMax Forge复盘M2系列低频 token 遗忘问题,定位根因与lm_head退化、量化后稀疏 token 表达受损有关;团队称后续模型已修复,并用“马嘉祺”等低频词案例解释模型为何会生成失败。
𝕏 vLLM v0.21.0 发布,强化 Blackwell、DeepSeek V4 与分布式 KV
vLLM v0.21.0发布,包含367 次提交、202 名贡献者,新增KV Offload、Mooncake 分布式 KV、DeepSeek V4 管线并行与 C++20 基线,重点强化 Blackwell 与大规模推理部署。
𝕏 Infinity-Parser2 开源模型登顶 ParseBench 企业文档理解榜
INF发布Infinity-Parser2-Pro 35B和Flash 2B,基于 500 万合成解析样本与联合强化学习训练,在ParseBench企业文档理解榜领先,主打复杂企业文档解析与结构化理解能力。
OpenAI 面向美国 Pro 用户试点 ChatGPT 个人理财助手
OpenAI面向美国ChatGPT Pro用户推出个人理财预览版,可授权连接12000 家金融机构账户,用于预算分析、交易归类和消费建议。相关对话默认遵循模型训练设置,用户需主动选择退出。
𝕏 Jane Street 公开德州 AI 训练中心:4032 张 GPU 与液冷系统演进
Jane Street公开其德州 AI 训练中心内部细节,拥有4032 张 GPU和8000 公里光纤。报道还回顾其从 6 台 Dell 主机起步,到如今实现100 纳秒交易速度的液冷数据中心,展示华尔街量化机构 20 年算力进化。
𝕏 ChatTutor 上线电子白板功能,AI 可边讲边画辅助理科学习
ChatTutor新增数学画布功能,支持 AI 直接绘制函数图像、几何图形并生成思维导图。该工具兼容 OpenAI、Anthropic 等主流模型,提供在线版本,无需本地部署,提升理工科知识交互体验。
𝕏 腾讯混元推出 440MB 本地离线翻译模型
腾讯混元发布Hy-MT1.5-1.8B-1.25bit,将模型压缩至440MB,支持 33 种语言手机离线翻译,面向端侧低资源环境提供无需联网的多语言翻译能力。
OpenAI 将在马耳他向全民开放 ChatGPT Plus
OpenAI与马耳他达成协议,计划向该国全体民众开放ChatGPT Plus服务,体现出政府级合作推动 AI 工具普及的新尝试。
𝕏 OpenAI 修复 Codex 中 GPT-5.5 近 48 小时能力下降问题
OpenAI Codex团队称已修复过去48 小时内导致GPT-5.5能力下降的两个问题,并将为受影响用户重置使用限制。该事件主要影响 Codex 场景下的模型表现。
𝕏 Codex 移动端降低非技术用户使用智能体门槛
Codex 移动端可通过 App 直接连接并对话,无需配置模型、守护进程或插件,办公用户几分钟即可上手,显示出编码智能体向更低门槛、移动化工作流扩展的趋势。
𝕏 Together AI 推出 Gemma-4-31B-it-Pearl 端点
Together AI上线Gemma-4-31B-it-Pearl端点,支持32K 上下文、可配置思考、函数调用和 JSON 模式,为开发者提供新的托管模型调用选择。
𝕏 OpenAI 发布面向中文开发者生态的技术布道岗位
OpenAI在新加坡招聘中文开发者技术职位,聚焦Codex和前沿模型,岗位要求覆盖中文开发者生态建设,并包含亚太区**30%**出差安排。
EVENT-DRIVEN INTELLIGENCE
免费先跟踪重点,再决定是否升级
每篇公开内容都对应三步:订阅每日情报、查看同主题历史上下文、升级 Pro 解锁搜索、研究和事件详情。