天眼晚报
🤖 AI 大模型
𝕏 DeepSeek V4 Pro 以高缓存命中率将编程成本压至 160 美元
DeepSeek推出V4 Pro模型,借助99.41%缓存命中率和极致降价策略,将单日处理278 亿 Token的成本压至160 美元;相比Claude Sonnet 4.6还能节省超10900 美元,并同步适配OpenCode等工具的百万上下文。
𝕏 OpenAI 员工完成 66 亿美元股权出售
OpenAI完成史上最大规模员工股票出售,600+名员工套现66 亿美元,最高个人上限3000 万美元;转型后员工持有公司26%股权,人均纸面财富很高,预计2026 Q4启动 IPO。
𝕏 OpenSquilla 开源发布,长运行 Agent 成本降低 60%-80%
OpenSquilla是一款基于Python的开源智能体框架,通过内容感知路由、记忆整合和自适应 Token 压缩技术,在混合长运行任务中把模型成本降低60%-80%;项目还提供公开基准数据,并发起10M Token Bill Challenge供社区验证节省效果。
火山引擎发布 Agent Plan,整合多模态模型与联网工具
火山引擎正式发布Agent Plan,在 Coding Plan 基础上新增Doubao-Seed系列、GLM-5.1等主流三方模型及联网搜索Harness工具,企业版同步上线,目标是提供更完整的智能体开发能力。
Sakana AI 联合英伟达推出 TwELL CUDA 内核,加速训练与推理
Sakana AI与NVIDIA发布TwELL CUDA 内核,让 LLM 推理提速20.5%、训练提速21.9%,展示了针对底层算子的协同优化对模型性能的直接提升。
阿里云推出团队版 Token Plan,兼容 Cursor 等 Agent 工具
阿里云发布团队版Token Plan,内置Qwen3.6、Kimi-K2.6等十多款模型,支持多坐席管理,并已兼容Cursor、Claude Code等主流 Agent 工具,可一键调用。
𝕏 Codex 新增 2.5 万网络爬虫代理以增强自主任务执行
Codex最新集成25,000个网络爬虫代理,大幅增强自主信息搜集能力;配合沙盒执行与 PR 提交机制,开发者可让 AI 独立完成从调研到代码实现的闭环,提升独立开发效率。
快手拟按约 200 亿美元估值分拆可灵 AI 视频模型
快手计划分拆 AI 视频生成模型可灵 Kling,据 The Information 报道目标估值约200 亿美元,若推进成功,意味着其视频生成业务可能独立融资或上市。
𝕏 Sakana AI 提出 Conductor 模型,用指挥者架构协调多模型协作
Sakana AI提出的Conductor model将自己定位为PMO角色,不直接执行任务,而是为不同LLM编写专用提示词,兼容闭源与开源模型,以提升复杂任务的协同效率。
𝕏 Google 为 Gemini API 扩展文件搜索能力
Google为Gemini API扩展文件搜索,新增图文混合检索、元数据过滤和页面级引用,面向企业知识库、文档问答与智能体场景,可让模型更准确地定位来源并提升检索增强生成效果。
𝕏 亚马逊允许员工通过 AWS Bedrock 使用 Claude Code 和 Codex
亚马逊允许员工使用Claude Code和Codex,但必须通过AWS Bedrock账户运行,数据保留在 AWS 内部,显然是在开放工具使用与企业数据合规之间寻找平衡。
𝕏 DFlash 将大模型解码速度提升至 415 tokens/s
DFlash通过块扩散草稿模型并行预测,将解码速度从48.5 tokens/s提升到415 tokens/s,展示了显著的推理加速效果,适合需要高吞吐生成的场景。
💹 MiniMax 启动 10x Team 计划,招募垂直行业专家
MiniMax启动10x Team计划,面向工业软件、游戏引擎、芯片设计、金融等方向招募专家,共建评测与工作流,显示其正在强化行业化落地能力。
𝕏 Claude Opus 被比作高级工程师,GPT-5.5 更像架构师
Claude Opus擅长执行但缺少全局视角,更像高级工程师;而GPT-5.5在兼容性、安全性等方面能给出更完整的系统建议,因此被形容为真正的架构师。
欧盟欢迎 OpenAI 向其开放新版 ChatGPT 模型访问
欧盟委员会表示欢迎OpenAI拟开放最新版ChatGPT 模型的访问权限,并称本周将继续沟通;这反映出监管层与平台之间仍在就模型可用性展开协调。
𝕏 Claude 推出 PWA 形态,网页端可安装为类原生应用
Claude已支持PWA,用户可将网页端安装为类原生应用使用,提升桌面与移动端的访问便利性,也让聊天入口更接近常驻应用体验。
EVENT-DRIVEN INTELLIGENCE
免费先跟踪重点,再决定是否升级
每篇公开内容都对应三步:订阅每日情报、查看同主题历史上下文、升级 Pro 解锁搜索、研究和事件详情。