天眼晚报
🤖 AI 大模型
𝕏 DeepSeek V4 Pro API 永久降价至原价四分之一
DeepSeek宣布 V4-Pro API 在 2026 年 5 月 31 日结束优惠后,正式按原定价的 1/4 长期计费。输入成本最低降至 0.025 元/百万 token,输出为 6 元/百万 token,相较竞品价格优势显著,被视为当前大模型 API 价格战中最激进的一次调整。
𝕏 BitCPM-CANN 开源,全球首个 1.58-bit 三元大模型
ModelBest、清华大学 与 OpenBMB 联合发布 BitCPM-CANN,这是全球首个完全在 华为昇腾 910B 上训练的 1.58-bit 三元大语言模型。项目完整开源量化算子、算法和训练脚本,主打极低内存占用与可复现训练。
智谱发布 GLM-5.1 高速版,刷新推理速度记录
智谱发布 GLM-5.1 高速版,借助 TileRT 推理引擎将输出速度提升至 400 tokens/s,在旗舰模型上实现更低延迟与更强吞吐,进一步缩短单任务耗时,强调“快即强”的产品路线。
𝕏 OpenAI Codex 更新,支持远程 Mac 控制与 Goal Mode
OpenAI Codex推出更新,新增 远程 Mac 控制 功能,允许用户在手机端安全控制处于锁屏状态的 Mac;同时上线 Goal Mode,支持长达数小时的自主任务执行,并引入 Appshots 提供屏幕上下文。
🔵 Google DeepMind 扩大与新加坡合作,聚焦科学与医疗
Google DeepMind宣布扩大与 新加坡 的合作,新的计划将聚焦 科学发现、疫情准备 与 医疗保健,双方将共同推动更大规模的 AI 应用落地。
𝕏 Microsoft 内部报告称 AI Agent 在部分场景成本高于人类
Microsoft内部报告指出,由于 Token 消耗 和 Agent 循环调用,AI Agent 在一些场景下的综合成本甚至高于雇用人类员工。这说明当前 Agent 经济性 仍是大规模落地的关键瓶颈,自动化并不天然等于降本。
LangChain 推出托管式 Agent 平台 LangSmith Fleet
LangChain推出 LangSmith Fleet,内置 200+ 集成和 7500 个工具,支持无需代码构建 Agent。内测数据显示,商机合格率提升 240%,每位 AE 每月可节省 40 小时,主打企业级销售与运营自动化。
𝕏 Google 发布 Gemini 3.5 Flash 与新智能体工具集
Google推出 Gemini 3.5 Flash,据称速度比前沿模型快 4 倍,并同步发布新的 智能体工具集,意在强化开发者生态与自动化能力,也引发外界对 OpenAI 旗舰产品竞争格局的关注。
𝕏 Anthropic 上线自动构建技能工具,无需编码生成工作流
Anthropic悄然上线新工具,可自动起草文件、编写测试、运行评估并修复失败,用户只需描述需求即可生成可用的 AI 技能,无需编写代码或提示工程,进一步降低自动化工作流门槛。
🔶 谷歌 AI 搜索概览把普通词误判为提示指令
谷歌搜索 AI 概览 在查询 disregard、remember 等普通词时会触发类似 提示注入 的错误,直接忽略检索任务,暴露出 AI 搜索系统在上下文解析与安全边界上的薄弱环节。
𝕏 Claude Code 2.1.150 即将上线,继续强化编程能力
Anthropic宣布 Claude Code 版本 2.1.150 即将发布,重点持续优化 代码生成 与 执行能力,显示其在面向开发者的编程代理方向上仍在迭代推进。
EVENT-DRIVEN INTELLIGENCE
免费先跟踪重点,再决定是否升级
每篇公开内容都对应三步:订阅每日情报、查看同主题历史上下文、升级 Pro 解锁搜索、研究和事件详情。