天眼晚报

科技|2026年05月23日|约 50 分钟阅读

来源：1009 条推文 + 304 篇 RSS 文章·Lanyun·BatchV2 生成·2026-05-23

AI 速读23 条精选

🤖 AI 大模型

𝕏 DeepSeek V4 Pro API 永久降价至原价四分之一

DeepSeek宣布 V4-Pro API 在 2026 年 5 月 31 日结束优惠后，正式按原定价的 1/4 长期计费。输入成本最低降至 0.025 元/百万 token，输出为 6 元/百万 token，相较竞品价格优势显著，被视为当前大模型 API 价格战中最激进的一次调整。

𝕏 BitCPM-CANN 开源，全球首个 1.58-bit 三元大模型

ModelBest、清华大学 与 OpenBMB 联合发布 BitCPM-CANN，这是全球首个完全在 华为昇腾 910B 上训练的 1.58-bit 三元大语言模型。项目完整开源量化算子、算法和训练脚本，主打极低内存占用与可复现训练。

智谱发布 GLM-5.1 高速版，刷新推理速度记录

智谱发布 GLM-5.1 高速版，借助 TileRT 推理引擎将输出速度提升至 400 tokens/s，在旗舰模型上实现更低延迟与更强吞吐，进一步缩短单任务耗时，强调“快即强”的产品路线。

𝕏 OpenAI Codex 更新，支持远程 Mac 控制与 Goal Mode

OpenAI Codex推出更新，新增 远程 Mac 控制 功能，允许用户在手机端安全控制处于锁屏状态的 Mac；同时上线 Goal Mode，支持长达数小时的自主任务执行，并引入 Appshots 提供屏幕上下文。

🔵 Google DeepMind 扩大与新加坡合作，聚焦科学与医疗

Google DeepMind宣布扩大与 新加坡 的合作，新的计划将聚焦 科学发现、疫情准备 与 医疗保健，双方将共同推动更大规模的 AI 应用落地。

𝕏 Microsoft 内部报告称 AI Agent 在部分场景成本高于人类

Microsoft内部报告指出，由于 Token 消耗 和 Agent 循环调用，AI Agent 在一些场景下的综合成本甚至高于雇用人类员工。这说明当前 Agent 经济性 仍是大规模落地的关键瓶颈，自动化并不天然等于降本。

LangChain 推出托管式 Agent 平台 LangSmith Fleet

LangChain推出 LangSmith Fleet，内置 200+ 集成和 7500 个工具，支持无需代码构建 Agent。内测数据显示，商机合格率提升 240%，每位 AE 每月可节省 40 小时，主打企业级销售与运营自动化。

𝕏 Google 发布 Gemini 3.5 Flash 与新智能体工具集

Google推出 Gemini 3.5 Flash，据称速度比前沿模型快 4 倍，并同步发布新的 智能体工具集，意在强化开发者生态与自动化能力，也引发外界对 OpenAI 旗舰产品竞争格局的关注。

𝕏 Anthropic 上线自动构建技能工具，无需编码生成工作流

Anthropic悄然上线新工具，可自动起草文件、编写测试、运行评估并修复失败，用户只需描述需求即可生成可用的 AI 技能，无需编写代码或提示工程，进一步降低自动化工作流门槛。

🔶 谷歌 AI 搜索概览把普通词误判为提示指令

谷歌搜索 AI 概览 在查询 disregard、remember 等普通词时会触发类似 提示注入 的错误，直接忽略检索任务，暴露出 AI 搜索系统在上下文解析与安全边界上的薄弱环节。

𝕏 Claude Code 2.1.150 即将上线，继续强化编程能力

Anthropic宣布 Claude Code 版本 2.1.150 即将发布，重点持续优化 代码生成 与 执行能力，显示其在面向开发者的编程代理方向上仍在迭代推进。

EVENT-DRIVEN INTELLIGENCE

免费先跟踪重点，再决定是否升级

每篇公开内容都对应三步：订阅每日情报、查看同主题历史上下文、升级 Pro 解锁搜索、研究和事件详情。

订阅每日情报查看同主题历史事件升级 Pro 解锁搜索 / 研究 / 事件详情

NEXT STEP · 留下邮箱

获取下一次重大事件提醒

每天一封精选情报，先用邮件建立复访，再决定是否升级到更深的追踪能力。

查看同主题历史事件升级 Pro 解锁事件详情