05月23日 · 科技晚报

天眼晚报

科技|2026年05月23日|50 分钟阅读
来源:1009 条推文 + 304 篇 RSS 文章·Lanyun·BatchV2 生成·2026-05-23
分享
AI 速读23 条精选

🤖 AI 大模型

𝕏 DeepSeek V4 Pro API 永久降价至原价四分之一

DeepSeek宣布 V4-Pro API 在 2026 年 5 月 31 日结束优惠后,正式按原定价的 1/4 长期计费。输入成本最低降至 0.025 元/百万 token,输出为 6 元/百万 token,相较竞品价格优势显著,被视为当前大模型 API 价格战中最激进的一次调整。

𝕏 BitCPM-CANN 开源,全球首个 1.58-bit 三元大模型

ModelBest清华大学OpenBMB 联合发布 BitCPM-CANN,这是全球首个完全在 华为昇腾 910B 上训练1.58-bit 三元大语言模型。项目完整开源量化算子、算法和训练脚本,主打极低内存占用与可复现训练。

智谱发布 GLM-5.1 高速版,刷新推理速度记录

智谱发布 GLM-5.1 高速版,借助 TileRT 推理引擎将输出速度提升至 400 tokens/s,在旗舰模型上实现更低延迟与更强吞吐,进一步缩短单任务耗时,强调“快即强”的产品路线。

𝕏 OpenAI Codex 更新,支持远程 Mac 控制与 Goal Mode

OpenAI Codex推出更新,新增 远程 Mac 控制 功能,允许用户在手机端安全控制处于锁屏状态的 Mac;同时上线 Goal Mode,支持长达数小时的自主任务执行,并引入 Appshots 提供屏幕上下文。

🔵 Google DeepMind 扩大与新加坡合作,聚焦科学与医疗

Google DeepMind宣布扩大与 新加坡 的合作,新的计划将聚焦 科学发现疫情准备医疗保健,双方将共同推动更大规模的 AI 应用落地。

𝕏 Microsoft 内部报告称 AI Agent 在部分场景成本高于人类

Microsoft内部报告指出,由于 Token 消耗Agent 循环调用AI Agent 在一些场景下的综合成本甚至高于雇用人类员工。这说明当前 Agent 经济性 仍是大规模落地的关键瓶颈,自动化并不天然等于降本。

LangChain 推出托管式 Agent 平台 LangSmith Fleet

LangChain推出 LangSmith Fleet,内置 200+ 集成7500 个工具,支持无需代码构建 Agent。内测数据显示,商机合格率提升 240%,每位 AE 每月可节省 40 小时,主打企业级销售与运营自动化。

𝕏 Google 发布 Gemini 3.5 Flash 与新智能体工具集

Google推出 Gemini 3.5 Flash,据称速度比前沿模型快 4 倍,并同步发布新的 智能体工具集,意在强化开发者生态与自动化能力,也引发外界对 OpenAI 旗舰产品竞争格局的关注。

𝕏 Anthropic 上线自动构建技能工具,无需编码生成工作流

Anthropic悄然上线新工具,可自动起草文件、编写测试、运行评估并修复失败,用户只需描述需求即可生成可用的 AI 技能,无需编写代码或提示工程,进一步降低自动化工作流门槛。

🔶 谷歌 AI 搜索概览把普通词误判为提示指令

谷歌搜索 AI 概览 在查询 disregardremember 等普通词时会触发类似 提示注入 的错误,直接忽略检索任务,暴露出 AI 搜索系统在上下文解析与安全边界上的薄弱环节。

𝕏 Claude Code 2.1.150 即将上线,继续强化编程能力

Anthropic宣布 Claude Code 版本 2.1.150 即将发布,重点持续优化 代码生成执行能力,显示其在面向开发者的编程代理方向上仍在迭代推进。


EVENT-DRIVEN INTELLIGENCE

免费先跟踪重点,再决定是否升级

每篇公开内容都对应三步:订阅每日情报、查看同主题历史上下文、升级 Pro 解锁搜索、研究和事件详情。

分享

NEXT STEP · 留下邮箱

获取下一次重大事件提醒

每天一封精选情报,先用邮件建立复访,再决定是否升级到更深的追踪能力。