天眼早报

科技|2026年05月23日|约 79 分钟阅读

来源：1250 条推文 + 224 篇 RSS 文章·Lanyun·BatchV2 生成·2026-05-22 — 2026-05-23

AI 速读13 条精选

🤖 AI 大模型

𝕏 【重磅】Cerebras 在 Kimi K2.6 模型上实现 981 tokens/sec，比 GPU 云快 6.7 倍

Cerebras在Kimi K2.6（1T 参数）模型测试中达到981 tokens/sec，速度是次优 GPU 云的6.7 倍。其晶圆级芯片架构消除了跨芯片数据传输延迟，解决了企业级编码代理对速度的严苛需求。

𝕏 【重磅】DeepSeek 永久降价并推出 V4-Pro，构建对抗性编码工具

DeepSeek宣布将折扣永久化，正式开放DeepSeek-V4-Pro模型。同时招聘显示其正在开发对标 Claude Code 和 Codex 的代理式编码工具，旨在提升开发者效率。

𝕏 ⭐ Anthropic 暂不公开 Mythos 级模型，披露 Project Glasswing 漏洞数据

Anthropic称约50 个合作伙伴用Claude Mythos Preview扫描1000 多个开源项目，发现超1 万个高危或严重漏洞，因滥用风险暂不公开 Mythos 级模型。

𝕏 ⭐ Cursor Composer 2.5 基准测试：比 Opus 便宜 18 倍，比 GPT-5.5 便宜 32 倍

Cursor Composer 2.5在编码基准测试中表现优异，API 成本仅为Opus 4.7的1/18、GPT-5.5的1/32。完成任务仅需1.6M token（平均模型需5.7M），耗时9 分钟（平均12 分钟）。

𝕏 ⭐ 首个基于中国 AI 基础设施全流程训练的 1.58-bit 三值 LLM 开源

BitCPM-CANN由面壁智能、清华大学、OpenBMB开发，使用华为昇腾 910B完成 1.58-bit 三值 LLM 训练，覆盖量化算子、框架与可复现实验脚本。

𝕏 ⭐ Google 发布 Gemini Omni，可用对话生成和编辑视频

Google发布Gemini Omni，主打对话式视频生成与原生编辑，并支持在Gemini App中创建带本人声音和形象的自定义头像。

𝕏 ⭐ Gemini 3.5 Flash 性能跃升，Elo 评分达 1299 跻身第一梯队

Google DeepMind发布Gemini 3.5 Flash，在 Design Arena 排名升至第16位，Elo 评分1299，超越Claude Opus 4.5和GPT-5.5。相比前代提升16 个位次，多模态理解速度提升6 倍。

𝕏 ⭐ Google 发布 Gemini Spark：24/7 个人 AI 助手与 Daily Brief

Google在 I/O 大会上推出 Gemini Spark，这是一款全天候个人 AI 助手，支持设置重复任务、学习新技能及创建完整工作流。同时上线 Daily Brief 功能，主动整理待办事项。

𝕏 ⭐ Cursor Composer 2.5 编码代理成本显著低于 Opus 4.7 和 GPT-5.5

Artificial Analysis称Cursor Composer 2.5编码任务成本比Opus 4.7低3–18 倍，比GPT-5.5低5–32 倍。

𝕏 ⭐ Qwen3.7-Max 发布，拥有 1M 上下文并优化 Agent 工作流

Alibaba Qwen推出旗舰模型Qwen3.7-Max，支持1M 上下文长度，在智能体编码、推理及长程自主任务上表现领先，现已在Together Serverless Inference上线供生产使用。

𝕏 ⭐ Runway 发布 Aleph 2.0 视频编辑模型，支持多镜头精准控制

Runway升级视频编辑模型至 Aleph 2.0，新增 Edit Studio 功能。用户可在 1080p 分辨率下处理长达 30 秒的多镜头序列，实现“只改想改部分”的精准编辑效果。

𝕏 ⭐ Cartesia Sonic-3.5 登顶语音模型榜单

Cartesia Sonic-3.5在 Artificial Analysis 语音竞技场排名第1，支持42 种语言、500+声音，价格为39 美元/百万字符。

𝕏 ⭐ DeepSeek 将 V4-Pro 折扣转为永久

DeepSeek宣布V4-Pro折扣永久化，开发者可继续以约25 折价格调用模型，降低智能体和应用构建成本。

𝕏 ⭐ DeepSeek V4-Pro API 限时折扣转为长期降价

DeepSeek称V4-Pro API在5 月 31 日 23:59结束 2.5 折活动后，6 月 1 日起正式按原价四分之一长期定价。

𝕏 ⭐ Google 每月处理 Token 量同比增长 7 倍

a16z称Google当前每月处理超过3.2 千万亿 token，较一年前增长7 倍，显示 AI 使用规模继续扩张。

𝕏 ⭐ SGLang 集成 Kimi K2.6 优化，解决高并发乱码问题

LMSYS**与 CloudflareDev合作，将 Kimi K2.6的解码 KV Cache 卸载与 Mooncake 恢复机制上游提交至 SGLang。现支持在高并发下无乱码运行，且自动恢复 Peer 节点。

𝕏 DeepSeek 推进 102.9 亿美元融资，强调 AGI 与开源

Bloomberg称DeepSeek推进102.9 亿美元融资，梁文锋继续优先发展开源 AI 模型，而非短期商业化。

𝕏 Google DeepMind 扩大 SynthID 水印合作

Google DeepMind扩大SynthID合作，并在Gemini App与Google Search中提供 AI 内容识别入口。

𝕏 Gemma 4 实验应用在 Pixel 硬件上实现 100% 离线运行

Google Gemma 4实验应用在野外无网络环境测试，支持视觉理解、数学推理和工具使用。

𝕏 GPT-5.5 被 DHH 用于重写 Omarchy 4，生成 3 万行 QML 代码

DHH称Omarchy 4新增3 万行代码多数由GPT-5.5生成，复杂 Agent 任务体验已超过 Opus 4.7。

𝕏 腾讯开源 Z-Image 6B 像素空间图像生成模型

腾讯 Z-Image 6B支持1K 分辨率、无VAE像素空间生成。

𝕏 Gemini 3.5 Flash 在视觉任务上快于 3.1 Pro 约 6 倍

Gemini 3.5 Flash在部分Roboflow 视觉评测超过 3.1 Pro，平均速度约快6 倍。

𝕏 DeepSeek V4 Pro API 优惠转为永久降价

DeepSeek-V4-Pro API 折扣改为永久，5 月 31 日后定价为原价的1/4。

𝕏 OpenAI Codex 新增 Appshots 功能，可直接读取 Mac 应用窗口上下文

OpenAI Codex在 Mac 端加入Appshots，按 Command-Command 即可把应用截图和窗口文本附加到线程。

𝕏 DeepSeek 疑似降价 75%，本地与开源模型成本竞争加剧

DeepSeek被用户发现出现75%折扣，引发对推理优化、华为芯片成本和开源 AI 模型价格战的讨论。

𝕏 DeepSeek 招聘智能体编程工具岗位

DeepSeek招聘信息显示正在开发智能体编程工具，对标Claude Code和OpenAI Codex。

EVENT-DRIVEN INTELLIGENCE

免费先跟踪重点，再决定是否升级

每篇公开内容都对应三步：订阅每日情报、查看同主题历史上下文、升级 Pro 解锁搜索、研究和事件详情。

订阅每日情报查看同主题历史事件升级 Pro 解锁搜索 / 研究 / 事件详情

NEXT STEP · 留下邮箱

获取下一次重大事件提醒

每天一封精选情报，先用邮件建立复访，再决定是否升级到更深的追踪能力。

查看同主题历史事件升级 Pro 解锁事件详情