天眼早报

科技|2026年05月24日|约 34 分钟阅读

来源：809 条推文 + 194 篇 RSS 文章·Lanyun·BatchV2 生成·2026-05-23 — 2026-05-24

AI 速读20 条精选

🤖 AI 大模型

𝕏 Cerebras 在 Kimi K2.6 上实现 981 tokens/s 推理速度，称较 GPU 云快 6.7 倍

Cerebras宣布在Kimi K2.6模型上达到981 tokens/sec的推理速度，称其性能比次快的 GPU 云服务快6.7 倍。该结果基于晶圆级芯片架构，重点缓解大规模模型推理中的权重传输瓶颈，对企业级代码智能体和低延迟推理场景具有较高参考价值。

🟩 Google I/O 2026 推出 AI Studio Android 应用生成器，可用提示词生成原生应用

Google在I/O 2026大会上发布AI Studio新功能，开发者可通过自然语言描述需求，生成基于 Kotlin 和 Jetpack Compose 的原生Android应用，并在内置模拟器中预览。该能力将应用原型设计、代码生成和即时验证整合到同一流程，降低移动应用开发门槛。

𝕏 RWKV-7 G1g 发布：纯 RNN LLM 单卡 RTX 5090 解码超 15000 tps

RWKV-7 G1g正式发布，号称是当前表现领先的纯RNN LLM。该模型在单张RTX 5090上可实现15000+ tps解码速度，并支持 7B 模型 bsz16 推理，为低延迟、本地化和高吞吐文本生成应用提供了新的模型选择。

𝕏 DeepSeek-V4-Pro 支持 24500 个上下文窗口，单窗口可达 100 万 token

DeepSeek推出V4-Pro模型，宣称支持24500 个并发上下文窗口，每个窗口容量可达100 万 token。该设计面向多日长对话和长期任务执行场景，后续还计划推出更大存储变体，以增强超长上下文管理和持续会话能力。

𝕏 OpenAI Codex 可通过手机安全控制锁屏 Mac 应用

OpenAI的Codex Thursday更新显示，Codex已支持从手机端安全操作处于锁屏、屏幕关闭状态的Mac 应用。这意味着开发者可在移动端远程触发或管理桌面端任务，同时保持设备锁定状态，提升跨设备编码智能体的可用性。

𝕏 Google Gemini Omni 推出视频级 AI 编辑能力，可替换角色、背景和物理效果

Google发布Gemini Omni视频编辑功能，支持通过自然语言完成替换角色、更换背景、调整镜头角度以及修改重力等物理效果。该功能把复杂视频剪辑操作转化为提示词交互，显示多模态模型在视频生成、场景控制和后期编辑方向的进一步融合。

𝕏 GBrain 开源智能体记忆层，支持 MCP、关键词、向量与图检索

GBrain作为智能体记忆层以MIT 许可证开源，支持接入MCP server，并提供关键词、向量和图检索等混合检索能力。该项目面向需要长期记忆、上下文召回和多源知识组织的 AI Agent，为开发者提供可组合的记忆基础设施。

𝕏 OpenAI 内部测试模型被曝具备更强 3D 物理模拟能力

据泄露信息，OpenAI内部测试模型展现出较强的3D 物理模拟能力，可生成富士山像陀螺般旋转的视频效果。该演示被视为其在视频生成、物体一致性和物理理解方面的潜在进展，但目前仍属于泄露信息，具体模型名称和发布时间尚未确认。

EVENT-DRIVEN INTELLIGENCE

免费先跟踪重点，再决定是否升级

每篇公开内容都对应三步：订阅每日情报、查看同主题历史上下文、升级 Pro 解锁搜索、研究和事件详情。

订阅每日情报查看同主题历史事件升级 Pro 解锁搜索 / 研究 / 事件详情

NEXT STEP · 留下邮箱

获取下一次重大事件提醒

每天一封精选情报，先用邮件建立复访，再决定是否升级到更深的追踪能力。

查看同主题历史事件升级 Pro 解锁事件详情