天眼晚报

科技|2026年04月18日|约 25 分钟阅读

来源：1219 条推文 + 392 篇 RSS 文章·Lanyun·BatchV2 生成·2026-04-18

AI 速读13 条精选

🤖 AI 大模型

𝕏 【重磅】Claude Opus 4.7 发布，登顶 AI 智能指数榜首

Anthropic发布Claude Opus 4.7，在Artificial Analysis智能指数中与GPT-5.4、Gemini 3.1 Pro并列第一。其GDPval-AA通用智能体基准得分1753 Elo，领先竞品79 分，幻觉率降低25 个百分点至36%，输出 token 用量减少35%。

𝕏 【重磅】Anthropic 发布 Claude Design，支持自然语言生成设计稿与原型

Anthropic发布Claude Design，由Claude Opus 4.7驱动，支持通过自然语言生成 UI 设计稿、交互原型、演示文稿和营销物料。可导入文本、图片、代码库，并导出为PPTX、PDF、HTML或交由Claude Code实现。

𝕏 ⭐ Anthropic 故意降低 Claude Opus 4.7 的网络安全能力以测试安全护栏

Anthropic 在发布 Claude Opus 4.7 前，通过训练实验有意降低了其网络安全能力，并添加了运行时分类器以阻止相关滥用。更强的 Mythos 模型将等待安全测试完成后再发布，此举被视为负责任扩展能力的实践。

𝕏 ⭐ vLLM 单节点推理性能提升 2.5 倍

AMD 与 EmbeddedLLM 发布技术博客，展示 MORI-IO KV Connector 如何在单节点上实现 vLLM 2.5 倍的高吞吐量（goodput），即使在最大负载下也能保持稳定的解码性能。

𝕏 ⭐ Claude Opus 4.7 在 Code Arena 评测中排名第一

根据 Code Arena 最新评测，Anthropic 的 Claude Opus 4.7 在代码能力排行榜上位列第一，领先第二名 GLM-5.1 达 46 分，在 React 和 HTML 子榜也均居首位。

𝕏 ⭐ Kimi Moonshot 发布 Prefill/Decode 分离架构，实现跨数据中心推理

Kimi Moonshot 推出 Prefill/Decode 分离 架构，结合其 Kimi Linear 混合模型，实现了跨数据中心及异构硬件的部署。在 20 倍规模的模型上验证，吞吐量提升 1.54 倍，P90 TTFT 降低 64%，旨在显著降低单 token 成本。

𝕏 ⭐ Grok 语音转文本及文本转语音 API 全面开放

xAI的Grok语音 API 现已全面开放，支持25 种语言、批量上传、实时流、词级时间戳、多通道音频和说话人分离功能。

𝕏 ⭐ MiniMax M2.7 模型在 Blackwell Ultra 上实现 2.5 倍吞吐量提升

vLLM 项目分享了 MiniMax M2.7 模型在 NVIDIA Blackwell Ultra 架构上的深度优化细节。通过新的 QK RMS Norm 内核和 FP8 MoE 模块化内核，在交互-吞吐量帕累托前沿上实现了高达 2.5 倍的性能提升。

𝕏 ⭐ 自进化智能体协议 Autogenesis 论文发布

一篇新论文介绍了 Autogenesis 协议，允许智能体识别自身能力缺口、生成改进方案、验证并集成，无需重新训练或人工修补，实现持续自我进化。

𝕏 ⭐ vLLM v0.19.1 发布，支持 Gemma 4、GLM 5.1 等模型

推理引擎 vLLM 发布 v0.19.1 版本，主要更新包括：升级 Transformers 至 v5.5.4，提升 Gemma 4 稳定性并支持 Eagle3 和量化 MoE，修复 Kimi K2.5 媒体占位符问题。

EVENT-DRIVEN INTELLIGENCE

免费先跟踪重点，再决定是否升级

每篇公开内容都对应三步：订阅每日情报、查看同主题历史上下文、升级 Pro 解锁搜索、研究和事件详情。

订阅每日情报查看同主题历史事件升级 Pro 解锁搜索 / 研究 / 事件详情

NEXT STEP · 留下邮箱

获取下一次重大事件提醒

每天一封精选情报，先用邮件建立复访，再决定是否升级到更深的追踪能力。

查看同主题历史事件升级 Pro 解锁事件详情