04月18日 · 科技晚报

天眼晚报

科技|2026年04月18日|25 分钟阅读
来源:1219 条推文 + 392 篇 RSS 文章·Lanyun·BatchV2 生成·2026-04-18
分享
AI 速读13 条精选

🤖 AI 大模型

𝕏 【重磅】Claude Opus 4.7 发布,登顶 AI 智能指数榜首

Anthropic发布Claude Opus 4.7,在Artificial Analysis智能指数中与GPT-5.4Gemini 3.1 Pro并列第一。其GDPval-AA通用智能体基准得分1753 Elo,领先竞品79 分,幻觉率降低25 个百分点36%,输出 token 用量减少35%

𝕏 【重磅】Anthropic 发布 Claude Design,支持自然语言生成设计稿与原型

Anthropic发布Claude Design,由Claude Opus 4.7驱动,支持通过自然语言生成 UI 设计稿、交互原型、演示文稿和营销物料。可导入文本、图片、代码库,并导出为PPTX、PDF、HTML或交由Claude Code实现。

𝕏 ⭐ Anthropic 故意降低 Claude Opus 4.7 的网络安全能力以测试安全护栏

Anthropic 在发布 Claude Opus 4.7,通过训练实验有意降低了其网络安全能力,并添加了运行时分类器以阻止相关滥用。更强的 Mythos 模型将等待安全测试完成后再发布,此举被视为负责任扩展能力的实践。

𝕏 ⭐ vLLM 单节点推理性能提升 2.5 倍

AMDEmbeddedLLM 发布技术博客,展示 MORI-IO KV Connector 如何在单节点上实现 vLLM 2.5 倍的高吞吐量(goodput),即使在最大负载下也能保持稳定的解码性能。

𝕏 ⭐ Claude Opus 4.7 在 Code Arena 评测中排名第一

根据 Code Arena 最新评测,AnthropicClaude Opus 4.7 在代码能力排行榜上位列第一,领先第二名 GLM-5.146 分,在 ReactHTML 子榜也均居首位。

𝕏 ⭐ Kimi Moonshot 发布 Prefill/Decode 分离架构,实现跨数据中心推理

Kimi Moonshot 推出 Prefill/Decode 分离 架构,结合其 Kimi Linear 混合模型,实现了跨数据中心及异构硬件的部署。在 20 倍规模的模型上验证,吞吐量提升 1.54 倍,P90 TTFT 降低 64%,旨在显著降低单 token 成本。

𝕏 ⭐ Grok 语音转文本及文本转语音 API 全面开放

xAIGrok语音 API 现已全面开放,支持25 种语言、批量上传、实时流、词级时间戳、多通道音频和说话人分离功能。

𝕏 ⭐ MiniMax M2.7 模型在 Blackwell Ultra 上实现 2.5 倍吞吐量提升

vLLM 项目分享了 MiniMax M2.7 模型在 NVIDIA Blackwell Ultra 架构上的深度优化细节。通过新的 QK RMS Norm 内核和 FP8 MoE 模块化内核,在交互-吞吐量帕累托前沿上实现了高达 2.5 倍的性能提升。

𝕏 ⭐ 自进化智能体协议 Autogenesis 论文发布

一篇新论文介绍了 Autogenesis 协议,允许智能体识别自身能力缺口、生成改进方案、验证并集成,无需重新训练或人工修补,实现持续自我进化。

𝕏 ⭐ vLLM v0.19.1 发布,支持 Gemma 4、GLM 5.1 等模型

推理引擎 vLLM 发布 v0.19.1 版本,主要更新包括:升级 Transformers 至 v5.5.4,提升 Gemma 4 稳定性并支持 Eagle3 和量化 MoE,修复 Kimi K2.5 媒体占位符问题。


EVENT-DRIVEN INTELLIGENCE

免费先跟踪重点,再决定是否升级

每篇公开内容都对应三步:订阅每日情报、查看同主题历史上下文、升级 Pro 解锁搜索、研究和事件详情。

分享

NEXT STEP · 留下邮箱

获取下一次重大事件提醒

每天一封精选情报,先用邮件建立复访,再决定是否升级到更深的追踪能力。