天眼晚报
🤖 AI 大模型
𝕏 【重磅】Claude Opus 4.7 发布,登顶 AI 智能指数榜首
Anthropic发布Claude Opus 4.7,在Artificial Analysis智能指数中与GPT-5.4、Gemini 3.1 Pro并列第一。其GDPval-AA通用智能体基准得分1753 Elo,领先竞品79 分,幻觉率降低25 个百分点至36%,输出 token 用量减少35%。
𝕏 【重磅】Anthropic 发布 Claude Design,支持自然语言生成设计稿与原型
Anthropic发布Claude Design,由Claude Opus 4.7驱动,支持通过自然语言生成 UI 设计稿、交互原型、演示文稿和营销物料。可导入文本、图片、代码库,并导出为PPTX、PDF、HTML或交由Claude Code实现。
𝕏 ⭐ Anthropic 故意降低 Claude Opus 4.7 的网络安全能力以测试安全护栏
Anthropic 在发布 Claude Opus 4.7 前,通过训练实验有意降低了其网络安全能力,并添加了运行时分类器以阻止相关滥用。更强的 Mythos 模型将等待安全测试完成后再发布,此举被视为负责任扩展能力的实践。
𝕏 ⭐ vLLM 单节点推理性能提升 2.5 倍
AMD 与 EmbeddedLLM 发布技术博客,展示 MORI-IO KV Connector 如何在单节点上实现 vLLM 2.5 倍的高吞吐量(goodput),即使在最大负载下也能保持稳定的解码性能。
𝕏 ⭐ Claude Opus 4.7 在 Code Arena 评测中排名第一
根据 Code Arena 最新评测,Anthropic 的 Claude Opus 4.7 在代码能力排行榜上位列第一,领先第二名 GLM-5.1 达 46 分,在 React 和 HTML 子榜也均居首位。
𝕏 ⭐ Kimi Moonshot 发布 Prefill/Decode 分离架构,实现跨数据中心推理
Kimi Moonshot 推出 Prefill/Decode 分离 架构,结合其 Kimi Linear 混合模型,实现了跨数据中心及异构硬件的部署。在 20 倍规模的模型上验证,吞吐量提升 1.54 倍,P90 TTFT 降低 64%,旨在显著降低单 token 成本。
𝕏 ⭐ Grok 语音转文本及文本转语音 API 全面开放
xAI的Grok语音 API 现已全面开放,支持25 种语言、批量上传、实时流、词级时间戳、多通道音频和说话人分离功能。
𝕏 ⭐ MiniMax M2.7 模型在 Blackwell Ultra 上实现 2.5 倍吞吐量提升
vLLM 项目分享了 MiniMax M2.7 模型在 NVIDIA Blackwell Ultra 架构上的深度优化细节。通过新的 QK RMS Norm 内核和 FP8 MoE 模块化内核,在交互-吞吐量帕累托前沿上实现了高达 2.5 倍的性能提升。
𝕏 ⭐ 自进化智能体协议 Autogenesis 论文发布
一篇新论文介绍了 Autogenesis 协议,允许智能体识别自身能力缺口、生成改进方案、验证并集成,无需重新训练或人工修补,实现持续自我进化。
𝕏 ⭐ vLLM v0.19.1 发布,支持 Gemma 4、GLM 5.1 等模型
推理引擎 vLLM 发布 v0.19.1 版本,主要更新包括:升级 Transformers 至 v5.5.4,提升 Gemma 4 稳定性并支持 Eagle3 和量化 MoE,修复 Kimi K2.5 媒体占位符问题。
EVENT-DRIVEN INTELLIGENCE
免费先跟踪重点,再决定是否升级
每篇公开内容都对应三步:订阅每日情报、查看同主题历史上下文、升级 Pro 解锁搜索、研究和事件详情。