天眼晚报
Anthropic发布新一代模型,在多项关键基准上超越GPT-5.4和Gemini 3.1 Pro,标志着大模型竞争格局的重大变化。
基于Claude Opus 4.7,可通过自然语言生成高保真交互设计稿,可能颠覆传统UI/UX设计流程,是AI应用的重要里程碑。
国家市场监管总局开出巨额罚单,整治网络餐饮乱象,对平台经济监管和消费者权益保护产生深远影响。
全球关键能源通道局势再度紧张,已导致国际油价波动,对全球能源安全和宏观经济构成直接风险。
顶级投资人将其高效AI编程工作流开源,包含23个工具,为开发者社区提供了强大的生产力范式参考。
🤖 AI 大模型
𝕏 🔥 🔥【重磅】Claude Opus 4.7 发布,登顶 AI 智能指数榜首
Anthropic发布Claude Opus 4.7,在Artificial Analysis智能指数中与GPT-5.4、Gemini 3.1 Pro并列第一。其GDPval-AA通用智能体基准得分1753 Elo,领先竞品79 分,幻觉率降低25 个百分点至36%,输出 token 用量减少35%。
𝕏 🔥 🔥【重磅】Anthropic 发布 Claude Design,支持自然语言生成设计稿与原型
Anthropic发布Claude Design,由Claude Opus 4.7驱动,支持通过自然语言生成 UI 设计稿、交互原型、演示文稿和营销物料。可导入文本、图片、代码库,并导出为PPTX、PDF、HTML或交由Claude Code实现。
𝕏 🟢 ⭐ Anthropic 故意降低 Claude Opus 4.7 的网络安全能力以测试安全护栏
Anthropic 在发布 Claude Opus 4.7 前,通过训练实验有意降低了其网络安全能力,并添加了运行时分类器以阻止相关滥用。更强的 Mythos 模型将等待安全测试完成后再发布,此举被视为负责任扩展能力的实践。
𝕏 🟢 ⭐ vLLM 单节点推理性能提升 2.5 倍
AMD 与 EmbeddedLLM 发布技术博客,展示 MORI-IO KV Connector 如何在单节点上实现 vLLM 2.5 倍的高吞吐量(goodput),即使在最大负载下也能保持稳定的解码性能。
𝕏 🟢 ⭐ Claude Opus 4.7 在 Code Arena 评测中排名第一
根据 Code Arena 最新评测,Anthropic 的 Claude Opus 4.7 在代码能力排行榜上位列第一,领先第二名 GLM-5.1 达 46 分,在 React 和 HTML 子榜也均居首位。
𝕏 🟢 ⭐ Kimi Moonshot 发布 Prefill/Decode 分离架构,实现跨数据中心推理
Kimi Moonshot 推出 Prefill/Decode 分离 架构,结合其 Kimi Linear 混合模型,实现了跨数据中心及异构硬件的部署。在 20 倍规模的模型上验证,吞吐量提升 1.54 倍,P90 TTFT 降低 64%,旨在显著降低单 token 成本。
𝕏 🟢 ⭐ Grok 语音转文本及文本转语音 API 全面开放
xAI的Grok语音 API 现已全面开放,支持25 种语言、批量上传、实时流、词级时间戳、多通道音频和说话人分离功能。
𝕏 🟢 ⭐ MiniMax M2.7 模型在 Blackwell Ultra 上实现 2.5 倍吞吐量提升
vLLM 项目分享了 MiniMax M2.7 模型在 NVIDIA Blackwell Ultra 架构上的深度优化细节。通过新的 QK RMS Norm 内核和 FP8 MoE 模块化内核,在交互-吞吐量帕累托前沿上实现了高达 2.5 倍的性能提升。
𝕏 🟢 ⭐ 自进化智能体协议 Autogenesis 论文发布
一篇新论文介绍了 Autogenesis 协议,允许智能体识别自身能力缺口、生成改进方案、验证并集成,无需重新训练或人工修补,实现持续自我进化。
𝕏 🟢 ⭐ vLLM v0.19.1 发布,支持 Gemma 4、GLM 5.1 等模型
推理引擎 vLLM 发布 v0.19.1 版本,主要更新包括:升级 Transformers 至 v5.5.4,提升 Gemma 4 稳定性并支持 Eagle3 和量化 MoE,修复 Kimi K2.5 媒体占位符问题。
🛠️ AI 工具推荐
𝕏 🔥 🔥【重磅】Garry Tan 开源其 AI 开发工具栈 GStack
Y Combinator CEO Garry Tan 开源其个人 AI 开发工具栈 GStack,包含 23 个工具,可将 Claude Code 转变为完整工程团队。他声称在 60 天内编写了 60 万行 生产代码,其中 35%为测试。
𝕏 🔥 🔥【重磅】Anthropic 推出 AI 视觉设计协作工具 Claude Design
Anthropic Labs推出Claude Design,基于Claude Opus 4.7视觉模型。用户可通过对话生成原型、幻灯片和单页,支持导入设计系统、代码库,并与Canva深度集成。该工具旨在将设计探索时间从20 轮迭代缩短至2 轮。
𝕏 🟢 ⭐ Cloudflare 发布 Agent Readiness 评分及优化框架
Cloudflare推出Agent Readiness评估工具,扫描20 万域名发现仅0.0092%支持MCP。其提出四维就绪度模型,并分享文档重构经验,可使Agent的Token消耗降低31%,答案获取速度提升66%。
𝕏 🟢 ⭐ 极简自我进化 Agent 框架 GenericAgent 发布
一款名为GenericAgent的自主 Agent 框架在GitHub开源,核心代码仅约3000 行,内置 9 个工具,可让大模型直接操控电脑。其特点是任务执行路径会自动固化为技能,实现越用越聪明。
𝕏 🟢 ⭐ Salesforce Headless 360:将整个平台作为 API、MCP 和 CLI 暴露
Salesforce推出Headless 360,将其整个平台(包括Agentforce和Slack)作为API、MCP和CLI暴露,使所有 AI 代理能直接访问数据、工作流和任务。
𝕏 🟢 ⭐ Hermes Agent 生态系统涌现多个社区进化项目
Nous Research 的 Hermes Agent 项目(GitHub 96k+ stars)催生了多个社区进化体,包括:hermes-webui(浏览器/手机端 UI)、hermes-dashboard(实时监控与自动 Wiki)、hermesclaw(微信桥接器)等,展示了强大的可扩展性。
𝕏 🟢 ⭐ 基于墨水屏的 Claude Code 状态监控与审批工具
开发者将 Claude 实体 buddy 项目改造为可在 M5 Paper 墨水屏上运行的工具,只需安装 Cloud Code 插件,即可在家中任何地方监控和审批 Agent 状态。
𝕏 🟢 ⭐ 专为 AI 智能体设计的自我进化引擎 Evolver
GitHub 上出现一个名为Evolver的 AI 智能体自我进化引擎,能自动扫描运行日志和错误模式,生成带有协议约束的提示词,引导智能体完成系统性的自我修复与迭代。
𝕏 🟢 ⭐ GStack v1.0 正式发布,集成 26 个编程代理技能
Garry Tan 宣布 GStack v1.0 正式发布。这是一个集成了 Claude Code、Codex 等编码代理的技能集和可编程浏览器,包含 26 个预设技能,覆盖从 CEO 到 QA 的多个角色,采用 MIT 开源许可。
𝕏 🟢 ⭐ GBrain v0.11 发布:为 OpenClaw 带来 10 倍速的 Minions 任务系统
Garry Tan推出GBrain v0.11,引入Minions队列/任务系统,基于BullMQ和PostgreSQL,旨在解决 OpenClaw 子代理超时问题,号称速度提升10 倍。
𝕏 🟢 Cloudflare 开发无损推理压缩系统 Unweight
Cloudflare为在其全球网络上高效运行 LLM,开发了名为Unweight的无损推理时压缩系统,可实现高达**22%**的模型体积缩减。
𝕏 🟢 ⭐ GStack v1.0 正式发布:为 Claude Code/Codex 设计的技能集
Garry Tan发布GStack v1.0,这是一个包含26 个预设技能的开源工具集,旨在充当 CEO、工程师等角色,提升 AI 编码代理的工作效率。
𝕏 🟢 Bun install 将大幅降低内存占用
在下一个版本的Bun中,bun install将实现流式解压 tarball 到磁盘。在一个大型仓库中,此改进将内存占用降低了17 倍。
𝕏 🟢 ⭐ Claude Code 新增 Recap 功能解决长对话遗忘问题
Claude Code 推出 Recap 功能,旨在解决长时间对话后模型遗忘上下文的问题。用户 yan5xu 分享了该更新,暗示这可能是对用户痛点的直接回应。
𝕏 🟢 Bun v1.3.13 将优化内存与可靠性
JavaScript 运行时Bun的下一个版本v1.3.13将于明天发布,重点包含多项内存使用和可靠性方面的改进。
𝕏 🟢 Obsidian Web Clipper 插件可一键保存网页和提取 YouTube 字幕
推荐Obsidian官方Web Clipper插件,可一键将网页内容保存至 Obsidian,并支持直接提取YouTube字幕。需在插件设置中新建模板并配置参数。
𝕏 🟢 Claude Code CLI 发布 2.1.112 版本,修复自动模式错误
Claude Code CLI 更新至2.1.112版本,主要修复了自动模式下可能出现的“claude-opus-4-7 is temporarily unavailable”错误,恢复了自动模型选择功能。
𝕏 🟢 Claude Code 修改 npm 发布方式,放弃 minify js
Claude Code修改了 npm 发布方式,放弃了minify js,使用相同二进制,开发者无需再担心打包sourcemap的问题。
𝕏 🟢 Windows-MCP:连接 AI 代理与 Windows 操作系统
Windows-MCP项目旨在将 AI 代理连接到Windows操作系统,实现更深度的系统交互与控制。
📖 教程攻略
𝕏 🟢 ⭐ Anthropic 设计师分享 Claude Design 的 7 条核心使用建议
Anthropic设计师 Ryan 提出 7 条建议:1. 先花 1 小时搭建Design System;2. 与工程师实时迭代;3. 用Comment工具进行视觉批注;4. 生成Video Demos;5. 善用Docs/Slack连接器;6. 让 Claude 创建专属工具;7. 知道何时手动完成。
𝕏 🟢 实现 LLM 推理效率前沿的 5 种技术
文章介绍了提升LLM推理效率的 5 种关键技术:跨模型层的语义路由、预填充和解码分解、量化、上下文路由以及推测性解码。
𝕏 🟢 公众号排版工具性能优化:解决卡顿与内存占用问题
开发者binghe分享其公众号排版工具的性能优化方案,通过输入防抖和图片自动压缩,将内存占用降低10 倍以上,解决了长文与多图场景下的卡死问题。
𝕏 🟢 Vibe Coding 最佳实践:构建、销售、测试、修复四环飞轮
分享一套结合 AI 的开发工作流:Build(AI 自动开发,人类陪伴家人)、Sale(开发调研文档直接用作博客内容)、Test(验收时录制开箱视频即测试)、Fix(视频吐槽点自动生成 Bug 清单交由 AI 修复)。核心是人类保留关键决策与品味判断。
💎 技巧经验
𝕏 🟢 智能硬件显示屏选型指南
分享智能硬件显示屏选型经验:墨水屏不伤眼但断电画面留存;VFD/透明 OLED效果酷炫但强光刺眼;Memory LCD强光效果佳需背光;低成本可选字符点阵 LCD或旧手机。
𝕏 🟢 使用 Grok 4.3 快速制作浏览器游戏的提示模板
分享一个用于Grok 4.3的提示模板,用户只需描述想要的游戏,即可生成一个可玩的、自包含的HTML游戏。模板要求输出单文件、无外部依赖、并添加游戏手感优化。
⚡ 工作流
HAMi VGPU Webhook 架构与准入流程解析
文章基于 HAMi v2.8.0 源码,分析了其 Webhook 的处理范围、工作时序及以 NVIDIA GPU 为例的容器变更逻辑,为 Kubernetes 集群 GPU 虚拟化调度提供技术参考。
📚 论文研究
𝕏 🟢 研究提出“认知伴侣”架构,实时监控并提升 LLM 推理质量
新研究提出Cognitive Companion并行监控架构,其中基于Probe的变体能从模型隐藏状态检测推理退化,实现零推理开销。在易循环任务上,基于 LLM 的伴侣将重复率降低了52-62%。
𝕏 🟢 OpenAI 发布 GPT-Rosalind 生命科学推理模型
OpenAI推出专为生物学、药物发现和转化医学研究设计的前沿推理模型GPT-Rosalind,旨在支持相关领域的研究工作流。
🚀 产品发布
𝕏 🔥 🔥【重磅】Anthropic 发布 Claude Design,可直接生成交互设计稿
Anthropic发布Claude Design,用户可通过自然语言描述和上传截图,AI 直接生成可交互、可动态演示的高保真设计稿。该产品提供脑暴模式和深入设计模式,被评价为设计领域的“Claude Code 时刻”。
𝕏 🔥 ⭐ Anthropic 推出 Claude Design,对话式生成高保真设计原型
Anthropic发布Claude Design,用户可通过对话生成原型、幻灯片和单页。由Claude Opus 4.7驱动,支持品牌系统自动学习、精细化调整和多格式导出,并可一键交付给Claude Code开发。
𝕏 🔥 ⭐ Anthropic 发布 Claude Design,可通过对话生成可交互原型
Anthropic 推出由 Claude Opus 4.7 驱动的 Claude Design,用户可通过自然语言聊天生成可交互原型、幻灯片和单页海报,并与 Claude Code 无缝打通。
𝕏 🟢 ⭐ Grok 语音转文字 API 正式上线
xAI宣布Grok的语音转文字 API 现已可用,支持25 种语言的即时多人转录,并称其为市场上价格最优的方案。
𝕏 🟢 ⭐ Google 将 ProducerAI 更名为 Flow Music 并上线新功能
Google将 AI 音乐创作平台ProducerAI正式更名为Google Flow Music,纳入Google Flow产品家族。同步上线“替换”和“延展”两项 remix 功能。
🌍 国际大事
🔥【重磅】伊朗军方宣布恢复对霍尔木兹海峡的严格管控
伊朗武装部队 发言人声明,因美国“背信弃义”继续海上封锁,霍尔木兹海峡 的管控已恢复至此前状态,处于武装部队的严密管理与严格控制之下。此前,约 10 艘船只尝试穿越但被劝返,国际油价随之波动。
𝕏 🟢 伊朗称霍尔木兹海峡已开放,美伊或周一在巴基斯坦会谈
伊朗方面称霍尔木兹海峡已开放,但美国表示在达成协议前其封锁令依然有效。特朗普政府一名高级官员透露,美伊双方或于周一在巴基斯坦举行会谈。
📈 财经市场
🔥【重磅】七家电商平台因‘幽灵外卖’被罚 35.97 亿元
国家市场监管总局对拼多多、美团、京东、饿了么、抖音、淘宝、天猫等 7 家平台开出35.97 亿元罚单,因其未履行审查义务,放任6 万余家‘幽灵店铺’通过转单逃避监管,导致消费者高价买到低质食品。
🏭 工业能源
𝕏 🔥 ⭐ 分析:AI Agent 导致全球服务器 CPU 短缺,供给瓶颈显现
分析指出,AI Agent 的兴起导致全球云市场服务器 CPU 严重短缺。AWS 等厂商已无多余产能,Intel 和 AMD 供给受限,预计今年将提价两位数。
𝕏 🟢 ⭐ 苹果计划在中国销售的 iPhone 中使用长江存储芯片
苹果 计划将中国产 YMTC(长江存储) 芯片用于仅在中国市场销售的 iPhone,该批设备不会出口至美国等市场。
🧠 深度思考
𝕏 🔥 ⭐ 扎克伯格评马斯克裁员:为全行业树立了效率标杆
Meta CEO 扎克伯格 在访谈中表示,尽管手段粗暴,但马斯克裁掉推特 80% 员工并移除冗余管理层的做法,向全行业证明了组织可以极度精简并正常运转,倒逼科技巨头重新审视自身架构。
𝕏 🟢 ⭐ AI Agent 工具生态正从“玩具”走向“生产”
今日 AI Agent 工具涌现,包括企业级连接器、官方 SDK 和操作级编排框架,标志着 Agent 生态正进入真实工作流,从实验性工具转向生产级应用。
📰 综合新闻
𝕏 🟢 Meta 据报计划裁员约 10%,影响 8000 名员工
路透报道称,Meta 正准备裁员约 10%,即 8000 名员工。裁员计划于 5 月 20 日 进行,预计下半年还会有更多裁员。
由 X-Crawler AI 生成于 2026-04-18 20:01
每日精选 · 直送邮箱
订阅天眼日报
AI 精选科技要闻摘要,每天一封,免费无广告。