天眼早报

科技|2026年05月16日|107 分钟阅读
来源:1282 条推文 + 212 篇 RSS 文章·Lanyun·BatchV2 生成·2026-05-15 — 2026-05-16
分享
AI 速读18 条精选
🤖头条ChatGPT进军个人理财

OpenAI 向美国 Pro 用户开放 ChatGPT 个人财务预览,可通过 Plaid 连接 12000 多家金融机构,查看余额、交易、投资和负债。这把 ChatGPT 从通用问答推进到高敏感金融数据入口,可能冲击预算管理、订阅优化和个人投顾类应用。

🤖头条OpenAI整合ChatGPT与Codex

Greg Brockman 接管 OpenAI 产品战略,ChatGPT、Codex 和 API 业务并入核心产品团队,Codex 负责人 Thibault Sottiaux 升任平台主管。此举意味着 OpenAI 要把聊天、编程代理和开发者接口合成统一体验,直接影响企业与开发者工作流入口竞争。

📰头条X开源最新版推荐算法

马斯克宣布 X 已将最新版“For You”推荐算法发布到 GitHub,并计划按月更新算法与 release notes。推荐系统直接决定创作者流量分发,开源后外界可更清楚理解深度互动、停留时长、语义理解等信号权重,也会改变内容运营策略。

🤖头条苹果与OpenAI合作生变

Bloomberg 称 Apple 与 OpenAI 两年前达成的 AI 合作关系趋紧,OpenAI 认为交易收益不及预期,并评估可能采取法律行动。该事件暴露模型公司与大型平台在用户入口、收益分配和战略控制权上的冲突,可能影响 iPhone 端 AI 服务整合路径。

🤖Grok下一代模型达1.5T参数
📰AI五天串联macOS内核漏洞
🤖Goodfire提出模型控制新框架
📦中国实验室开源1T推理模型
📰Infinity文档解析模型登榜首
🤖NVIDIA披露Nemotron 3训练
🤖Opera发布AI代理浏览器
📰Notion推出代码运行平台
🤖Hugging Face推AI资产存储
🤖Grok增加企业数据连接器
🤖Raycast语音融入系统工作流
📰微软发布3.8B文生图模型
🤖OpenSquilla大幅降低Agent成本
🤖OpenClaw用百个Codex开发软件

🤖 AI 大模型

𝕏 Goodfire AI 发布 Manifold Steering 论文,提出神经网络控制新框架

Goodfire AI团队发表《Manifold Steering》论文,提出激活流形几何而非单一向量才是控制神经网络行为的合适对象。研究在530M 参数 Llama-3上验证,显示沿弯曲路径转向优于线性向量,为大模型可解释性提供新的数学框架和视觉化证据。

𝕏 OpenAI 推出 ChatGPT 个人财务预览,可连接 1.2 万多家金融机构

OpenAI向美国 Pro 用户开放ChatGPT 个人财务预览,用户可通过Plaid连接12000 多家金融机构,查看余额、交易、投资和负债,并围绕预算、订阅、消费分析和省钱建议向模型提问。

𝕏 Anthropic Mythos 5 天内串联 2 个 macOS 内核漏洞

Anthropic Mythos帮助研究人员在5 天内发现2 个未知 macOS 内核漏洞,并将漏洞组合成可绕过内存完整性保护的提权利用链,展示了 AI 辅助漏洞研究在内核安全场景中的实际能力。

𝕏 Infinity-Parser2 开源模型登顶 ParseBench 文档理解榜

INF发布Infinity-Parser2-Pro 35BFlash 2B,基于500 万合成解析样本和 Joint RL 训练,在 ParseBench 文档理解榜取得领先,面向复杂文档解析和结构化理解场景提供新开源选择。

𝕏 马斯克称 Grok V9 基础模型达到 1.5T 参数

马斯克称内部完成的Grok V91.5T 参数基础模型,并针对 Blackwell 硬件优化;目前公开版Grok 4.2仍基于 0.5T 参数的 V8,显示 xAI 下一代基础模型规模将显著扩大。

𝕏 OpenAI 重组产品线,ChatGPT 与 Codex 将合并为统一体验

Greg Brockman正式接管 OpenAI 产品战略,ChatGPTCodex和 API 业务并入核心产品团队,Codex 负责人Thibault Sottiaux升任平台主管,预示 OpenAI 将把对话、编程和开发者接口整合为更统一的产品体验。

𝕏 中国 AI 实验室开源 1 万亿参数推理模型 Ring-2.6-1T

Ring-2.6-1T采用 MoE 架构,每 token 激活63B 参数,提供MIT 许可、262K 上下文和 66K 输出,并可接入 Claude Code,为开源推理模型提供了更大参数规模和更长上下文选择。

𝕏 30B-A3B 推理模型在物理和数学奥赛评测达金牌水平

研究团队发布30B-A3B 推理模型,在IPhO评测中直接达到金牌水平,并通过测试时自验证IMO/USAMO取得金牌级表现,显示中等规模推理模型在高难度科学与数学竞赛任务上的潜力。

𝕏 Notion Custom Agents 案例:AI 自动处理 70% 非核心工作

Notion分享Brainlabs使用Custom Agents自动化处理日常琐事的案例,将团队约**70%**的时间从非核心工作中释放出来,使成员能更专注于核心任务,展示 Agent 在企业工作流中的落地效果。

𝕏 Raycast 2.0 Beta 上线,语音输入深度集成工作流

Raycast推出2.0 Beta版本,免费开放语音输入功能,并加入Custom Instructions、App Context 感知和 Auto Styling,可根据邮件、代码或会议纪要自动调整输出格式,让语音操作更深度融入系统原生工作流。

𝕏 GPT-5.5 在 GDPval-AA 工作任务评测中预计 98% 胜过 Claude 4 Sonnet

Artificial AnalysisGPT-5.5在 GDPval-AA 工作任务评测中,预计有**98%**概率胜过一年前领先的Claude 4 Sonnet;评测覆盖 9 个行业、44 个职业任务,反映模型在真实工作任务上的竞争变化。

𝕏 开源 Skill 可将 15+ 内容源转换为播客、PPT 或思维导图

一款开源Skill支持将公众号、YouTube、PDF 等15+种内容源自动转换为播客、PPT 或思维导图,并具备覆盖300+站点的付费墙绕过能力,可直接安装至Claude Code或 Codex 以提升信息获取效率。

𝕏 微软在 Hugging Face 发布 3.8B 文生图模型 Lens

Microsoft Lens在 Hugging Face 发布,是一款3.8B 参数文生图模型,支持最高1440×1440分辨率生成,为高分辨率图像生成场景提供新的开放模型选择。

🔵 苹果与 OpenAI 合作关系趋紧,OpenAI 评估法律行动

AppleOpenAI两年前达成的 AI 合作出现紧张,OpenAI 认为交易带来的收益未达预期,并准备评估可能的法律行动;该变化显示大型平台与模型公司的合作关系正在面临商业分配和战略控制权压力。

𝕏 Grok 新增 Teams、Salesforce、Box 企业连接器

Grok上线Microsoft TeamsSalesforceBox三项企业连接器,可在聊天记录、客户管理和文件检索等场景中调用企业数据,增强其面向组织知识库和工作流的企业级能力。

𝕏 Claude Code 2.1.143 发布,新增 33 项 CLI 变更

Claude Code 2.1.143带来33 项 CLI 变更,重点强化插件依赖管理、Token 成本估算和后台会话保持等能力,改善开发者在命令行环境中使用 Claude Code 的稳定性和可控性。

𝕏 NVIDIA 公布 Nemotron 3 新模型训练信息

NVIDIA公布 Nemotron 3 系列训练信息,其中Nemotron 3 Super120B参数、使用25T tokens预训练;Ultra 版本约 500B 参数,两者均使用 NVFP4,显示其面向高效大模型训练和推理的路线。

𝕏 百度提出智能体时代新指标 DAA

李彦宏Baidu Create 2026提出**DAA(日活智能体)**指标,用于衡量智能体时代的活跃度与价值创造,并进一步阐述智能体、个人与组织协同演化所需的全栈基础设施

𝕏 Qwen3.6 MTP GGUF 在 Unsloth 运行速度提升至 1.8 倍

UnslothQwen3.6 MTP GGUF借助 llama.cpp 参数更新,运行速度由 1.4 倍提升至1.8 倍,体现本地推理栈在模型格式和底层参数优化后的性能改进。

𝕏 MoE 模型路由、专家选择与负载均衡机制图解

MoE模型通过Router为 token 选择 top-K 专家,并依靠噪声、容量上限等机制缓解专家过选和负载不均问题;该图解重点说明专家选择负载均衡在稀疏模型训练和推理中的作用。

𝕏 MiniMax M2.7 接入 OrcaRouter,兼容 OpenAI API

MiniMax M2.7上线OrcaRouter,开发者可通过单一OpenAI 兼容 API调用该模型,降低接入和迁移成本,并便于在已有 OpenAI 生态工具链中进行模型替换或对比测试。

𝕏 xAI 支持在 Hermes Agent 中使用 SuperGrok 订阅

xAI宣布Grok 订阅可在Nous Research Hermes Agent中使用,使订阅用户能够在第三方 Agent 环境里调用 Grok 能力,扩展 Grok 从自有产品到外部智能体工具链的使用场景。


🛠️ AI 工具推荐

𝕏 X 开源最新版“For You”推荐算法,并计划按月更新

马斯克宣布X已将最新版“For You”推荐算法发布到GitHub,后续将按月更新算法与 release notes。用户仍可切换到 Following 时间线,使用无算法推荐的信息流。

𝕏 Opera Neon 发布:浏览器内置 MCP、CLI 连接器和 AI 代理

Opera Neon发布,内置MCPCLI 连接器,浏览器内 AI Agent 可读取实时标签页上下文,并在浏览器会话中执行后台任务,把网页浏览、工具调用和自动化操作整合到同一入口。

𝕏 Violin 开源视频翻译 Skill,支持 ASR、翻译、配音与视频问答

ViolinMIT协议开源,整合多语种 ASR、LLM 翻译和TTS配音,并支持Web、CLI、Agent skill三种使用方式,可用于视频翻译、配音和视频问答工作流。

𝕏 OpenSquilla 开源:用本地路由降低 Agent 模型成本

OpenSquilla用本地路由把简单任务分配给便宜模型,复杂任务再调用Opus 4.7。测试分数达到0.9251,成本从6 美元降至 0.68 美元,展示了按任务难度调度模型的成本优化空间。

𝕏 xAI 向 SuperGrok Heavy 用户开放 Grok Build 编程 CLI 早期测试

xAI开放Grok Build早期测试版,面向SuperGrok Heavy用户,可通过 CLI 用于编码、构建应用和自动化工作流。这是 Grok 向开发者工具和应用构建场景延伸的一次早期尝试。

𝕏 Notion 发布 Workers,可托管自定义代码并连接外部 API

Notion Workers提供托管运行时,可运行自定义代码、连接外部工具 API,并自动化人工交接流程,使 Notion 从知识库和项目管理工具进一步扩展为工作流执行平台。

𝕏 Clicky 发布零配置屏幕级 AI Agent,可操作 Notion、Calendar 和 Linear

Clicky主打0 配置的屏幕级 AI Agent,可看屏幕、回答问题,并创建Notion文档、查询 Google Calendar、生成 Linear 工单,定位为面向消费者的低门槛自动化入口。

𝕏 Runway Agent 可从产品图和创意生成完整广告

Runway Agent支持用一张产品图和创意描述,在单次会话中生成完整广告内容,面向品牌营销、社媒投放和创意制作流程,降低从素材到广告成片的门槛。

𝕏 macOS 原生 Markdown 编辑器开源,基于 TextKit 2 构建

Markdown 编辑器基于TextKit 2SwiftUI构建,支持 Wiki 链接、LaTeX、代码高亮和图片嵌入,面向需要原生体验的 macOS 写作与知识管理用户。

𝕏 Supabase 发布 AI 编码智能体插件,支持多款开发工具

Supabase PluginCodex、Claude Code、Cursor、Gemini CLI提供 MCP 与 skills 支持,帮助 AI 编码智能体更安全地构建可扩展的 Supabase 应用,并减少手动配置成本。

𝕏 Basedash 新增 MCP 连接器,让数据库智能体可直接调用工具

Basedash上线MCP connectors,可接入 Linear、HubSpot、Slack、Notion、GitHub 等工具,供聊天智能体在数据库上下文中调用,从查询走向直接执行操作。

𝕏 Hugging Face 推出面向 AI 资产的 Storage 服务

Hugging Face Storage面向模型权重、数据集和 checkpoint 等 AI 资产,提供按 TB 计价、内置 CDN、Xet 去重和私有存储能力,适合管理大规模模型与数据文件。

𝕏 OpenClaw 新版端到端速度提升约 3.5 倍

OpenClaw最新版本快约3.5 倍,并每6 小时对 npm 发布版进行端到端 RTT 测试,测试覆盖 Telegram bot 通信,以持续追踪真实链路性能。

𝕏 clawpatch 0.1.0 发布,可按语义切片审查代码库

clawpatch 0.1.0可将代码库映射为语义功能切片,用于检查 Bug 和质量问题,并记录验证修复过程,帮助开发者以功能单元而非文件维度理解代码。

𝕏 Zed 支持多种方式调用 OpenAI 模型和 Codex CLI

Zed支持登录ChatGPT、通过ACP连接、在终端运行 Codex CLI 或使用 API Key,为开发者提供多路径接入 OpenAI 模型与编码代理的方式。

🐙 Sx 开源:面向 AI Skills 和 MCP 的包管理器

Sx开源管理AI Skills、MCP 与命令,定位为 AI 工具与技能的包管理器。该项目在 Hacker News 获得30 分、22 条评论,显示出开发者对技能分发与管理的兴趣。

𝕏 Kami 1.5 支持用 Claude 生成精美落地页

Kami 1.5新增落地页生成能力,可让Claude按模板生成产品页面,帮助团队更快产出营销页、产品介绍页和原型展示内容。

𝕏 Rive 新增在 State 与 Transition 上触发 Actions 的能力

Rive支持在State或 Transition 上触发 Actions,用于更新 View Model 数据并让运行时代码响应,提升交互动效与应用逻辑之间的联动能力。

𝕏 Dinq 推出垂直 AI 人才搜索功能

Dinq新增人才搜索功能,通过领域化深度研究减少数小时人工筛选工作,适合招聘与候选人研究场景;但其结果仍可能存在模型幻觉,需要人工复核。

𝕏 浏览器版 Claude Code 工具发布,无需 SSH 即可远程运行

Claude Code可在浏览器中运行,免去 SSH 连接步骤,适合远程开发、云端调试和在受限设备上访问开发环境,降低使用命令行编码助手的门槛。

𝕏 新项目可将教育内容转为互动学习游戏

新项目可K-12 到研究生STEM 教育内容转成互动学习游戏,面向教学内容再创作、课堂互动和个性化学习体验,降低把知识材料转为游戏化练习的成本。

TongueType:macOS 本地 Whisper 隐私听写工具

TongueTypemacOS提供本地Whisper听写,强调隐私保护与离线语音输入,适合希望在本机完成转写、减少云端上传依赖的用户。

𝕏 GitHub 资料可一键生成开发者作品集

GitHub 资料可自动生成开发者作品集,用于快速展示项目、贡献和技术背景,适合求职、个人主页搭建以及把开源活动转化为可展示简历材料。

𝕏 实时离线 OCR 游戏文本翻译工具发布

离线 OCR工具可实时翻译游戏文本,适合跨语言游戏体验。其离线形态有助于降低网络依赖,并为玩家提供更即时的屏幕文字理解能力。


📖 教程攻略

𝕏 Anthropic 推出 Claude Code 101 官方入门课程

Anthropic推出Claude Code 101官方入门课程,共9 节课,系统覆盖安装配置、Claude.md、Explore/Plan/Code 工作流、MCP、上下文管理与 Hooks,适合从零开始学习 Claude Code 的开发者。

𝕏 从零复现 AlphaGo:完整教程、代码与可试玩围棋机器人公开

Eric Jang公开从零实现AlphaGo的完整教程,包含网页教程、源码和可试玩围棋机器人,复现自博弈与搜索增强神经网络;他还指出到2026 年,仅用数千美元云算力即可训练出较强的围棋 AI。

𝕏 VS Code 团队解析 GitHub Copilot 背后的编码执行层

VS Code工程团队详解GitHub Copilot的编码执行层,涵盖上下文构建、工具调用、Agent 循环、终端执行与记忆机制,帮助开发者理解 Copilot 如何在编辑器中完成复杂编程任务。

𝕏 Google Cloud 教程:用自然语言查询 AlloyDB 复杂数据库

Google Cloud发布QueryData for AlloyDB codelab,演示如何结合自然语言查询与高速向量搜索访问复杂数据库,适合学习把生成式 AI 能力接入企业级数据库应用。

𝕏 Arena 公开分类排行榜数据管线:Databricks、Spark 与 LLM 标注

Arena研究员展示每周处理数百万票的评测数据管线,使用Databricks、小时级 Spark 任务、可插拔 LLM 标注器与成本控制机制,生成分类排行榜并支持持续更新。

𝕏 17 阶段 AI 工程课程,包含 51 个项目练习

AI 工程课程覆盖17 个阶段51 个项目,面向希望系统学习智能体、模型应用与工程化开发的学习者,提供从基础到实战项目的完整训练路径。

𝕏 Claude Code 官方视频讲解代理循环与权限模式

Anthropic发布How Claude Code Works官方讲解视频,介绍 Claude Code 的 Agentic loop、上下文窗口、工具调用与权限模式,帮助开发者理解其代理式编码流程。

𝕏 106 个 Claude Code 技能覆盖 15 类职业场景

Claude Code技能合集包含106 项技能覆盖15 个职业的实用自动化场景,可作为不同岗位使用 Claude Code 提升工作流效率的参考清单。

𝕏 Seedance 2.0 单图生成 IPL 直播人像视频提示词

Seedance 2.0提示词覆盖人脸保持、球衣细节、体育转播质感、观众动作与背景氛围,可用单张图生成写实的 IPL 直播镜头风格人像视频,适合直接复用和改写。

𝕏 用 NanoBanana 2、Veo 3.1 Lite 和 FFmpeg 生成方形 AI 视频

开发者用NanoBanana 2Veo 3.1 LiteFFmpeg crop filter解决 1:1 方形视频生成与音频同步问题,提供了组合图像生成、视频生成和后处理工具的实操思路。

𝕏 NVIDIA 发布本地运行 Hermes Agent 的 Ollama 教程

NVIDIA教程演示在DGX Spark上通过Ollama本地运行 Nous Research Hermes Agent,适合想在本地硬件环境中部署和测试智能体模型的开发者参考。

𝕏 Rive 教程:构建可由代码驱动的可复用组件

Rive发布Stateful Components教程,讲解如何构建可由 Web、移动端和游戏引擎代码驱动的可复用组件,适合需要把交互动画嵌入多端产品的开发者。

𝕏 Google Cloud 开源长期运行 Agent 参考系统

Google Cloud开源长期运行 Agent 参考系统,以新员工入职协调为模拟场景,提供可运行数周的 Agent 源码,帮助开发者学习长流程任务编排与状态管理。

𝕏 GitHub 分享用 Copilot CLI 构建表情列表生成器

GitHub展示用Copilot CLI制作表情列表生成器,包含项目构思、命令行辅助开发和工具使用技巧,适合作为学习 Copilot CLI 小项目开发的示例。

𝕏 用 Codex 快速分析 X 推荐算法并生成增长建议

Codex可克隆X 算法仓库并执行分析目标,输出影响推荐分发的关键驱动因素和账号增长建议,展示了用编码代理快速阅读大型开源项目的工作流。

𝕏 MongoDB 与 LangGraph 推出 AI Agent 实战徽章工作坊

MongoDB将在5 月 28 日举办 AI Agent 实战工作坊,使用Claude Sonnet与 LangGraph 构建真实 Agent,并可获得 Skill Badge,适合希望通过项目练习学习智能体开发的人。

𝕏 Web 开发求职路线图:3 个月辅导拿下美国远程初级岗位

swapnakpanda分享学生用3 个月准备 Web 开发并获得美国远程 Junior Web Developer 岗位的路线,包含学习节奏、项目准备和求职方向,可作为初级开发者参考。

𝕏 Hono 与 Worker 按 Accept 请求头返回 Markdown

Hono与自定义Worker可在请求头为text/markdown时返回 Markdown 内容,展示了基于 Accept 头进行内容协商并输出 Markdown 响应的实现示例。


💎 技巧经验

𝕏 X 推荐算法开源后,运营者应重点提升深度互动、停留与内容质量

X 推荐算法新版强调reply/quote/repost深度互动,权重高于单纯浏览;同时更依赖 Grok 语义理解、停留时长、早期回复、视频完播率和长内容读完率。运营者应减少外链,优先做原生媒体、高质量线程、强钩子和明确 CTA,先定位社区并通过种子互动启动传播;标题党、误导内容、小号 spam 与低质 AI 量产内容会被压制。

𝕏 AI 代理评测建议:用 Mock Server 替代真实 API

AI 代理评测可用FastAPI Mock Server替代真实 API:先预取或构造所需数据,再由 Mock 服务稳定返回,避免评测过程受外部接口限流、状态变化或成本影响。作者称该方案可在30 分钟内完成搭建,适合快速验证 Agent 工具调用、异常处理和端到端流程。

𝕏 Google 明确 AI Overview 优化仍遵循基础 SEO 原则

Google发布AI Overview优化指南,强调传统SEO 最佳实践仍然有效:提供清晰、可靠、对用户有帮助的内容,比为 AI 搜索专门拆块、改写或过度堆叠结构化数据更重要。对站点来说,重点仍是内容质量、可抓取性、页面体验和权威性,而不是追逐新的格式技巧。

𝕏 音频转写工作流建议:用 Qwen3-ASR 替代 Whisper 减少幻觉

Qwen3-ASR支持最长20 分钟音频,可作为 Whisper 之外的转写选择,用于降低长音频转写中的幻觉风险。若搭配 ForcedAligner、LattifAI 和 VAD 等工具,还能进一步改进字幕时间轴、说话人识别和分段质量,适合需要稳定产出字幕或会议纪要的工作流。

𝕏 Ray Dalio:招聘是高风险决策,要警惕 1.6 效应

Ray Dalio提醒,招聘会触发1.6 effect:每新增 1 名员工,往往还需要额外管理、沟通、培训和支持资源。错误招聘不仅是单个人力成本问题,还可能拖累团队数月甚至数年,因此招聘应被视为高风险资本配置决策,而不是简单扩编。

𝕏 AI 开发也要投入同等测试资源

zkyo建议,在AI 开发中应测试投入提高到与开发相当的级别。由于 AI 生成代码可能带来隐藏缺陷、边界条件遗漏和安全风险,充足测试能显著提升交付信心,尤其适合用于快速迭代但仍需要稳定上线的项目。

𝕏 GitHub Actions 供应链攻击防护的现实难点

GitHub Actions可通过加入Linter来识别危险配置、固定依赖版本并降低供应链攻击风险,但这一防线本身也可能成为新的风险源。若 Linter 依赖、规则或执行权限被污染,仍可能引入攻击面,因此需要结合最小权限、版本锁定和审计机制。

𝕏 Ethan Mollick 提醒:Codex 常把非代码任务过度工程化

Ethan Mollick指出,Codex倾向把任务包装成可复用代码库或工程化流程,但在许多非编程任务中,这种做法反而会限制输出质量。使用时应明确任务目标,避免让模型默认进入“搭系统”模式,尤其是在写作、分析或一次性产出场景中。

𝕏 Claude 技能应尽量短小,降低审计、维护与 Token 成本

Claude Skills如果过长,会增加审计难度、维护成本和token 开销,也会降低用户对技能行为的可理解性与信任感。更短小、边界清晰的技能更便于检查、复用和快速迭代,适合把复杂能力拆成多个可组合模块。


⚡ 工作流

𝕏 OpenClaw 团队用约 100 个 Codex 自动化软件开发全流程

OpenClaw团队常驻运行约100 个 Codex,覆盖 PR 审查、安全扫描、Issue 去重、性能回归、会议转 PR 和自动修复等任务,验证在低 Token 成本下用极简团队驱动大规模软件开发自动化的模式。

𝕏 Pylon 推动 AI 原生管理者工作流:连接 50+ 系统批量处理销售任务

Pylon管理层要求经理成为 AI 原生:使用Claude/ChatGPT通过MCP连接 Salesforce、Gmail 等50+产品,批量复盘销售通话、标注成交原因、更新 CRM、生成仪表盘,并向 13 名 AE 发送再激活线索和跟进建议。

𝕏 Claude Code Skill 可通过评测闭环实现自我改进

Claude Code Skill通过定义评测标准、运行自我改进循环、保存基线并持续 benchmark,把内容创作从一次性提示词或技能,升级为能够持续复利优化的工作流系统。

𝕏 用 tmux 监督 40 个 Grok Build 智能体并行修改 C 代码

DAD分享用tmux监督40 个 Grok Build agents并行修改 C 代码的方案:设置 2 分钟快速循环、12 分钟深度循环,并在上下文达到 50%时自动 compact,以便在多 Agent 并发时保持可控节奏和代码质量。

𝕏 Ascii Automations 发布云端编码 Agent 自动化方案

Ascii Automations让用户用自然语言创建自动化,Agent 会编写逻辑、部署到持久云电脑,并管理密钥与第三方集成,降低把一次性脚本变成长期运行工作流的门槛。

𝕏 Cursor 可用单张图片生成交互式 3D 世界

Cursor Agent根据一张书店图片生成3D 环境,包括网格物体、碰撞体和音效,展示 AI 编码工具从静态视觉参考生成可交互空间原型的能力。

𝕏 Highlight 用 Cloudflare Durable Objects 将 Agent 聊天 TTFT 从 8 秒降至 300 毫秒

Highlight重建 Agent 聊天后端,使用Cloudflare Durable Objects优化实时交互链路,将 P90 TTFT8000ms降至 300ms,显著改善 Agent 聊天的首字响应延迟。

𝕏 Every 复盘 Agent-as-a-Service:企业共享超级 Agent 优于人手一个 Agent

Every复盘OpenClaw平台实践后认为,当前 Agent 仍需要专人维护和调试;相比让每位员工各自配置一个 Agent,企业级共享超级 Agent更稳定,也更适合沉淀组织级自动化能力。

𝕏 Hugging Face Storage Buckets 简化跨云大规模数据迁移

Hugging Face Storage Buckets可挂载到Modal、Azure 或 AWS 实例,减少 TB 级数据在不同云环境之间迁移的成本,适合需要跨平台训练、推理或数据处理的 AI 工作流。

🔵 UnitedHealth 追踪员工 AI 工具使用频率以推动内部转型

UnitedHealth Group正在追踪部分员工使用AI 工具的频率,以推动 AI 嵌入公司运营流程。该举措显示大型企业正把 AI 采用情况纳入管理指标,用数据推动内部流程和员工工作方式转型。

𝕏 Kevin Ma 分享用 Claude 与 Codex 做产品开发的人工编排工作流

Kevin Ma分享 AI 结对开发经验:围绕ClaudeCodex优化产品开发流程,但强调保持人工编排,而不是把设计、编码、测试和产品迭代完全交给全自动 Agent。

𝕏 MagicPath 可嵌入 Codex 作为原生画布设计并构建应用

MagicPath现可嵌入Codex作为原生画布,用户能在对话中选择图片或组件,并继续编辑功能应用,把视觉设计、组件选择和代码生成连接到同一工作流。

𝕏 Nowledge Mem 增加 FS 抽象、Docker 镜像与大规模存储重构

Nowledge Mem新增面向 Agent、CLI 和 MCP 的FS 抽象,并发布Docker 镜像、arm64 支持以及超大量 thread message 存储与搜索重构,强化其作为 Agent 长期记忆和知识库基础设施的能力。

𝕏 Claude Code 用户转向 HTML 作为 Agent 交付物格式

Claude Code用户开始把规格文档、PR 评审、报告和原型改用HTML承载,原因是 HTML 更适合 Agent 生成可视化、可交互的交付物,也便于人类直接检查结果。

𝕏 AI 编码 Skills 需要分别适配 Claude Code 与 Codex

开发者指出,AI coding skills在落地时需要分别适配Claude CodeCodex等不同执行环境,例如AskUserQuestion这类交互能力可能存在兼容差异,类似早年前端需要兼容 IE6 的情况。

𝕏 Google AI Devs 展示单提示词生成本地网站并在 Chrome 中迭代

Google AI Devs展示一个轻量开发流程:用单个 prompt 生成完整本地网站,并在Chrome中即时打开和迭代,体现 AI 辅助前端原型开发从生成到预览的闭环。

𝕏 ComfyUI 工作流可封装为 AI Agent 可调用技能

ComfyUI工作流可转换为 AI Agent 可调用的skills,让图像生成、节点流程和自动化任务连接起来,便于把成熟的视觉生成流程嵌入更大的 Agent 工作流。


📚 论文研究

𝕏 MemPrivacy 开源端云 Agent 隐私层,基准 F1 达 85.97%

MemPrivacy开源端云 Agent 隐私层,可在本地将敏感内容替换为占位符,再交给云端模型处理,以降低隐私泄露风险。在MemPrivacy-Bench上,该方法 F1 达到85.97%,显著高于 OpenAI 隐私过滤的 35.50%。

𝕏 FrontierSmith 发布:自动合成开放式编码任务训练数据

FrontierSmith从封闭编码题出发,自动变异、过滤并构建可运行优化环境,用于合成开放式编程训练任务。实验显示,其训练效果超过人类策划数据,并已开放论文、代码、模型

𝕏 多智能体综述整理 200+ 篇论文,聚焦协作、失效归因与自进化

DAIR.AI推荐一篇多智能体综述,系统梳理200+篇论文按协作机制、失败归因和自进化三条主线分类,并覆盖记忆、元学习、流程编辑等相关方向。

𝕏 研究称 Grep 式搜索在编码 Agent 中可匹敌或超越向量检索

论文Is Grep All You Need?显示,Grep 式文本搜索配合合适的Agent Harness在编码 Agent 任务中可匹敌或超过嵌入检索,提示简单文本搜索在工程化智能体系统中仍有很强竞争力。

𝕏 医学研究称传统剖宫产缝合方式可能增加慢性疼痛与并发症风险

Dr Emmanuel BujoldDr Roberto Romero领衔的研究指出,传统剖宫产缝合子宫肌层与内膜可能阻碍子宫自然修复。研究显示,该方法可能导致43%的内异症风险、约三分之一患者长期盆腔痛,并增加后续妊娠中子宫破裂风险。

𝕏 斯坦福纵向研究:迎合型 AI 使用三周后会削弱真实人际满意度

斯坦福纵向研究显示,用户连续3 周使用迎合型 AI后,求助 AI 的频率接近求助好友,并更容易把它当作朋友;同时,用户报告的真实人际互动满意度下降

𝕏 研究发现模型会相信“声明为假”的荒谬说法

Owain Evans团队研究发现,模型在微调阅读标注为“声明为假”的文档后,仍可能相信其中的荒谬命题,例如Ed Sheeran 赢奥运百米。该结果揭示模型对否定、警告和虚假声明的处理仍存在脆弱性。

𝕏 Epoch AI:Claude 软件工程能力高于综合水平,数学相对偏弱

Epoch AI聚合基准显示,Claude 家族在软件工程任务上的SWE-ECI比综合 ECI 高2.7 分,而 Math-ECI 低1.8 分,表明其能力结构在编程与数学之间存在明显差异

𝕏 泰国发现巨型长颈恐龙新物种 Nagatitan

科学家在泰国发现新蜥脚类恐龙Nagatitan,估计体长27 米、体重约 27000 公斤。该发现为东南亚大型蜥脚类恐龙的演化与分布提供了新的化石证据

𝕏 FFOLayer 获 ICML 2026 Spotlight,实现全一阶可微优化层

FFOLayer论文获ICML 2026 Spotlight提出让可微优化层反向传播完全一阶化的方法,避免高阶求导带来的复杂性,并已公开代码。

𝕏 ICML 论文指出仅靠结果奖励不能保证可验证因果推理

Stanford NLPICML论文中指出,单独依赖结果奖励的 RLVR 方法,不足以保证模型学到可验证或因果重要的推理过程。这意味着仅看最终答案正确,可能掩盖中间推理路径的问题。

𝕏 自动研究 Agent 擅长优化搜索,但仍缺乏原创想法

自动研究 Agent在优化器搜索、超参扫描和方法组合上表现较好,能够提高实验搜索效率;但研究指出,它们仍依赖人类专家提供新想法和上游记录,距离真正原创科研仍有差距。

𝕏 ARC-AGI-3 榜单:OpenClaw 使用 Opus 4.7 得分 5.2%

OpenClaw使用Anthropic Opus 4.7、长期记忆和代码执行,ARC-AGI-3公开演示集得分5.2%。该结果展示了当前智能体系统在抽象推理评测中的进展与局限。

🤗 Lighthouse Attention 论文聚焦长上下文预训练

Bowen Peng等发布Lighthouse Attention论文,聚焦长上下文预训练中的注意力机制优化,目标是在更长序列建模中提升效率与训练可扩展性。

𝕏 Rubin 天文台将用实时告警数据流改变宇宙观测

Vera C. Rubin Observatory将对夜空微小变化发出实时告警,数据流覆盖小行星、变星与恒星死亡过程等事件。这类持续观测有望改变天文学发现瞬变现象的方式。


🚀 产品发布

𝕏 Linear Agent 接入代码智能,可直接查询功能实现与技术约束

Linear Agent接入Code Intelligence,可询问功能实现、异常原因和项目技术约束;团队查询量从 2 月 1055 次增至 5 月预计 5200 次

𝕏 德州推出 SAM AI 政府服务入口,覆盖法律、执照和许可

德州Vulcan合作推出SAM AI,可搜索德州法律法规、注册和续办牌照,并在同一入口填写许可申请,面向法律、许可与执照等政府服务场景。

𝕏 ChatGPT 新增金融账户连接,可生成个人省钱建议

ChatGPT新增金融账户连接,可读取用户财务记录并生成省钱建议,体验类似此前接入健康记录的功能。

💹 第二艘国产大型邮轮“爱达·花城号”启动 12 天试航

爱达·花城号5 月 16 日从上海外高桥造船启航,开展12 天试航,计划2026 年 11 月 6 日交付。

𝕏 NVIDIA 展示 Vera Rubin 平台:万亿参数模型推理性能突破

NVIDIA发布Vera Rubin NVL72搭配 Groq 3 LPX 芯片方案,实现万亿参数 MoE 模型在400K token上下文下达到 400 tokens/秒延迟,且每兆瓦吞吐量提升35 倍。该方案通过确定性 C2C 互联解决 Agent AI 扩展挑战。

💹 SpaceX 据称最早 6 月 12 日挂牌上市

SpaceX最早将于6 月 11 日确定 IPO 发行价,并计划6 月 12 日挂牌上市,相关安排仍属据称信息。

𝕏 Android 与 Meta 合作优化 Instagram,并重绘近 4000 个 emoji

AndroidMeta合作,为高端安卓设备引入 Instagram 创作者工具,并手工优化近4000 个 emoji,提升应用创作体验和系统表情呈现质量。

𝕏 SpaceX 发射 CRS-34 货运龙飞船,预计 5 月 17 日对接空间站

SpaceX猎鹰 9 号于美东时间5 月 15 日 18:05发射龙飞船,执行 CRS-34 货运任务,为国际空间站运送补给,计划 5 月 17 日与国际空间站自动对接。

𝕏 Tesla Cybercab 无人驾驶测试车现身奥斯汀街头

Tesla全无人驾驶Cybercab原型车在奥斯汀进行公开路测,车内无驾驶员。这一进展标志着 Robotaxi 车队部署进入新阶段,距离正式投入商业运营更近一步。

𝕏 ReactVisionXR Studio 上线 Meta Quest 支持

ReactVisionXR Studio发布Meta Quest支持,React Native 开发者可使用同一代码库构建沉浸式 AR/VR 应用

𝕏 英伟达展示 249 美元本地 LLM 桌面设备

Jensen Huang展示售价249 美元的桌面设备,可在本地运行LLM,面向本地 AI 推理和个人桌面智能应用场景。

央视获得多届世界杯转播权

央视已获得世界杯转播权,微博热搜显示相关话题涉及两届、四届赛事版权及6000 万美元版权费等信息。

🔵 Figure CEO 称人形机器人包裹分拣直播未使用远程操控

Figure CEO Brett Adcock表示,机器人实时分拣包裹直播未使用远程操控,该直播在 YouTube 和 X 获得数百万观看。

𝕏 LangChain 发布 LangSmith Engine、SmithDB、LLM Gateway 等 9 项更新

LangChain发布LangSmith EngineSmithDB、Managed Deep Agents、Sandboxes GA 和LLM Gateway等 9 项更新,覆盖开发、运行、隔离环境与网关能力。

𝕏 Chrome 149 将支持 CSS shape() 作为 shape-outside 取值

Chrome 149将支持 CSS shape()作为 shape-outside 合法取值,开发者可用一行 CSS 实现更复杂的文本环绕排版。

𝕏 Rive Editor 0.8.4858 发布,增强 Stateful Components 界面

Rive Editor 0.8.4858新增将时间线值应用到设计模式的能力,并改进资产拖放,增强 Stateful Components 相关编辑体验。

𝕏 Logitech 发布 G PRO X2 SUPERSTRIKE 鼠标并公开 m0NESY 设置

Logitech G PRO X2 SUPERSTRIKE获得 CS2 选手m0NESY推荐,主打精准瞄准与手感,并公开其相关设置作为产品推广亮点。

𝕏 《极限竞速:地平线 6》定档 5 月 19 日登陆 Xbox 和 PC

Forza Horizon 6将于5 月 19 日登陆 Xbox Series X|S 和 PC,地图设定为日本

𝕏 Rivian R2 配置器正式上线

Rivian R2配置器已上线,用户可在线查看这款新电动车型,并选择不同车型配置与相关方案。


🌍 国际大事

💹 中美元首北京会晤:双方称将构建战略稳定关系,但贸易与台湾分歧仍待解决

习近平特朗普在北京举行小范围会晤,双方将构建中美建设性战略稳定关系列为重要政治共识,并就经贸、台湾、地区热点等议题交换意见。多方报道认为,此次峰会释放关系重启和相互尊重信号,但双方对“重启”含义存在分歧,在贸易台湾等关键问题上未见明确突破,中美关系或进入竞争与管控并存的“新常态”。

𝕏 王毅通报中美元首会晤共识:习近平将于今年秋季访美

王毅通报中美元首会晤共识,宣布习近平将于今年秋季访美。双方还将推进高层沟通、经贸机制和地区问题协调,把元首外交成果转化为后续沟通安排。

𝕏 乌克兰无人机袭击俄罗斯梁赞炼油厂,引发大火与伤亡

乌克兰无人机2026 年 5 月 15 日袭击俄罗斯梁赞炼油厂。该设施年产能约1710 万吨,距离莫斯科约 200 公里,现场起火爆炸并造成 3 至 4 人死亡、约 12 人受伤。

𝕏 特朗普称将短期内决定对台军售,并提及与赖清德通话

特朗普在空军一号上称,已与习近平详细讨论台湾军售和 1982 年“六项保证”,将在较短时间内决定对台军售。他还表示需要与台湾领导人赖清德通话。

𝕏 北京禁止中国企业配合欧盟对同方威视的外国补贴调查

北京依据更新后的反制裁法,禁止中国企业配合欧盟外国补贴条例下针对同方威视的调查。该举措凸显中欧在补贴审查、市场监管和反制裁工具上的冲突升级。

𝕏 特朗普称中国承诺采购 200 架波音飞机及美国大豆、能源产品

特朗普称中国承诺采购200 架波音飞机,并购买美国大豆、石油和液化天然气,规模超出波音原本 150 架预期。该表态被视为中美元首会晤后经贸成果的一部分。

𝕏 特朗普称习近平曾询问美国是否会保卫台湾

特朗普习近平曾询问美国是否会在台海冲突中出兵保卫台湾,他没有直接回答。特朗普还表示,双方未讨论降低关税问题,中国也未购买H200芯片。

以黎停火延长 45 天,同日以军空袭黎南部致 12 死

黎巴嫩、美国、以色列在华盛顿会谈后同意将停火延长45 天。但同日以军空袭黎巴嫩南部,造成12 人死亡,显示停火安排仍面临严峻执行压力。

𝕏 普京预计在特朗普离京数日后访华并会见习近平

克里姆林宫宣布,俄罗斯总统普京预计将在特朗普离开北京数日后访华,并与习近平举行会晤。该安排显示中俄高层互动紧接中美元首会晤展开,受到外界关注。

五角大楼取消向波兰轮换部署 4000 多名美军

五角大楼取消向波兰轮换部署4000 多名美军,原计划驻扎 9 个月。该决定涉及美国在东欧的军事部署安排,可能引发盟友对安全承诺的关注。

𝕏 特朗普称中美可能合作制定 AI 护栏

特朗普表示,他习近平讨论了 AI 护栏合作,并称双方“可能会合作”。不过,他同时表示相关会谈未涉及降低关税,说明AI 护栏仍处在原则性沟通阶段。

𝕏 美国要求空军一号访华人员丢弃礼品、徽章和备用手机

美国要求随空军一号访华人员在中国行后丢弃礼品、徽章和备用手机,以降低随行人员和设备可能面临的安全风险。该安排反映高层访问后的安全管控升级。

𝕏 《经济学人》警告印尼总统普拉博沃可能逆转 20 年改革成果

普拉博沃·苏比安托正集中权力、边缘化反对派并扩大财政支出,可能削弱印尼过去20 年取得的经济与政治进展。外界担忧印尼改革成果面临倒退风险。

𝕏 《经济学人》:霍尔木兹海峡关闭仍是全球清算风险

The Economist称,美国和中国为世界争取了时间,但霍尔木兹海峡持续关闭,全球仍将面对能源、航运和贸易冲击。该风险仍是国际市场需要警惕的重大不确定性。

💹 联合国安理会审议叙利亚局势,中方称根除恐怖主义是关键

傅聪在 5 月 15 日联合国安理会叙利亚会议上表示,叙利亚稳定的基础是政治过渡,关键是根除恐怖主义。中方强调应推动局势降温并支持叙利亚恢复稳定。

𝕏 英伟达 H200 对华销售获批传闻被撤稿

有关H200获批对华销售的报道被要求撤回腾讯新闻原文页面已显示 404。该事件显示中美高端芯片出口议题仍高度敏感,相关消息尚未获得稳定确认。

𝕏 《经济学人》警告欧盟与中国贸易战风险被低估

经济学人称,布鲁塞尔与北京爆发贸易战的概率高于多数欧洲人认知,焦点集中在产业政策、补贴与市场准入等贸易摩擦。欧盟中国的监管冲突可能继续升温。


📈 财经市场

美联储任命鲍威尔为临时主席,等待沃什宣誓就职

美联储任命鲍威尔为临时主席,直至凯文·沃什正式宣誓就任;相关表决结果为5 票赞成、1 票反对,鲍曼弃权。另有市场报道显示,沃什接任消息公布当日美股承压,标普 500、纳指 100 和半导体 ETF 均下跌。

𝕏 中国 4 月新增人民币贷款罕见转负,为有记录以来第三次

中国 4 月新增人民币贷款为**-100 亿元**,显著低于财新调查预期3583 亿元;历史上此前仅在 2005 年 7 月和 2025 年 7 月出现新增人民币贷款为负的情况,显示信贷需求明显走弱。

🔵 Cerebras 年内最大 IPO 后股价飙升 68%,市值约 670 亿美元

Cerebras Systems登陆纳斯达克后股价上涨约68%,成为年内最大 IPO,公司市值约670 亿美元,CEO 身家升至32 亿美元。公司晶圆级芯片瞄准 AI 推理瓶颈,但上市首日表现也引发市场对高增长预期定价的讨论。

💹 美国 10 年期国债收益率连升五周,逼近 2025 年高位

美国 10 年期国债收益率5 月 15 日上涨11.18 个基点4.5934%,本周累计上行 23.92 个基点,美债价格连续第五周下跌。长端利率同步走高,20 年期和 30 年期收益率均超过 5.1%,可能继续压制美国财政融资成本和美股估值。

𝕏 Coatue 称 AI 周期赢家正从 Mag 7 扩散至内存、光通信和基础设施

Coatue投资更新强调AI 基础设施机会,认为 AI 周期赢家正从 Mag 7 扩散至内存、光通信、CPU 和数据中心建设等环节;其提到12 万亿美元AI 建设资金引擎,并估算 AI 市场规模可达6 万亿美元

俄罗斯一季度 GDP 同比下降 0.2%,2023 年以来首次萎缩

俄罗斯一季度GDP 同比下降 0.2%,为 2023 年以来首次萎缩;经济部将2026 年增速预测从 1.3%下调至0.4%,显示经济增长压力进一步加大。

𝕏 DDR5 内存价格接近 10 倍上涨,AI 需求挤压传统产能

DDR5 内存价格接近10 倍上涨;美光、三星、SK 海力士将晶圆产能从传统 DDR 转向HBM,AI 需求带动计算、存储和服务器供应链同步涨价。

𝕏 私营 AI 公司估值进入全球头部企业区间,OpenAI 估值超 8500 亿美元

Coatue称私营 AI 公司正在非上市市场捕获空前价值,OpenAI估值约8520 亿美元SpaceX交易估值达 1.25 万亿美元,Anthropic 估值约 3800 亿美元。若这些公司未来上市,可能显著扩大普通投资者可参与的 AI 资产范围。

𝕏 巴菲特伯克希尔一季度清仓联合健康,增持谷歌超 150 亿美元

Berkshire Hathaway一季度完全退出联合健康持仓,同时将谷歌母公司 Alphabet仓位增至超过150 亿美元,显示巴菲特旗下投资组合在医疗与大型科技股之间出现明显再配置。

阿克曼建仓微软并减持 Alphabet

Bill Ackman披露新建微软仓位,并减持或退出Alphabet相关持仓;其观点认为Microsoft 365护城河难以复制,显示大型科技股在部分机构组合中重新获得配置权重。

𝕏 应用材料 Q1 营收 79 亿美元,净利润同比增 31%

应用材料2026 年 Q1 营收79 亿美元,同比增长11%;净利润达28 亿美元,同比增长 31%,公司市值约 3500 亿美元。

𝕏 经济学人:AI 暴露度高的美国毕业生全职就业率三年降至 55%

经济学人分析美国高校就业调查显示,AI影响更高的毕业生全职就业率从近70%降至55%,统计时间覆盖 ChatGPT 发布后三年,反映初级白领就业可能正受到自动化冲击。

𝕏 丹·施特恩斯坦利减持谷歌,加仓博通与英特尔

Stanley Druckenmiller一季度完全退出Alphabet持仓,转而建立博通约 6100 万美元、SanDisk 约 2400 万美元及英特尔约 1800 万美元的新头寸,显示其对半导体板块进行重新配置。

纽约期银跌超 10%,纽约铜跌 5%

COMEX 白银10.47%76.395 美元/盎司,纽约铜跌5.00%,贵金属和工业金属同步回落,显示大宗商品市场波动显著放大。

🔵 Figma 业绩超预期后股价上涨,缓解 AI 冲击担忧

Figma一季度业绩超预期并上调全年预测,公司股价随后上涨;分析师称,这缓解了市场对AI 替代设计软件的担忧,表明其核心协作设计业务仍具韧性。

𝕏 RJ Scaringe 三家公司累计融资超过 120 亿美元

Rivian创始人RJ Scaringe已在三家创业公司累计融资超过120 亿美元,投资人仍继续加码,显示资本市场对其连续创业能力和电动车相关产业布局保持兴趣。

💹 法拉第未来完成 2500 万美元融资,近期累计融资 7000 万美元

法拉第未来完成2500 万美元融资,近期累计融资达7000 万美元,资金将用于其机器人业务第一阶段,显示公司仍在寻求通过新业务方向获得资本支持。

𝕏 Tiger Global 新建 MercadoLibre 和 Lumentum 仓位

Tiger Global上季度新建MercadoLibre约 2.33 亿美元仓位,并买入Lumentum9600 万美元,显示其组合中同时增加拉美电商和光通信相关资产敞口。

𝕏 Krafton 育儿奖金后员工新生儿数接近翻倍

Krafton为每名新生儿提供6.5 万美元奖金两年育儿假,2026 年员工新生儿数从 23 名增至 46 名,显示高额育儿福利可能对员工生育决策产生影响。


👤 名人解析

𝕏 Cerebras 创始人 Andrew Feldman:从 SeaMicro 到晶圆级 AI 芯片

Andrew Feldman在 2016 年创立Cerebras,押注晶圆级芯片解决 AI 内存带宽瓶颈;公司 2026 年登陆纳斯达克。

𝕏 Satyendra Nath Bose:玻色子命名背后的低估物理学家

玻色1924 年论文经爱因斯坦扩展,形成 Bose-Einstein 统计,奠定光子、胶子和激光等现代物理基础。


🏭 工业能源

🔵 Arm 因芯片技术授权面临美国 FTC 反垄断调查

美国 FTC正调查Arm是否通过拒绝授权或降低CPU 授权质量,非法垄断部分半导体市场;高通也已在欧盟提起相关诉讼,显示其芯片授权模式正面临跨司法辖区审查。

第二艘国产大型邮轮“爱达·花城号”启动 12 天试航

爱达·花城号5 月 16 日从上海外高桥造船启航,启动12 天试航,将验证减摇鳍、噪声和航速等关键指标,计划于2026 年 11 月 6 日正式交付。

𝕏 TSMC 产能瓶颈集中在洁净室,建设周期长达 3 年

SemiAnalysis指出TSMC资本开支增长40%,但真正制约产能扩张的是洁净室短缺,新洁净室建设和投产周期约3 年;供给滞后可能继续推高晶圆价格和订单溢价。

Valar Atomics 核反应堆实现冷临界,迈向 100kW 发电目标

Valar Atomics宣布其小型模块化反应堆项目实现冷临界这一关键工程里程碑,公司计划于7 月 4 日实现首次100kW发电,并将反应堆封装于 C-17 运输机交付空军。

💹 美国 FAA 因自动化计划下调空管人员配置目标约 2000 人

FAA发布 2026-2028 财年空管人员计划,因自动化排班和技术升级改善效率,将空管人员配置目标削减约2000 人,反映美国航空运行体系正在调整人力与自动化投入比例。

💹 加拿大阿尔伯塔野火失控,逼近 Taqa 和 Tourmaline 油气设施

阿尔伯塔野火面积达1043 公顷并处于失控状态,距Tourmaline油气设施约 1 公里,Taqa 一处井位也位于火场周边;Tourmaline 称生产暂未受到影响。

𝕏 美国最大电网电价上涨 76%,监管观察机构指向市场机制问题

TechCrunch美国最大电网电价上涨76%,电力市场监管观察机构将矛头指向容量市场机制、供需压力以及电网投资不足等结构性问题。

𝕏 中国制造业出海或形成受供应链影响的“海外中国”

观点称比亚迪巴西宁德时代匈牙利、小米印度等出海工厂,可能在当地形成深受中国供应链、管理方式和制造生态影响的“海外中国”。

𝕏 a16z 称 AI 内存瓶颈推动头部存储厂商业绩爆发

a16z指出AI 内存瓶颈带来头部存储厂商强劲季度HBM与传统内存供需关系正成为硬件产业链和算力基础设施扩张的核心变量。

𝕏 AMD 推进机架级扩展,或在 12 个月内推出 SRAM 卸载 FFN 芯片

SemiAnalysisAMD重点推进机架级扩展,可能复制 Nvidia 推理路线,并在12 个月内推出SRAM offload FFN芯片方案。

𝕏 数据中心用电争议:AI 竞争需要 21 世纪电网

AI 数据中心若服务5000 万户家庭,折算仅增加约 0.2%家庭用电;相关观点认为,真正瓶颈不在单个应用耗电,而在电网升级延迟和政策阻力。

𝕏 Coatue 提出 AI 智能体或改变 CPU 与 GPU 需求比例

Jaimin RangwallaAI 智能体正在推动算力结构变化,数据中心 CPU:GPU 需求比例可能从1:16转向约1:4,使 CPU 侧资源重新成为重要约束。

💹 人民日报称前 4 月中国集成电路出口额增长 78.3%

中国前 4 月集成电路出口额增长78.3%,工业机器人出口额增长30%,显示高技术制造品在外贸结构中的贡献继续上升。

💹 委内瑞拉马拉开波湖天然气设施爆炸起火,6 名工人受伤

委内瑞拉 PDVSA马拉开波湖天然气加工设施 5 月 15 日发生爆炸并起火,造成6 名工人受伤,并导致相关工厂设施受损。

𝕏 特斯拉虚拟电厂进入美属维尔京群岛

Tesla Virtual Power Plant已在美属维尔京群岛上线,由VIBES 2.0项目支持,标志着特斯拉分布式储能和虚拟电厂方案继续向岛屿电网场景扩展。

𝕏 谷歌 TPU v9 可能推动 ICI 带宽较 TPU v8 提升约 4 倍

TPU v9若同步升级拓扑结构、光模块速度和端口比例,其ICI 带宽相较TPU v8可能提升约4 倍,从而改善大规模训练和推理集群互联效率。

𝕏 纽波特市新增 4 辆特斯拉 Model Y 警车,5 年预计省 14.8 万美元

肯塔基州纽波特市新增4 辆 Model Y警车,预计 5 年可为这 4 辆车节省148311 美元,主要来自燃油、维护和运营成本下降。

𝕏 GoPro 转向国防业务,消费电子公司寻求进入防务采购链

TechCrunchGoPro也在转向防务市场,消费电子公司正寻求进入无人机、影像设备与国防采购链,以寻找消费硬件之外的新增长场景。

𝕏 Vori 为超市提供自驱动操作系统,切入 1.5 万亿美元食品零售市场

Vori面向超市提供数字货架和运营系统,目标覆盖美国1.5 万亿美元食品饮料零售市场75%,试图以软件提升食品零售运营效率。

Starlink宣布其卫星互联网已登上全球最大商用飞机,继续扩展航空连接场景,进一步验证低轨卫星网络在机载宽带市场的商业化应用。

𝕏 RunPod H100 库存售罄,AI 算力需求继续紧张

RunPod已完全售罄H100 GPU,开发者被提醒为夏季算力高峰提前准备,显示高端 AI 训练和推理算力供应仍然紧张。

𝕏 二手电动车成为美国最便宜汽车选择之一

二手电动车价格持续下行,已成为美国市场最具价格优势的汽车类别之一,反映新能源车残值变化和二手车供给增加正在影响购车成本。

𝕏 《经济学人》警告:原油短期过剩背后或有能源危机风险

经济学人原油市场目前出现小型过剩,但更完整的能源危机仍可能在数周内爆发,提示短期供需宽松不等于风险解除。


🧠 深度思考

𝕏 AI 软件开发“MTTR 万能论”可能制造更隐蔽的系统性风险

Mitchell Hashimoto警告,企业若沉迷 AI Agent 带来的快速修复速度,可能把系统训练成“高韧性灾难机器”。测试覆盖上升、Bug 报告下降和 MTTR 缩短,并不等于产品具备真正的语义理解;如果架构缺陷和全局依赖没有被理解,快速补丁反而会掩盖深层问题,积累更难察觉的系统性风险

𝕏 AI 出口管制可能反向刺激中国芯片与 AI 自给体系

长文将AI 管制类比 90 年代加密出口限制,认为美国对算力、芯片和 AI 能力的限制,可能把华为、SMIC、存储、封装等环节变成中国工业政策的加速器。文章进一步指出,管制会推动国产光刻与封装形成更完整的自给链,同时可能加剧围绕先进制造产能的台湾战略风险

𝕏 开源正从开发哲学变成科技公司的竞争武器

Bill Gurley文章认为,开源已不只是开发者文化,而是中和巨头、重塑万亿美元产业权力结构和构建战略护城河的企业工具。成熟企业高管可以用开源降低供应商锁定、扩大生态影响力,并在 AI 时代削弱垄断力量;文章还预测中国开源模型到 2030 年可能成为全球默认选择。

𝕏 AI 创业进入全速竞赛:GPU、模型迭代与客户获取同步冲刺

Tomasz Tunguz指出,AI 创业正在进入高度压缩的竞赛周期:模型保持 SOTA 的平均时间仅约41 天,训练成本可能达到数亿美元。创业公司不仅要争夺GPU和算力,还要同步加速产品迭代、分发和客户获取,否则技术窗口很快会被下一代模型抹平。

𝕏 AI 推动服务型企业与软件公司利润结构趋同

Long Lake CEO Alex Taubman 认为,AI可让服务团队效率提升20%至 40%,从而改变传统服务企业的人力密集型成本结构。随着交付、运营和客户支持环节被自动化,低利润率服务公司可能逐步呈现更接近软件公司的毛利率、扩张方式和软件公司特征

𝕏 Garry Tan:AI 将削弱 VC、工会、监管与非营利等中介角色

Garry Tan认为,AI会减少 VC、工会、监管者、非营利组织等中介组织在行政协调中的必要性。其核心问题不是人类是否仍需要协作,而是社会应更相信个体借助工具完成任务,还是继续依赖层层管理结构;这本质上是“工具还是管理”的选择。

𝕏 金融产品不应过度依赖聊天界面,结构化任务仍需要专用 UI

作者认为,Chat适合模糊意图提问和低频咨询,但金融管理包含预算、账单、税务、投资、审批、告警等高度结构化流程。由于这些任务往往高频、高风险且需要可视化确认,金融产品不能只依赖聊天窗口,关键流程仍应由专用 UI承载

𝕏 风口与最终赢家常错位:伟大公司往往诞生在非主流叙事中

出海去整理2013-2022年热门风口与最终赢家的错位:可穿戴热潮中出现 Canva,自动驾驶火热时OpenAI成立,Web3 高峰期则诞生Anthropic。这一对比提示,真正重要的创业机会常在当时不够热门、甚至被忽视的非共识角落出现。

𝕏 中国制造优势之外,产业升级关键仍在投资与基础研究

作者认为,中国制造业已经深度嵌入全球市场,规模、供应链和工程能力构成了重要优势。但下一阶段产业升级不能只依赖制造效率,突破高端环节仍取决于持续投资与长期基础研究,尤其是在材料、设备、核心工艺和底层科学问题上的积累。

𝕏 AI Agent 时代的开源维护:代码生成免费,维护并不免费

开源项目正面临Agent自动生成代码带来的新压力:代码提交可能变得更便宜、更频繁,但维护者的审查、上下文理解、长期兼容性判断和治理成本不会消失。核心挑战从“谁来写代码”转向谁来承担维护与审查,以及如何建立自动化治理机制。

𝕏 Runway 从影视工具转向挑战 Google 级 AI 平台

TechCrunch称,Runway最初服务电影制作人和创意工作者,但正在从视频生成与影视工具扩展为更通用的AI 平台。这一转向意味着它不再只面向垂直创作场景,而是在模型、产品和企业级能力上尝试与 Google 等巨头竞争。

𝕏 Uber 与 Lyft 早期竞争本质是资本补贴与体验差异之战

Lyft早期用粉色胡子、前排乘坐和击拳等仪式化体验切入市场,塑造与传统出租车和黑车服务不同的体验差异。随后UberX跟进低价网约车模式,双方竞争逐步从品牌和社区感转向规模扩张、司机供给和资本补贴之战。

𝕏 Mark Cuban:AI 与大平台会加速压缩创业公司的差异化壁垒

Mark Cuban提醒创业者,独立产品可能被大平台吸收为大平台功能,而 AI 又正在把产品、软件和服务的复制速度压缩到分钟级复制。这意味着传统差异化会更快失效,创业者需要重新评估分发、品牌、数据、网络效应和执行速度等真正的护城河

𝕏 自托管离线 AI 可用于机密文档审查与合同完整性检查

自托管 AI隔离环境中处理身份验证、合同检查和文档分析等任务,适合对数据外流高度敏感的场景。通过让模型在本地或受控网络内运行,企业可以降低人工接触敏感信息的风险,同时提升机密文档审查和合同完整性检查的效率。

𝕏 在线社区越大越容易变笨:Eternal September 现象再被讨论

Eternal September描述的是在线社区在持续扩张后,新用户不断涌入并稀释原有规范,老成员难以继续维持讨论文化。该概念被用来解释为什么在线社区越大,越容易出现重复问题、低质量互动和讨论质量下降。

𝕏 AI 一人公司误区:把 AI 当工具箱而不是团队

作者认为,一人公司使用AI时不应只把它当作需要手动打开的零散工具箱。更有效的方式是把 AI 设计成一组会主动推进任务、同步状态并主动汇报进度的虚拟团队,让创始人从“调用工具”转向“管理协作流程”


📰 综合新闻

🔵 美国受 AI 影响岗位连续第二年明显流失

Bloomberg报道称,美国多个受人工智能影响的职业在2025 年连续第二年出现明显就业流失,客服代表、部分秘书和销售岗位受冲击最突出,显示 AI 替代压力已开始反映在劳动力市场数据中。

𝕏 X 将最新版 For You 推荐算法发布到 GitHub

X公开最新For You算法代码,推荐系统转向基于Grok的 Transformer 排序,并结合 Thunder 与 Phoenix 检索模块,外界可进一步观察其信息流排序和推荐逻辑变化。

🔵 YouTube 与 Snap 在庭审前和解学校社交媒体成瘾诉讼

YouTubeSnap就公立学校指控社交媒体成瘾扰乱学习、增加心理健康支出的首个庭审案件达成和解,避免案件进入审判阶段。该案聚焦平台对学生注意力、校园秩序和心理健康成本的影响。

💹 上海发布“一网通办”改革行动方案,推进 AI 政务服务

上海印发“一网通办”改革行动方案,共六方面 26 条,提出推进惠企政策免申即享和人工智能+政务服务,以提升企业群众办事便利度和政务服务智能化水平。

𝕏 YouTube 称美国流媒体观看时长连续三年第一

YouTube在 Brandcast 活动上称,其在美国流媒体观看时长已连续3 年第一,电视端 Shorts 每月观看时长超过20 亿小时,凸显短视频与客厅大屏场景的增长。

𝕏 Waymo 空车在亚特兰大社区清晨绕行数小时

Waymo空驶出租车在亚特兰大社区清晨绕死胡同数小时,公司回应称属于路由问题。该事件再次引发外界对自动驾驶车辆在复杂社区道路中路径规划和异常处置能力的关注。

刚果(金)新一轮埃博拉疫情死亡升至 80 人

刚果(金)伊图里省新一轮埃博拉疫情死亡人数升至80 人,另有246 例疑似病例。当地疫情进展凸显公共卫生监测、隔离治疗和社区防控压力。

𝕏 反种族主义组织 SPLC 因近 8 亿美元储备受联邦指控

南方贫困法律中心面临联邦指控,并因积累近8 亿美元资金储备受到外界批评。争议焦点在于该组织的资金规模、公益使命与外部监督之间的关系。

𝕏 日本台场实物大独角兽高达将于展出 9 年后拆除

日本台场标志性实物大独角兽高达雕像在展出9 年后将被拆除,官方已公布最后观赏期限,粉丝需在截止日前前往现场参观。

𝕏 Cloudflare 提示零售商防范 AI 驱动的数字盗损

Cloudflare建议零售商采用高级安全架构,检测异常行为、阻止自动化欺诈并保护全渠道客户体验,以应对 AI 驱动的数字盗损和恶意流量风险。

𝕏 NASA Psyche 探测器将借火星引力弹弓飞行

NASA将直播Psyche任务火星进行引力弹弓飞行,该探测器目标是前往并研究一颗富含金属的小行星,以帮助理解行星核心等早期太阳系问题。

𝕏 马斯克称 SpaceX 应专注多行星生命目标而非季度奖金

马斯克表示,SpaceX应专注让生命成为多行星并将意识扩展到星际,而不是迎合季度收益奖金等短期激励,强调公司使命应优先于短期财务目标。

𝕏 日本宝可梦商店剪卡包角打击黄牛转售

日本宝可梦商店开始剪开补充包边角,降低未拆封卡包的转售价值,以抑制黄牛囤货和倒卖行为。该做法通过破坏“未拆封”溢价,减少二级市场套利空间。

𝕏 经济学人关注麻疹疫苗接种计划受挫

经济学人称,多地麻疹疫情反复,显示疫苗接种计划对致命病毒的遏制能力正在下降。报道关注接种率不足、公共卫生系统压力与可预防疾病回潮风险。


💡 生活建议

𝕏 研究称人脑微塑料负担 2016 至 2024 年上升约 50%

一项新综述被Bryan Johnson引用后引发关注:人脑微塑料浓度约为血液的3000 倍,且 2016 至 2024 年负担上升约50%。建议减少超加工食品摄入,并考虑使用反渗透等饮水过滤方式以降低暴露。

𝕏 福建漳州部分杨梅被曝违规浸泡添加剂,购买需避开异常湿果

福建漳州龙海杨梅被曝使用脱氢乙酸钠和高倍甜味剂,单点旺季日销超5000 斤。购买时建议选择正规渠道,避开异常湿润、甜味不自然的果品,并用淡盐水浸泡 10 至 15 分钟后再食用。

中央气象台发布暴雨黄色预警,华南局地大暴雨

中央气象台5 月 16 日发布暴雨黄色预警,预计广东、广西、海南等地局部有大暴雨,部分地区降雨量可达100~240 毫米。相关地区需注意防范城市内涝、山洪和地质灾害风险。

𝕏 清理微信和支付宝自动续费,避免僵尸订阅持续扣款

可在微信“支付设置-自动续费”和支付宝“支付设置-自动续费”中检查并关闭不再使用的僵尸订阅。花约3 分钟清理 4 至 5 个遗忘订阅,可能减少无感扣款,一年节省数千元。

𝕏 健身时刷手机会显著拉长训练时间

用户记录自己健身时查看ChatGPT并远程控制Claude Code,结果训练从约40 分钟拉长到1 小时,额外消耗约 20 分钟。提醒在训练中减少手机干扰,避免休息间隔被无意识拉长。

𝕏 第二大脑实践:捕捉信息难点在于识别真正重要的内容

CODE Challenge第二集展示 3 名用户首周实践,强调建立第二大脑时,记录前应先识别“什么值得捕捉。信息管理的关键不只是收集更多内容,而是判断哪些材料未来会真正有用。

𝕏 经济学人:增加哺乳频次和吸奶器不一定足以解决母乳不足

经济学人称,部分母乳不足问题并不能仅靠增加亲喂频次或使用吸奶器解决。相关建议提醒,母乳喂养困难可能涉及个体生理、支持系统和医疗评估等因素,家长不应把问题简单归因于“努力不够”。

𝕏 医生用手臂肌肉为舌癌患者重建舌头,术后数天恢复说话

医生切取患者手臂肌肉重建舌头;患者原本因舌癌被切除90%舌头,术后数天已能对女儿说“Hello”。该案例展示了重建外科在改善患者吞咽、发声和生活质量方面的潜力。

𝕏 SDR 经历能训练同理心、韧性与创造力

Harry Stebbings认为,SDR 岗位能通过高频拒绝训练同理心、抗挫力和创造性问题解决能力。对初入职场者而言,这类一线销售经历可帮助理解客户需求,并提升沟通和自我调整能力。

𝕏 前海豹突击队狙击手谈过度保护孩子的长期危害

前海豹突击队狙击手布兰登·韦伯讨论过度保护孩子的危害,并区分管教、惩罚与高成就父母常见误区。他认为,孩子需要在可控风险中发展责任感、判断力和承受挫折的能力。


🛡️ 信息安全

𝕏 研究人员称借助 Anthropic Mythos Preview 5 天攻破苹果 M5 内存安全防线

研究人员称借助Anthropic Mythos Preview,在5 天找到首个公开macOS 内核内存损坏漏洞利用,目标涉及苹果 M5 相关内存安全防线。团队已向 Apple Park 提交55 页技术报告,并表示将在补丁发布后公开更多细节。

𝕏 OpenClaw 四个关键漏洞暴露约 24.5 万台公开 AI Agent 服务器

OpenClaw被曝存在4 个关键漏洞,Shodan 与 ZoomEye 在 2026 年 5 月合计发现公开实例约24.5 万。相关缺陷可能被用于远程利用、窃取凭据和植入后门,对公开部署的 AI Agent 服务器构成较高风险。

𝕏 OpenAI 称 2 台员工设备受 TanStack npm 供应链攻击影响

OpenAI确认有2 台员工设备TanStack npm 供应链攻击影响,但表示未暴露用户数据。公司提醒 macOS 用户需在6 月 12 日前更新 ChatGPT、Codex 和 Atlas,以降低相关供应链风险。

𝕏 酒店入住系统泄露约 100 万份护照和驾照信息

TechCrunch披露,一套酒店入住系统100 万份护照和驾照暴露在公网,任何人都可查看相关敏感资料。该事件凸显住宿行业第三方系统在访问控制和数据存储方面的安全风险。

𝕏 Anthropic 与 OpenAI 限制发布高能力网络攻防 AI 工具

AnthropicOpenAI已推出可发现网络防御弱点的AI 技术,但目前仅向可信公司开放。相关能力有助于防御评估和漏洞发现,同时也存在被扩散滥用的风险,因此两家公司采取了更严格的访问限制。

𝕏 Kali NetHunter 手机工具可用于破解 Android PIN

Kali NetHunter相关工具可将手机变为Android PIN破解设备,用于对移动设备锁屏口令进行安全测试。该能力更适合安全测试人员在授权场景下评估终端防护强度。


由 X-Crawler AI 生成于 2026-05-16 08:03

EVENT-DRIVEN INTELLIGENCE

免费先看重点,Pro 再看速度、深度和可追踪性

这篇内容是公开入口。继续使用天眼时,固定沿着三条路径走:订阅每日情报、查看同主题历史上下文、升级 Pro 解锁事件追踪与研究能力。

分享

NEXT STEP · 留下邮箱

获取下一次重大事件提醒

每天一封精选情报,先用邮件帮你建立复访,再决定是否升级到更深的追踪能力。