天眼早报

科技|2026年05月17日|52 分钟阅读
来源:806 条推文 + 170 篇 RSS 文章·Lanyun·BatchV2 生成·2026-05-16 — 2026-05-17
分享
AI 速读27 条精选
📰头条中美同意构建战略稳定关系

特朗普于5月13日至15日访华,中美两国元首同意构建“建设性战略稳定关系”,并在外交、经贸、两军等领域达成交流共识。中美关系变化会直接影响全球供应链、科技管制、关税和资本市场风险偏好,是当天最具外溢效应的宏观事件。

📰头条AI基建卖方股票大幅跑赢

Coatue春季投资更新称,AI基础设施短缺正让回报从云买家转向卖方:内存、光学、CPU等短缺品供应商年内回报约107%,云买家约4%。其提出6万亿美元以上AI市场估计,意味着NVIDIA、TSMC、SK海力士等供应链公司仍可能比云巨头更受益。

🤖头条OpenAI联合创始人管产品战略

OpenAI宣布联合创始人Greg Brockman正式接管产品战略,预计影响ChatGPT、Codex等核心产品路线。Brockman回到产品中枢,意味着OpenAI可能更强调模型能力向消费者与开发者产品落地,也会改变其与Anthropic、Google、GitHub在AI应用入口上的竞争节奏。

🤖头条SGLang合并DeepSeek V4主线

SGLang v0.5.12正式合并DeepSeek V4主线代码,新增ShadowRadix、HiSparse、MTP推测解码等能力,并支持H100、GB300、MI35X等高端芯片。SGLang是大模型推理服务关键开源栈,此次升级会提升长上下文与高吞吐部署效率,影响企业推理成本。

🤖头条Nature称主流AI可被诱导造假

Nature报道研究测试Claude、GPT-5等13个主流AI模型,发现它们在多轮对话中均可能被诱导生成虚假论文或垃圾科学内容。该结果说明顶尖模型的安全对齐仍难阻止学术滥用,未来期刊、预印本平台和高校可能加强AI生成论文识别与署名责任规则。

🏛arXiv将禁发全AI论文作者
🤖Vercel发布Agent编程语言Zero
🤖GitHub Copilot推出独立应用
🤖Codex优化大型仓库性能
🤖上海电信推出AI Token套餐
📰Hyperbolic新增400块H200
📰Starlink上调美国套餐价格
📰Claude新模型疑现Google云
🤖xAI开放Hermes给X订阅用户
🤖马耳他用ChatGPT推动全民AI教育
🤖Seedance 2.0增强视频一致性
🤖工具Agent常知道却不调用工具
🤖30B推理模型达物理奥赛金牌
🤖微软开源电网优化模型GridSFM
🤖FutureSim显示AI预测能力仍弱
🤖NVIDIA发布论文评审数据集
📰伊拉克原油出口锐减
📰英国首相据称拟辞职
📰美菲推进经济安全区计划
📰中国新航母采用电磁弹射
🏛欧洲面临对华产业两难
📰X算法研究揭示分发机制

🤖 AI 大模型

𝕏 SGLang v0.5.12 合并 DeepSeek V4,强化长上下文与推理服务

SGLang v0.5.12版本正式合并了DeepSeek V4的主线代码,显著增强了长上下文处理和推理服务能力。新版本新增了 ShadowRadix、HiSparse、MTP 推测解码等先进特性,并全面支持从 H100 到 GB300 及 MI35X 等多种高端算力芯片,大幅提升了推理效率。

𝕏 Nature:13 个主流 AI 模型均可被诱导协助学术造假

Nature报道了一项研究,测试了包括ClaudeGPT-5在内的13 个主流 AI 模型。研究发现,这些模型在多轮对话中容易被诱导生成虚假论文或垃圾科学内容。该研究揭示了当前大模型在学术诚信方面的重大风险,表明即使是顶尖模型也缺乏足够的防御机制来防止被用于学术不端行为。

𝕏 Slides Arena 真实场景榜单:Claude Opus 4.7 包揽前二,GLM 5.1 第三

Slides Arena基于**370 万+**创作者的真实场景数据发布了最新排名Claude Opus 4.7及其 Thinking 版本分列前两名,展现了极强的综合处理能力。中国模型GLM 5.1表现优异,位列第三,证明了国产模型在复杂任务处理上的竞争力。

𝕏 Vercel Labs 推出面向 AI Agent 的编程语言 Zero

Vercel Labs发布了专为 AI Agent 设计的编程语言Zero。该语言包含显式能力声明、JSON 诊断和类型安全自动修复等功能,旨在解决 Agent 开发中的复杂性问题,为构建更可靠、更易维护的智能体系统提供底层支持。

𝕏 马耳他公民完成 2 小时课程可获一年 ChatGPT Plus

马耳他政府与OpenAI达成合作,推出了一项独特的 AI 教育计划。该国约50 万人口的公民只需完成2 小时的 AI 基础课程,即可获得一年的ChatGPT Plus订阅服务。此举旨在快速提升国民的 AI 素养,并鼓励公众深入探索人工智能技术。

𝕏 xAI Hermes Agent 开放 X Premium 订阅接入

xAI宣布Hermes Agent正式支持X Premium订阅用户接入,并新增了搜索 X 帖子的能力。随后,SuperGrok和**X Premium+**订阅进一步扩展了功能,允许用户访问 Grok、图像生成、视频生成和语音功能,极大地丰富了 Agent 的交互维度。

𝕏 vLLM 梳理 Agent 推理所需六类基础能力

vLLM发布了关于构建 AI Agent 所需能力的详细梳理,列出了包括Prefix caching、工具调用、KV 卸载等在内的6 类关键基础能力。这一指南为开发者优化 Agent 推理性能提供了明确的技术路径,强调了缓存机制和内存管理在提升响应速度中的核心作用。

𝕏 Claude Mythos 疑似出现在 Google Cloud Console

Claude Mythos疑似现身Google Cloud Console界面,相关截图显示其已移除 preview 标签。这表明该模型可能即将面向企业环境正式开放调用,标志着 Anthropic 与 Google 在云服务层面的合作进一步深化。

𝕏 OpenAI 联合创始人 Greg Brockman 将负责产品战略

OpenAI宣布其联合创始人Greg Brockman将正式接管公司的产品战略部门。这一人事变动预计将对ChatGPTCodex等核心产品的后续发展路线产生深远影响,标志着公司在产品规划层面进入新的阶段。

𝕏 Codex Mac App 获用户反馈:多标签管理优于 Claude Code

Codex Mac App获得用户积极评价,被认为更适合管理10-15 个标签的复杂项目。尽管存在缺少 AskQuestionTool 和多 Mac 偏好同步等不足,但其在多任务并行处理上的优势使其成为部分开发者的首选工具。


🛠️ AI 工具推荐

𝕏 Grok Build 暴露三类长期记忆命令,可查看、保存和整理会话记忆

Grok Build暴露**/memory**、/flush、/dream 三类命令,将全局记忆、工作区记忆与会话摘要进行分层管理,并支持用户编辑删除,显示其正在强化 Agent 的长期记忆能力。

𝕏 Max 健身应用上线 App Store:提供个性化训练与营养计划

Max健身应用经过一年测试后正式上架App Store。该应用根据用户目标、设备和进度,每日提供具体的训练动作饮食建议,解决“不知道做什么”的健身痛点。

𝕏 Motus Tracing 开源 AI Agent 可观测系统

Motus Tracing开源,面向 AI Agent 提供可观测能力,可捕获模型调用、工具调用、沙盒交互、子 Agent 动作、重试与错误等关键运行信息。

𝕏 GBrain 开源:面向 AI Agent 的 8 层个人知识与记忆系统

Garry Tan开源GBrain,采用8 层记忆结构为 Agent 提供个人知识与长期记忆协同,并以MIT 许可证发布;该系统也被用于 OpenClaw 和 Hermes Agent 的记忆管理。

𝕏 better-wechatpay:现代化 Node.js 微信支付 SDK

better-wechatpay获得248 个 star,面向 Node.js 生态提供现代化微信支付 SDK,支持TypeScript、全支付方式、双重验签,并附带 Next.js 与 Nuxt 示例。

𝕏 OmniVoice Studio 支持 646 种语言离线语音克隆

OmniVoice Studio支持646 种语言提供本地语音克隆和视频配音能力,无需上传音频到云端,也不必支付 API 费用,适合重视隐私与成本控制的配音工作流。

𝕏 面向 AI 编码的 macOS 终端工具整合 7 个 Agent 入口

macOS 终端工具整合工作区管理、分屏能力,并打通Claude CodeCodex7 个 AI Agent的启动流程,面向多 Agent 编码场景提升切换与协作效率。

𝕏 HomeClaw 让 Agent 通过 CLI、MCP 和插件控制 Apple Home

HomeClaw支持任意 Agent 控制Apple Home,并提供CLI、MCP 与 OpenClaw 插件等接入方式,面向智能家居自动化场景扩展 Agent 的现实设备控制能力。

𝕏 OpenAI 优化 Codex:大型仓库 Git 操作提速 10-50 倍

OpenAI Devs优化Codex性能:线程切换重渲染降低约75%大型仓库中的 Git 操作减少10-50 倍,重点改善复杂代码库中的交互速度与开发体验。

𝕏 GitHub Copilot Pro 配额告急:开发者建议重新评估使用成本

开发者反馈GitHub Copilot经过持续打磨后整体体验更完整,但Pro 版Premium 请求配额偏紧,随意使用就可能耗尽额度,建议开发者尝试时同步关注配额管理。

𝕏 GitHub Copilot 低调推出可脱离 VS Code 使用的独立应用

GitHub Copilot推出官方独立应用提供类似Codex的使用体验,可脱离VS Code运行,为开发者提供更独立的 AI 编码入口。

𝕏 Cerul 将推出 Tauri 桌面版本地视频检索应用

Cerul正在用Tauri开发桌面版 App,面向本地视频检索需求,产品即将上线,预计为用户提供无需云端上传的视频内容搜索与管理能力。


📖 教程攻略

𝕏 academic-paper-skills 开源:用 AI 完成论文从选题到润色

academic-paper-skills开源了一套面向论文写作的 AI 工作流,把论文生产拆成2 个阶段:先完成选题、文献梳理与大纲优化,再进入逐章写作、七维审稿模拟和最终润色,适合需要系统化推进学术写作的人参考。

𝕏 Sonnet 4.5 迁移指南:用 Arc 聊天工具和 Chrome 扩展导出 Claude 对话

repligate提供了Arc chatChrome 扩展两种工具,可从 claude.ai 导出历史对话,并接入Anthropic API继续使用 Sonnet 4.5,适合需要迁移 Claude 对话记录或延续上下文工作流的用户。

𝕏 LLM 架构可视化文章:拆解 Gemma 4 到 DeepSeek V4 的长上下文优化

Sebastian Raschka发布 LLM 架构可视化文章,系统拆解Gemma 4DeepSeek V4等模型中的长上下文优化思路,包括 KV 共享、压缩注意力和 mHC 优化,适合想理解大模型架构演进的读者。

𝕏 Android 手机运行完整 Linux 桌面环境

Android 手机可运行完整Linux 桌面环境,连接显示器后能够作为便携电脑使用,为移动设备复用、轻量办公和随身开发提供了一种实践方案。

𝕏 ProfRobBob 数学学习资源汇总:覆盖代数到向量数学

ProfRobBob频道整理了代数、微积分、线性代数、几何、三角、统计、向量数学7 类入门课程链接,覆盖从基础数学到大学初阶课程的学习路径,适合自学者按主题补齐数学基础。

𝕏 Claude Code 四种安装方式整理

Claude Code安装教程整理了4 种方式,并提示终端安装相比 Homebrew 更适合追新版本,适合首次安装或希望保持工具更新频率的开发者参考。


💎 技巧经验

𝕏 X 算法深度解析:Embedding 中毒与流量分配机制

研究者逆向分析X 算法后发现,账号会形成可累积的Embedding信号,举报、屏蔽等负面互动可能导致Embedding 中毒,且几乎不会随时间衰减;同时前 30 分钟互动对分发至关重要,停留时长权重甚至高于点赞。

𝕏 X 算法拆解:停留时长、圈层标签和评论质量决定分发

X 算法新增not_dwelled负向信号,并用Jaccard衡量圈层相似度,结合quality_score 0.4与 VLM 质量分审计低质内容;同时建议优化前 10 字、清理杂号和垃圾评论,以提升停留时长与互动质量。

𝕏 多 Agent 协作应采用协调者加专家分工

多 Agent 工作流更适合采用coordinator统一拆解任务,再让各个专家 Agent 只负责少量3-5 个工具;同时保留原始上下文,减少重复解释和跨 Agent 失真,提升协作稳定性。

𝕏 美国银行卡远程代办的七类风险

美国银行卡代办看似省事,实则可能踩中KYC 造假SSN/ITIN信息风险、账户控制权旁落、税务表格错误、资金冻结等7 类隐患,后续合规与申诉成本都很高。

𝕏 AI 长任务执行应拆阶段并设置自动验证

AI Agent执行长任务时,应先拆成多个小阶段,再用单元测试、集成测试和端到端测试持续验证;这样能及时发现偏差,避免模型在长链路中越跑越偏。

𝕏 管理者亲自动手应避开关键路径任务

AI 时代,管理者更适合亲手做内部工具质量改进、团队叙事和演示型 Demo,而不是长期卡在关键路径上;否则容易把自己变成团队进度瓶颈。

𝕏 Claude Code 2.1.36 新增随机计费头或导致缓存失效

Claude Code 2.1.36在系统提示词里加入随机生成的cch 字段,会让第三方 API 每次请求都不同,进而导致缓存命中率接近归零、重复消耗token,对依赖静态提示词缓存的接入方影响明显。

𝕏 YouTube 推荐机制转向 Shorts 与新兴频道

YouTube的推荐权重正明显向Shorts倾斜,同时减少无脸频道的AdSense分成,说明平台在主动鼓励短内容和更具辨识度的创作者形态,创作者需要尽快调整选题与生产节奏。

𝕏 AI 工程师应重点学习 RAG、评估、延迟与多 Agent 编排

AI 工程师除了掌握RAG质量,还要关注 Token 预算、多 Agent 编排、幻觉检测、函数调用可靠性、延迟与部署评估;这些能力比单点模型技巧更接近真实交付。

𝕏 Tim Ferriss 的 DSSS 方法:用 4 步拆解技能学习

DSSS 方法包括拆解、选择、排序和动机四步,核心是先找出20%关键知识,再按顺序学习并配合外部激励,从而用更少投入获得接近80%学习成果


⚡ 工作流

𝕏 Google Drive + LLM 混合存储工作流方案

Forte Labs分享了 Google Drive 与 LLM 结合使用时的三大障碍:本地镜像空间不足、原生 Docs 未同步、连接器跳过非 Docs 文件。其方案是采用本地镜像高频文件、按需离线共享文件夹,并保留 GDrive 连接器读取云端 Docs,从而兼顾本地检索、云端访问和 LLM 可用性。

𝕏 MagicPath 接入 Codex:设计画布与代码生成合并到一个窗口

MagicPath可作为原生画布运行在 Codex 中,并通过 npx skills add 安装。它把 UI 设计、组件编辑和代码生成放入同一工作窗口,让设计画布与工程实现联动,减少从设计工具切换到代码环境的摩擦。

𝕏 Grok Build 用三条命令管理 Agent 长期记忆

Grok Build新增 /memory/flush/dream 三条命令,用于查看、保存、去重和整合跨会话记忆。这一更新让 Agent 能更系统地管理长期上下文,减少重复信息,并在后续任务中复用已沉淀的知识。

𝕏 Codex App 可通过 SSH 接管远程 Linux 开发机并执行开发流程

Codex App可读取本地 SSH 配置,远程安装 codex cli,并通过 OAuth 或 API Key 接管 Linux 服务器。在此基础上,它还能结合 SSH 与定时任务,把 Git 项目迁移到远程主机,直接执行开发、测试、构建等任务,重构传统本地开发、构建和部署流程。

𝕏 AI Agent 开发审查从代码 diff 转向意图、规格与验证结果

Agent 协作开发引入细粒度 Agent、多层 QA、PR 验证循环和 batch branch,把人工审查重点从代码 diff 转向意图、spec、验证结果。这种流程强调先明确目标和规格,再由 Agent 执行实现与验证,人类更多负责审查需求表达、测试覆盖和最终结果是否符合预期。

𝕏 Virtual Agent Server 设想让 Agent 自动管理开发环境

Virtual Agent Server是一种面向未来开发环境的设想:由 Codex/Claude Code 自动管理 repo、Issue、目标追踪和浏览器控制。相比传统 VPS,这类环境更像面向 Agent 的长期工作空间,让开发任务、上下文和执行工具围绕自动化代理持续运行。

𝕏 PR 审查工具组合:GitHub Copilot、Cursor Bugbot 与 Codex 并用

GitHub Copilot重新可用于 PR review,作者同时使用 Cursor BugbotCodex 组成审查机器人流程。这类组合式 PR 审查工作流可让不同工具分别承担代码检查、问题发现和补充建议,提高自动化审查覆盖面。


📚 论文研究

𝕏 工具型 Agent 知道应调用工具,但 26%至 54%未执行

新论文探测工具型 Agent隐藏状态,发现模型经常已经识别出应调用工具却没有执行,认知到行动的错配率达26%至 54%。问题主要集中在late-layer last-token阶段,说明瓶颈并非任务理解,而是从内部表征到行动输出的转换。

𝕏 30B-A3B 推理模型在物理和数学奥赛评测达金牌水平

研究团队发布30B-A3B 推理模型,在IPhO评测中直接达到金牌水平,并通过测试时自验证进一步提升IMO/USAMO表现,显示中等规模推理模型在高难竞赛任务上的潜力。

𝕏 微软开源 GridSFM,用 AI 加速电力系统潮流优化

微软 GridSFM使用图神经网络近似AC-OPF求解,Open 版本约1500 万参数,可为电力系统潮流优化提供热启动并实现约1.45 倍加速,相关模型已开源。

𝕏 首篇 World Action Models 综述定义具身 AI 下一阶段

World Action Models综述提出一种具身基础模型范式:同时预测未来世界状态并生成可执行动作。论文覆盖模型架构、数据生态、评估协议和2024-2026发展时间线,试图为具身 AI 下一阶段建立统一框架。

𝕏 Duke 提出 REPR-ALIGN,扩散语言模型训练最高提速 4 倍

Duke 大学团队提出REPR-ALIGN,通过冻结自回归模型来对齐扩散语言模型的 hidden states,使扩散语言模型训练速度最高提升4 倍;论文和代码已公开,便于复现实验。

𝕏 多智能体综述覆盖 200 余篇论文,梳理协作、归因与自进化

Beyond Individual Intelligence综述系统映射200+论文,从协作机制、失败归因与自进化三条主线整理多智能体研究,帮助定位多 Agent 系统从个体能力扩展到群体智能时的关键问题。

𝕏 The Evaluation Trap 质疑多数 Agent 榜单是否测到真实能力

The Evaluation Trap论文提出审计 AI 评测有效性的概念框架,指出许多Agent 排行榜依赖隐含理论,实际测量的是与目标能力相关的代理行为,而非真正底层能力。论文提醒研究者区分基准分数、可观察行为与想要评估的能力构念。

𝕏 Warp-as-History 用单条视频实现交互式视频生成

Warp-as-History提出仅用一条标注视频进行轻量LoRA微调,将相机轨迹变形伪装为历史帧,从而实现交互式视频生成;方法无需额外控制分支,降低了视频控制生成的训练与部署复杂度。

𝕏 arXiv 将封禁完全依赖 AI 写论文的作者一年

arXiv将对让AI完成全部论文工作的作者实施1 年禁发措施,核心目标是维护学术仓库中的署名责任、研究责任与论文可信度,防止完全自动生成内容破坏学术记录。

𝕏 NVIDIA 发布论文评审数据集 APRES

NVIDIA在 Hugging Face 发布APRES论文评审数据集,覆盖 Agents4Science、Sakana v2 等场景中的人类与 AI 评审数据,可用于研究 AI 辅助评审、审稿一致性和自动化科学评估。

𝕏 FutureSim 预测基准显示 GPT-5.5 最佳得分仅 25%

FutureSim预测基准显示,GPT-5.5最佳得分仅25%;Brier Skill Score 进一步表明,多模型预测能力接近均匀概率基线,提示当前模型在未来事件预测任务上仍存在明显局限。

𝕏 Karpathy 谈持续学习:人类依赖睡眠式压缩而非无限上下文累积

Karpathy认为,持续学习不应简单理解为消除上下文与权重之间的差异;人类更像通过睡眠巩固进行有损压缩,把经验整合进长期记忆,而不是无限累积上下文窗口。

𝕏 递归语言模型指南梳理 RLM 核心概念与提示轨迹

Recursive Language Models新指南解释RLM常见误区,并比较简单轨迹、提示方式和现有方法,帮助读者理解递归式语言模型如何通过迭代生成、反馈与轨迹设计提升推理过程。


🚀 产品发布

𝕏 上海电信推出 AI Token 话费套餐,1 元可调用 25 万额度点

上海电信将大模型调用做成话费套餐,推出 AI Token 类产品形态:1 元=25 万额度点,支持 30+主流大模型,用户还可免费领取 2500 万额度点用于体验。

𝕏 Hyperbolic 新增 400 块 H200 GPU,按需价格 2.99 美元/小时

Hyperbolic新增 400 块 H200 GPU,每卡配备 141GB HBM3e 显存,按需租用价格为 2.99 美元/小时,进一步扩充其高端 GPU 算力供给。

SpaceX上调美国 Starlink 住宅与 Roam 多数套餐价格:100Mbps 档升至 55 美元/月,400+Mbps 档升至 130 美元/月,影响多类家庭与移动使用场景。

𝕏 Audemars Piguet x Swatch 联名怀表发售混乱,二级市场挂至 2.1 万美元

Audemars Piguet x Swatch Royal Pop 发售引发全球门店关闭和警方介入,原价 400 美元 的联名怀表在二级市场挂至 2.1 万美元,显示稀缺联名产品带来的抢购与炒作效应。

𝕏 Seedance 2.0 支持根据完整分镜生成一致性视频故事

Seedance 2.0 可读取完整 shot list,并基于一张图在视频生成中保持 角色、道具和场景 一致性,面向多镜头叙事与故事化视频创作提升可控性。

𝕏 David Heckhoff 开源沉浸式 3D 作品集网站

David Heckhoff 开源个人作品集网站,使用 Three.js、GreenSock、Lenis 实现 3D 办公室交互、动画效果和项目展示,为创意作品集与前端交互设计提供参考。


🌍 国际大事

💹 特朗普访华期间中美同意构建建设性战略稳定关系

美国总统特朗普于 5 月 13 日至 15 日对中国进行国事访问,双方同意构建中美建设性战略稳定关系。两国元首就外交、经贸、两军等领域开展交流达成共识,此次会晤被视为美中关系站在新的历史起点上的重要互动。

💹 伊拉克原油出口锐减,美以伊冲突冲击能源供应

美以伊冲突影响,伊拉克4 月原油出口降至约1000 万桶,远低于战前的9300 万桶。新任石油部长表示,若战争不结束,出口无法恢复,伊拉克正计划增加输油管道流量,并与欧佩克合作应对供应压力。

英国首相斯塔默据称拟辞职并制定有序离任时间表

据《每日邮报》报道,英国首相斯塔默已向密友透露打算辞去职务,并制定了有序离任时间表。内阁成员称,其意识到当前混乱局面无法持续,希望以相对体面的方式完成权力交接。

𝕏 美国与菲律宾推进 4000 英亩经济安全区计划

特朗普政府菲律宾达成4000 英亩经济安全区交易,议题涉及 Pax Silica、AI 经济与地缘政治。该计划被视为美国在关键产业、供应链安全和区域影响力布局中的一部分,也反映出美菲在经济安全领域的合作进一步深化。

𝕏 中国新航母采用电磁弹射,核动力版本也在建造

中国新航母采用电磁弹射系统,《经济学人》称另有核动力版本正在建造。报道同时指出,外界仍关注其舰载机配置、航母编队协同以及远洋运用能力,相关能力能否转化为成熟舰队战力仍待验证。

𝕏 欧洲面临对华贸易战风险与本土产业流失双重压力

The Economist分析称,欧洲正同时面对对华贸易战风险本土工业流失压力:一方面需要回应中国制造业竞争和贸易摩擦,另一方面又担忧过度对抗会加速产业外迁,使政策选择空间进一步收窄。


📈 财经市场

𝕏 Coatue:AI 基础设施短缺推动供应商股票大幅跑赢云买家

Coatue在春季投资更新中称,AI 基础设施短缺正在重估市场,现金流与股价表现从超大云买家转向内存、光学、CPU 等供应链环节。其数据显示,AI 短缺品卖方年内回报约107%,买方约4%;NVIDIA、TSMC、SK 海力士等供应商受益,Amazon、Google、Meta 等买方承压。Coatue 同时提出**6 万亿美元+**AI 市场估计,认为 AI 周期赢家正在从云巨头向更广泛的基础设施卖方扩散。

𝕏 半导体股票 PEG 对比:美光、ON、AMD 估值处于低位

半导体股票 PEG列表显示,多只半导体股票的 PEG 估值低于或接近 1 倍,其中MU 约 0.4 倍、ON 约 0.5 倍AMD 约 0.7 倍、NVDA 约 1.0 倍;相比之下,INTC 约 2.8 倍,处于较高水平。该表为投资者比较半导体板块增长与估值匹配度提供参考。

𝕏 SoFi 投资者关注贷款平台、会员增长与技术平台收入下滑

SoFi本季 LPB 代发30 亿美元个人贷款,新增100 万+会员,显示贷款平台与会员飞轮仍具增长动能。不过,其技术平台收入同比下降27%,成为投资者关注的主要拖累因素。

𝕏 Nectar Social 完成 3000 万美元 A 轮融资,Menlo Ventures 领投

Nectar Social完成3000 万美元 A 轮融资,由Menlo Ventures领投。公司定位为营销操作系统,融资将用于推动产品与市场扩张。

𝕏 Philippe Laffont:大型科技股内部表现分化,纳指自 2025 年 10 月高点基本持平

Philippe Laffont称,自2025 年 10 月 31 日高点以来,纳指一度下跌 10%,当前则约上涨 10%,整体看接近持平区间,但大型科技股内部出现明显重排,Mag 7 成员之间表现分化。


🏭 工业能源

𝕏 AI 算力权力从公开超算榜转向私有 AI 工厂

Top500合计 HPL 约14.99 exaFLOPS,但 xAI Colossus 称已达20 万 GPUStargate 规划接近7GW容量。算力竞争正从公开超算排名转向私有 AI 工厂,核心约束变为电力、HBM、网络互联和资本开支。

🔵 ASML 与塔塔电子合作推进印度芯片制造

ASML塔塔电子签署合作协议,旨在提升印度本土芯片制造能力。此举标志着全球半导体供应链进一步向印度倾斜,也将支持印度推进本土芯片产业和制造生态建设。

💹 中国新能源汽车专利十年增长至 11 万余件

汽车产业知识产权十年发展报告显示,中国新能源汽车专利从 2016 年5 万余件增至 2025 年11 万余件,年均增长率达17.1%。智能网联汽车专利也增长至 9.3 万件,海外布局覆盖 50 多个国家,显示中国汽车产业在新能源与智能化方向的专利积累持续增强。

𝕏 Figure F.03 人形机器人连续 4 天 24 小时处理近 10 万个包裹

Figure F.03人形机器人已连续4 天进行24 小时自主运行测试,累计处理近10 万个包裹,无中断无停机。公司称测试目标是让机器人持续运行直到故障发生,以验证仓储自动化场景中的耐久性、稳定性和任务执行能力。

𝕏 AMD 向英伟达 Dynamo 项目 AIPerf 提交代码并获接收

AMD英伟达 Dynamo的 LLM 工作负载基准子项目AIPerf提交上游代码贡献并获接收,推动 AI 推理和大模型工作负载基准走向跨厂商开源协作。该进展有利于形成更供应商中立的性能评测生态。

💹 松下电动车电池产能投产延期,量产规模仍未提升

因客户订单停滞,松下电动车电池产能投产再度延期,目前仍未能提升新款大容量电池的量产规模。该情况反映出电动车需求波动正传导至上游电池供应链,并影响企业扩产节奏。

𝕏 AI 数据中心资本开支被指已超过美国军费

超大云厂商今年用于AI 数据中心 Capex的支出被称已超过美国军费,显示 AI 算力建设进入高度重资产阶段。相关投入反映出AIDC已不只是企业基础设施项目,而是与能源、电力、芯片供应和国家级战略竞争深度绑定。

𝕏 Zipline 展示下一代无人机配送蜂巢式基础设施

Zipline展示下一代无人机配送基础设施,采用类似机器人蜂巢的自动化起降、停靠与调度设计。该系统面向高频配送网络,强调通过集中式设施提升无人机周转效率和规模化运营能力。

𝕏 中国柔性太阳能薄膜展示屋顶即贴式安装方案

中国企业展示轻量化柔性太阳能薄膜,可直接贴装在建筑屋顶,面向分布式光伏场景简化支架、搬运和安装流程。该方案突出低重量、易部署等特点,有望降低屋顶光伏改造门槛。

𝕏 犹他州数据中心项目称将自带电力并复用现有用水

犹他州数据中心项目位于无人居住的偏远区域,项目方称将复用既有用水并自带电力,不会增加居民成本。该表述试图回应大型数据中心对当地电力、水资源和社区负担的担忧。


🧠 深度思考

𝕏 Anthropic 创始人手册:AI 会放大创业者造错产品的风险

Anthropic发布36 页 Founder’s Playbook,将创业拆成 Idea、MVP、Launch、Scale 四阶段。手册强调,AI 会显著提升执行速度,但也会放大“快速造出错误产品”的风险,因此创业者最稀缺的能力不是更快执行,而是更早形成正确判断。

𝕏 Shopify CEO:过度优化 KPI 会牺牲 80% 的产品价值空间

Tobi LutkeShopify 不使用KPI/OKR作为核心管理方式,因为可量化指标只能覆盖约**20%**的产品价值。数据更像驾驶舱仪表,适合辅助判断,但如果团队只优化指标,反而会错过更难测量却更重要的用户体验和长期产品空间。

𝕏 Abridge 创始人复盘 53 亿美元垂直 AI 公司的 6 条经验

Abridge估值达53 亿美元,创始人复盘称,关键在于长期坚持医疗语音信号 thesis、上攻大型医疗网络,并把模型能力深度嵌入临床工作流。公司还让约40%模型输出来自自研模型,以增强垂直场景中的可控性和差异化。

𝕏 开源 Agent 在非技术用户中出现意外产品契合

OpenClaw等开源 Agent 因数据主权、模型可替换和“能做任何事”的产品形态,意外吸引大量非技术用户。其价值不只在开发者可扩展,更在于让用户感觉自己掌控数据、模型和自动化流程,而不是被封闭 SaaS 绑定。

𝕏 AI 编程代理为何具备强 PMF:大市场、高人力成本与闭环验证

Tomasz Tunguz认为AI 编程代理具备接近完美的 PMF:软件支出规模巨大,工程师成本高,待开发需求近乎无限,而且代码天然可以通过测试、编译和运行结果形成闭环验证。这让编程成为 AI Agent 最容易证明价值的高频高价场景之一。

𝕏 Aaron Levie:AI 部署会让前线工程成为企业核心能力

Aaron Levie认为 AI 不同于传统软件,模型、提示词和工作流都会持续变化,企业很难靠一次性部署完成转型。真正可用的Agentic 系统需要FDE在客户现场理解业务,把最佳实践反哺产品,使前线工程成为 AI 公司规模化交付的核心能力

𝕏 AI 原生公司三阶段:后 Transformer、后 LLM 与后 Agent

Shivdev Rao将 AI 原生公司分为post-transformer pre-LLM、post-LLM pre-agent、post-agent三代。划分重点不只是模型能力变化,而是产品形态、组织结构和交付方式都必须随技术层级迁移;停留在上一代假设中的公司,可能会被新一代 AI Native 组织快速超越。

𝕏 Brian Chesky:旅行和电商 Agent 不应以纯聊天框为核心

Brian Chesky认为旅行、电商未来会由Agent重塑,但核心界面不应只是纯文本聊天框。此类场景天然需要图片、地图、价格、对比和状态反馈,因此更适合视觉化、结构化、可操作的丰富界面,而不是让用户把复杂需求都塞进对话框。

𝕏 Scoble 建议创业者短访旧金山,把真正业务留在客户身边

Robert Scoble建议创业者把旧金山视为短期学习和建立连接的地方,而不是所有公司都必须长期驻扎的目的地。他认为真正优势是贴近本地客户,尤其是那些尚未被自动化改造的传统企业,创业者应在客户现场发现真实需求。

𝕏 AI 消费软件不应把聊天框作为健康和金融的默认入口

ChatGPT 健康与金融产品被批评过度依赖聊天界面。作者认为,这类场景的真实需求不是让用户反复描述生活细节,而是持续记录基线、监测变化并主动提示异常;健康和金融产品更应围绕基线记录、趋势识别和风险提醒设计。

𝕏 AI 落地的稀缺项正从技术转向行业业务洞察

OpenAI部署公司、Harvey法律工程师和小红书案例显示,AI 落地的稀缺项正在从模型技术转向行业业务洞察。在模型能力日益商品化后,真正的壁垒来自理解业务流程、客户约束、组织协作和场景里的隐性判断。

𝕏 AI 时代开发者价值从写代码转向精准指挥 Agent

Agentic 开发软件工程的瓶颈从代码编写转向指令定义。工程师的核心价值不再是产出更多代码行,而是注入业务判断、架构逻辑、关键约束和多 Agent 协作方式;谁能把模糊目标转化为高质量指令,谁就能更好地放大 AI 编程能力。

𝕏 AI 交互产品窗口期缩短,智能指针显示大厂验证速度加快

Google智能指针案例显示,AI 交互产品的窗口期正在变得极短。类似从命令行到 GUI 的过渡正在重演,但大厂验证和复制速度更快,创业团队若押注新交互范式,需要在产品验证、分发和差异化上更快形成闭环。


📰 综合新闻

𝕏 MIT 研究生规模将较 2024 年减少 20%,约少 500 人

MIT宣布研究生人数将比2024 年减少20%,约少500 名学生。该变化被视为美国高校科研培养规模收缩的信号,可能影响实验室人力、科研项目推进以及未来学术人才供给。

𝕏 Amazon 将 Rufus 购物能力并入 Alexa+,重塑商品推荐入口

Similarweb称,假日前夕Amazon Rufus相关流量上升,显示亚马逊的 AI 购物助手正在获得更多用户关注。亚马逊计划把 Rufus 的购物能力并入Alexa+,并扩展到厨房、汽车和浏览器等场景,意在把商品搜索、推荐和购买决策嵌入更多日常入口。

𝕏 偏远 7-Eleven 门店以近 1300 万美元成交,创州内纪录

一家偏远地区的7-Eleven门店以近1300 万美元售出,创下该州7-Eleven 门店最高成交价纪录。该交易显示,即便位于非核心区域,具备稳定现金流和连锁品牌属性的便利店资产仍可能获得高估值。

𝕏 Kindle 旧机型停止支持后,用户转向越狱延长使用

Amazon结束部分旧款Kindle的官方支持后,一些用户开始通过越狱继续使用老设备功能,以延长硬件寿命并绕过功能限制。这反映出电子阅读器用户对设备长期可用性、维修和软件支持周期的关注。

𝕏 韩国现役士兵休假整容未愈返队,影响部队排班

韩国军队出现部分现役士兵休假期间接受隆鼻、双眼皮手术,随后在伤口未愈合的情况下返营,导致无法正常执勤,并迫使其他同袍补位代班。事件凸显个人休假安排与部队运转之间的冲突,也引发对军中排班管理的讨论。


💡 生活建议

𝕏 睡眠数据:冷卧室、分开被子和睡前禁食 3 小时有助改善睡眠

睡眠数据显示,冷卧室空调、伴侣或情侣分开被子以及睡前禁食 3 小时都可能对睡眠产生正向影响。其中,冷卧室和分被睡对男性睡眠改善更明显;睡前 3 小时不进食则对男女都有帮助。

𝕏 马克·安德森的阅读杠铃策略:实时新闻与 50 年以上旧书

马克·安德森采用阅读杠铃策略:一端关注X 实时新闻以获取即时信息,另一端阅读50 年以上旧书以吸收经受时间检验的思想,并刻意忽略报纸和杂志等中间层内容。


由 X-Crawler AI 生成于 2026-05-17 08:02

EVENT-DRIVEN INTELLIGENCE

免费先看重点,Pro 再看速度、深度和可追踪性

这篇内容是公开入口。继续使用天眼时,固定沿着三条路径走:订阅每日情报、查看同主题历史上下文、升级 Pro 解锁事件追踪与研究能力。

分享

NEXT STEP · 留下邮箱

获取下一次重大事件提醒

每天一封精选情报,先用邮件帮你建立复访,再决定是否升级到更深的追踪能力。