天眼早报
加州法院裁定马斯克针对OpenAI及Sam Altman的诉讼已过诉讼时效,其主张的1500亿美元赔偿被直接驳回,核心指控未获实质审理。这一判决终结了科技界备受瞩目的法律纠纷,消除了OpenAI股权结构的不确定性,使其能更专注于AI研发与商业化,而马斯克方面则面临向第九巡回法院上诉的战略抉择。
英伟达首批Vera CPU已正式交付OpenAI、Anthropic、SpaceXAI及OCI等核心客户,标志着其新一代AI数据中心CPU平台进入规模化商用阶段。特别是OCI计划自2026年起部署数十万颗,这将显著改变AI算力基础设施的硬件格局,降低对GPU的单一依赖,推动异构计算在大规模训练场景中的普及。
Cursor推出基于Moonshot Kimi K2.5微调的Composer 2.5模型,具备1T参数与256K上下文,在Terminal-Bench和SWE-Bench Multilingual榜单上超越GPT-5.5。该模型采用Targeted RL技术强化复杂指令遵循,结合SpaceXAI的联合训练计划,预示着非美系大模型在代码生成领域的竞争力将显著提升,可能重塑开发者工具生态。
Meta展示AIRA系统,通过规划与执行分离的双智能体架构,在24小时计算预算内于350M至3B参数规模下全面超越Llama 3.2。这一突破证明了神经架构搜索(NAS)策略的革新,大幅降低了模型设计成本与时间,为未来快速迭代中小参数模型提供了新的技术路径,可能加速边缘AI模型的优化进程。
🤖 AI 大模型
𝕏 Cursor 发布 Composer 2.5:基于 Kimi K2.5 微调,强化长任务编程能力
Cursor推出Composer 2.5模型,底座为Moonshot Kimi K2.5,具备1T总参数与256K上下文,强化长任务和复杂指令遵循。在 Terminal-Bench 上达到 Claude Opus 4.7 的 69.4%,SWE-Bench Multilingual 超越 GPT-5.5;采用 Targeted RL 技术,并计划联合 SpaceXAI 训练更大规模模型。
𝕏 Meta 发布 AIRA:双智能体自主搜索神经架构,24 小时内超越 Llama 3.2
Meta发布新论文展示AIRA系统,由 AIRA-Compose 规划宏观架构、AIRA-Design 实现底层机制。该系统在24 小时计算预算内,于350M 至 3B参数规模下均超越 Llama 3.2,证明将策略与执行分离可显著提升神经架构搜索效率。
英伟达 Vera CPU 已交付 OpenAI、Anthropic、SpaceXAI 和 OCI
英伟达首批Vera CPU已送达Anthropic、OpenAI、SpaceXAI、OCI等客户,标志其面向 AI 数据中心的新一代 CPU 平台进入交付阶段。其中 OCI 计划自2026 年起部署数十万颗,用于支撑大规模 AI 基础设施。
马斯克起诉 OpenAI 案败诉,称将上诉至第九巡回法院
美国加州奥克兰联邦法院陪审团裁定,马斯克针对OpenAI和Sam Altman的诉讼超过诉讼时效,1500 亿美元索赔主张被驳回,核心指控未获实质审理。马斯克随后表示将向第九巡回法院提起上诉。
𝕏 HiDream 开源 8B 图像模型,采用像素级统一 Transformer
HiDream-O1-Image开源8B图像模型,采用统一 Transformer直接处理像素,支持最高2048×2048图像生成。在 LongText-Bench 中英文测试中分别达到 0.979/0.978,强调高分辨率生成与长文本渲染能力。
𝕏 商汤开源 SenseNova U1,统一处理图像与文本生成
商汤开源SenseNova U1,提供8B与38B-A3B MoE两版,支持文生图、图像编辑和图文交错生成等任务。官方称其在 H100 上推理速度从 23 秒降至 2 秒,展示统一多模态生成模型的效率提升。
𝕏 GPT-5.4 Nano 配合验证器循环,SWE-bench Verified 达 76.4%
Dair AI分享新研究,GPT-5.4 Nano结合Critic-Comparator循环机制,在SWE-bench Verified测试中取得 76.4% 准确率,接近 Gemini 3 Pro 和 Claude Opus 4.5 Thinking。核心方法是从弱模型的 k=8 候选补丁中筛选并验证,而非直接询问模型。
𝕏 Dell 与 Hugging Face 合作推进企业本地 AI 与开源模型部署
Hugging Face与Dell在 Dell Technologies World 主旨演讲中宣布合作,聚焦企业级本地 AI部署与开源模型落地。双方将围绕企业基础设施、模型交付和本地化运行方案,降低组织部署开源大模型的门槛。
𝕏 Qwen 3.7 Preview 上线 Arena,文本与视觉榜单排名上升
Alibaba Qwen的Qwen 3.7 Max Preview在Text Arena总榜排名第 13,实验室排名升至第 6;Qwen 3.7 Plus Preview在 Vision Arena 排名第 16,实验室排名升至第 5。细分赛道中,数学第 7、软件与 IT 第 9、编程第 10,显示文本与视觉能力同步提升。
𝕏 Dell Enterprise Hub 新增多款开源大模型一键部署
Dell Enterprise Hub新增Kimi K2.6、DeepSeek V4 Pro、GLM 5.1等模型,适配 PowerEdge XE9780 与 NVIDIA B300。该更新面向企业私有化部署场景,提供更便捷的一键部署路径。
𝕏 NVIDIA 开源 SANA-WM 世界模型,消费级 GPU 可生成 60 秒 720p 视频
NVIDIA SANA-WM为26 亿参数开源世界模型,可由图像、文本和6-DoF轨迹生成最长60 秒 720p可控视频。该模型强调在单张消费级 GPU 上运行,降低长视频世界模型生成的硬件门槛。
🔵 Meta 将 7000 名员工转岗 AI 岗位,裁员前启动组织重组
Meta内部备忘录显示,公司将把7000 名员工重新分配至AI 相关岗位,同时本周晚些时候还计划进行裁员。此举显示 Meta 正在进一步把组织资源向 AI 业务集中。
𝕏 马耳他向居民免费提供一年 ChatGPT Plus
马耳他成为首个向居民提供ChatGPT Plus一年免费订阅的国家,居民需完成一门免费课程以解锁权益,海外马耳他公民也可参与。该计划把 AI 工具订阅与基础培训绑定,意在提升全民 AI 使用能力。
𝕏 ModelScope 发布 Diffusion Templates,开源 11 个视觉控制模板
ModelScope开源Diffusion Templates,包含11 个模板与1.2TB数据集,面向扩散模型视觉控制任务。该项目为图像生成、编辑和控制类应用提供可复用训练模板与配套数据资源。
𝕏 OpenRouter 上线 xAI Grok 创意模型栈
OpenRouter上线3 个 Grok 模型,覆盖图像生成与编辑、1-15 秒视频生成以及20 多语言 TTS。该模型栈面向创意生成场景,扩展了 OpenRouter 平台上的 xAI 多模态能力。
𝕏 PolyAI 发布 Raven 3.5 和两款语音 AI 产品
PolyAI称Raven 3.5在4 项客服基准超过 GPT-5,端到端延迟低于300ms。同时公司发布两款语音 AI 产品,主打客服场景中的低延迟、高质量对话体验。
𝕏 字节开源 Lance 统一多模态模型
ByteDance开源Lance,采用视频、图像、解码器各3B参数架构,定位为统一多模态模型。该模型面向视频与图像理解生成场景,尝试用模块化结构整合多种视觉能力。
𝕏 Nous 发布 9B 工具调用与智能体编码模型
NousResearch推出9B模型,面向工具调用和智能体编码任务。在 SWE-bench 样本上得分53.33%,HermesAgent 达到85,显示小规模模型在代理式任务中的性能潜力。
𝕏 llama.cpp 为 Qwen3.6 系列加入 MTP 支持
llama.cpp为Qwen3.6加入MTP支持,用于提升本地推理性能。该更新有助于 Qwen3.6 系列在本地运行框架中的效率优化,尤其面向开发者与端侧部署场景。
🔶 苹果拟在 WWDC 展示 iOS 27,加入 AI 写作和自然语言快捷指令
苹果计划在6 月 WWDC发布iOS 27,新增 AI 写作、自然语言快捷指令和壁纸生成等功能。该更新显示苹果将继续把生成式 AI 能力嵌入系统级工具与用户日常操作中。
𝕏 Qwen3.6-27B 已可 100% 运行在 WebGPU 上
Qwen3.6-27B实现100% WebGPU运行,展示浏览器端大模型推理可行性。该进展说明较大规模模型也可通过 WebGPU 在本地浏览器环境中完成推理,为端侧和 Web AI 应用提供新路径。
𝕏 Claude Design 全套餐 token 上限翻倍
Anthropic宣布Claude Design所有套餐的token 上限翻倍,提升设计生成与多轮修改空间。该调整面向使用 Claude Design 进行视觉和设计内容生成的用户,直接增加可用上下文与输出容量。
𝕏 ParseBench 发布企业文档理解基准,覆盖复杂表格与版式
ParseBench测试前沿模型对企业文档、密集表格、图表和复杂版式的理解能力,面向文档解析与信息抽取场景。该基准可用于衡量模型在真实企业材料中的结构化理解表现。
🛠️ AI 工具推荐
𝕏 PolyAI 开放企业级 Agentic Dialog Platform
PolyAI向企业开放Agentic Dialog Platform,其语音代理已处理超10 亿次客户对话,支持 Raven、GPT-5、Claude、Gemini 等模型;配套的 Agent Builder 可在10 分钟内生成生产级语音代理。
𝕏 OpenMed PII 发布 30 多个开源隐私识别模型
OpenMed PII发布**30+**开源隐私识别模型,支持阿拉伯语、日语、土耳其语及临床出院摘要实时脱敏,发布后20 天下载超 100 万次,面向医疗文本隐私保护场景。
𝕏 Anthropic 收购 Stainless,补强 Claude 开发者基础设施
Anthropic宣布收购Stainless,后者支撑所有官方Claude SDK,并提供 SDK、CLI 与MCP 服务器平台,有助于强化 Claude 面向开发者的工具链与集成能力。
𝕏 OmniVoice Studio 开源本地配音工作室,支持 600 种语言
OmniVoice Studio开源本地配音工作室,可本地处理 MP4,集成Whisper转写、翻译、3 秒克隆声音和Demucs伴奏分离,支持多达600 种语言的视频配音流程。
𝕏 Violin 开源 AI 视频翻译流水线,支持 33 种语言
Violin开源 AI 视频翻译流水线,集成Whisper转写、LLM 翻译、TTS 配音与 ffmpeg 混流,支持33 种语言,面向视频本地化和多语言配音工作流。
𝕏 LangSmith 推出 SmithDB,追踪加载最高提速 12 倍
LangChain推出SmithDB,通过对象存储、Postgres 元数据和无状态服务重构 LangSmith 的追踪加载架构,使追踪查询与加载最高提速12 倍。
𝕏 Audiblez 可将 EPUB 本地生成有声书
Audiblez可用Kokoro-82M把 EPUB 本地转换为 .m4b 有声书,在 Colab T4 上约 5 分钟生成《动物农场》,适合低成本文本转语音和个人有声书制作。
𝕏 PyTorch 2.11 解决 Grace Hopper 与 Blackwell 平台 aarch64 安装问题
PyTorch 2.11.0已向 PyPI 发布 CUDA 版 aarch64 wheels,使 GB200、GB300、GH200 等 Grace Hopper 与 Blackwell 平台可直接通过 pip 安装。
𝕏 IT Tools 提供 100 多个本地浏览器开发工具
IT Tools提供**100+**开源开发工具,覆盖 JSON、Regex、JWT、Cron 等常见开发任务,所有功能均在浏览器本地运行,强调隐私和轻量化。
𝕏 开源 AI 视频工作室支持 200 多个模型与本地推理
AI 视频工作室支持200+模型、桌面端和自托管部署,并可在 Mac M 系列上进行本地推理,面向视频生成、编辑和本地化的多模型工作流。
𝕏 ExecuTorch 新增 MLX 代理,可在 Apple Silicon GPU 运行 PyTorch 模型
ExecuTorch新增MLX delegate,支持 LLM、语音转文本、MoE 和 TorchAO 量化,可在 Apple Silicon 的 Metal 环境运行 PyTorch 模型。
𝕏 MouseDo 发布 Computer Use 独立应用,支持 MCP 调用
MouseDo发布 Computer Use 独立应用,可让 LLM 控制电脑 GUI,支持MCP调用、Codex 订阅和免费试用,面向桌面自动化和代理操作场景。
𝕏 LangSmith Engine 自动生成 Agent 修复闭环
LangSmith Engine可从生产 traces 中检测失败、聚类问题、提出修复,并生成PR和evals,用于把 Agent 线上故障转化为可验证的修复流程。
𝕏 LobeHub 推出 Chief Agent Operator 云端代理调度层
LobeHub推出Chief Agent Operator,可从27.3 万技能市场调用代理,并在云端24/7执行任务,定位为跨代理任务编排与长期运行层。
🐙 Files.md 开源发布:面向本地 Markdown 文件的 Obsidian 替代品
Files.md在 Hacker News 获509 分和266 条评论,主打开源、本地 Markdown 笔记管理,定位为轻量的 Obsidian 替代品。
𝕏 Kin Health 融资 900 万美元开发患者 AI 笔记工具
Kin Health获得900 万美元融资,开发面向患者的AI notetaker,用于记录医疗沟通内容,帮助患者更好地保存、回顾和理解就诊信息。
𝕏 GBrain v0.36 重做 skillpack 系统
GBrain v0.36发布,重做skillpack系统,新版支持代码、resolver 与测试自定义,并保持更新兼容,提升技能包扩展和维护能力。
𝕏 FLUX 推出官方 MCP,可在 Claude 与 Cursor 内生成图像
Black Forest Labs发布官方FLUX MCP,支持 Claude、Cursor 等代理直接调用图像生成能力,将 FLUX 接入 AI 编程与对话式工作流。
🐙 Auto-identity-remove:macOS 自动化数据经纪商退订工具
Auto-identity-remove获 Hacker News 314 分,可在macOS自动执行数据经纪商隐私退订流程,帮助用户批量处理个人信息移除请求。
𝕏 GitHub Copilot CLI 远程控制在线功能正式发布
GitHub宣布Copilot CLI及 @code 会话的远程控制功能正式上线,支持用户在本地电脑开始工作后,随时随地继续处理会话,提升跨设备编码连续性。
𝕏 MaxSim 内核将 ColBERT 检索加速 3 到 5 倍
MaxSim用 Metal 与 WMMA 优化后期交互检索,针对 ColBERT 等检索架构的核心计算进行加速,较 PyTorch 实现快3–5 倍。
𝕏 Runway Characters 增加工具调用能力
Runway Characters实时视频代理可执行动作并调用工具,目前开放产品集成,意味着视频角色可从被动生成走向可交互、可执行任务的代理形态。
𝕏 Accio Work 将商品采购流程做成浏览器 AI Agent
Accio Work将商品采购流程做成浏览器 AI Agent,可生成供应商、报价、MOQ、谈判脚本和开店路径,面向跨境电商与采购决策场景。
𝕏 Transload 用现有 CCTV 自动测量货运尺寸
Transload通过仓库现有安防摄像头动态测量货物尺寸,帮助物流公司减少误报体积带来的成本,并将视觉 AI 嵌入货运计费与仓储流程。
𝕏 React Review Bot 发布,自动拦截前端代码错误
aidenybai推出React Review Bot,专为 PR 审查设计,能检测其他机器人忽略的前端问题,包括不必要的useEffect、UI Bug、竞态条件和性能瓶颈。
𝕏 Supabase 推出 RLS Tester,可模拟用户测试行级安全策略
Supabase预览RLS Tester,可在仪表盘中模拟用户并检查查询命中的 RLS 策略,帮助开发者验证行级安全规则是否按预期生效。
𝕏 MIT 开源照片转可编辑 CAD 程序模型
MIT开源模型可把照片或草图转为参数化 3D CAD,并导出STL用于制造,面向从二维参考图到可编辑工程模型的自动化建模场景。
𝕏 腾讯 Ardot 定位 AI 原生 UI/UX 设计 Agent
腾讯推出Ardot,定位为 AI 原生 UI/UX 设计 Agent,目前仅支持苹果电脑,面向界面设计、交互稿生成和设计流程自动化探索。
📖 教程攻略
𝕏 300 行代码拆解 ReAct Agent 的工具、记忆与上下文成本
Simple-ReAct-Agent用约300 行代码复现 ReAct 循环,展示如何拼接历史、调用工具并回填结果。教程重点提醒开发者关注工具暴露面带来的安全风险,以及每轮重发上下文造成的Token 成本。
𝕏 Midscene.js 用三套 API 覆盖自动化、E2E 与无代码场景
Midscene.js用同一 Agent 支持aiAct、workflow 以及YAML/CLI三种用法,覆盖自动化操作、E2E 测试和无代码配置等不同开发场景。
𝕏 Notion 总结面向人类与 Agent 的 CLI 设计原则
Notion CLI教程总结4 项原则:渐进披露、可操作错误、stdout/stderr分离,以及同时支持交互与非交互模式,用于提升人类用户和 Agent 调用命令行工具时的稳定性。
𝕏 Lovart 三步生成产品广告视频
Lovart演示产品广告视频的三步制作流程:先上传产品图,再用Storyboard Skill生成分镜,最后通过Seedance 2.0生成成片,适合快速验证商品短视频创意。
𝕏 Google 发布 Gemini Interactions API 流式应用指南
Google发布Gemini Interactions API流式指南,面向需要构建streaming 应用的开发者,说明如何利用该接口实现更连续的生成式交互体验。
𝕏 X 开源算法内容建议:重视中长视频、露脸与互动
X 开源算法相关内容建议强调创作者应优先发布中长视频,增加露脸和互动,同时避免标题党、连续发布以及低质量重复内容。
𝕏 SwiGLU 原理视频从第一性原理讲解激活函数
SwiGLU教程从第一性原理梳理 AI 关键激活函数约60 年演进,适合用于补充大模型基础知识,理解现代网络结构中的函数设计。
𝕏 视频号助手支持 macOS 桌面直播
视频号助手新增macOS 直播入口,用户下载专用Mac 版微信后,可在桌面端捕捉屏幕、窗口和摄像头,用于更方便地进行视频号直播。
💎 技巧经验
𝕏 Claude Code 大型代码库最佳实践:分层配置、LSP 与模块化测试
Claude Code大型代码库实践包括:使用分层CLAUDE.md记录项目约定,从子目录启动以缩小上下文,按模块跑测试、接入LSP提升代码理解,并每3-6 个月复审配置,避免规则过期或上下文膨胀。
𝕏 工程师使用 AI 编程时不要把学习外包给模型
Addy Osmani提醒工程师使用 AI 编程时不要把学习外包给模型:Anthropic 实验中,AI 组理解测验仅50%,低于对照组67%。建议先自行假设、向模型索要解释、逐行审查 AI 代码、重构并补测试等6 个方法,把 AI 当教练而非替代大脑。
𝕏 Codex 支持远程连接 Mac 并保持唤醒
OpenAI Codex桌面端启用远程连接和Keep this Mac awake后,可让 Mac 保持可用状态,并从ChatGPT 手机端继续访问同一工作环境,适合外出时延续本地开发任务。
𝕏 用元提示词让 AI 自评并重写 README
Garry Tan示范用元提示词让模型站在新用户视角审阅 README,先给文档打0-10 分,指出阻碍理解和上手的不足,再要求模型直接重写到10 分水平。这适合快速提升开源项目或产品文档的可读性。
𝕏 Grok Build 增加代码库映射规则,减少盲改错误
Grok Build新增规则要求在修改代码前先用rg、索引和ast-grep梳理调用链与依赖关系。核心做法是改动前先映射依赖关系,避免 AI 代理在不了解上下文时盲目修改、漏改相关文件或引入回归。
𝕏 长时间 Agent 评测不必全部端到端
Agent evals不必把长时间任务全部做成端到端评测,可拆为端到端结果验证与4-5 个增量步骤。这种拆分既检查最终系统结果,也分别验证关键行为的复现性,降低调试成本并更容易定位失败环节。
𝕏 Ghostty 远程 SSH 语法高亮丢失的配置修复方法
Ghostty远程 SSH 场景下若 Vim 语法高亮丢失,可通过配置ssh-env与ssh-terminfo传递终端环境和 terminfo 信息,修复远端无法识别终端能力导致的显示问题。
𝕏 让 AI 编码代理持续记录实现偏差、决策与取舍
两条提示词建议让 AI 编码代理持续维护implementation-notes.html,记录设计决策、规格外实现、偏差、取舍和开放问题。这样可把隐性上下文沉淀为可审查文档,方便后续接手、复盘和判断哪些实现是有意权衡而非遗漏。
⚡ 工作流
𝕏 SemiAnalysis 称 9 个真实 AI 工作流 ROI 全部超过 10 倍
SemiAnalysis跟踪9 个内部流程,用 AI token 成本对比人工成本评估投入产出,结果显示所有任务 ROI 均超过10 倍,多数达到60-90 倍,为企业内部 AI 工作流量化收益提供了案例。
𝕏 Notion Worker 将 X 关注列表同步为可检索人脉库
Notion Worker调用 X API同步关注列表,并用 AI 提取关注对象的角色、公司、地点等信息,构建可检索的人脉数据库;完整同步加 enrich 的成本约30 美元。
𝕏 TRAE 公布用户常用 Agent Skills Top 10
TRAE梳理用户最常用的10 个 Agent Skills,覆盖头脑风暴、任务规划、前端设计、代码调试与测试闭环等高频场景,呈现开发者在日常工作流中调用智能体能力的主要方向。
𝕏 planning-with-files 用 3 个 Markdown 文件管理复杂任务
planning-with-files通过自动维护task_plan.md、findings.md 和 progress.md 三个 Markdown 文件,将复杂任务拆解为计划、发现和进展记录,帮助智能体在长流程中保留上下文并持续推进。
𝕏 Higgsfield 展示 Claude+MCP 营销工作流
Higgsfield演示Claude+MCP营销流程:跨 TikTok、Instagram、YouTube 进行调研,并生成内容日历、UGC 创意、轮播素材和 Meta 广告审批内容,覆盖从调研到投放准备的完整链路。
𝕏 投研机构用智能体自动采集信息和生成报告
投研场景演示展示了智能体工作流如何覆盖行业采集、方法论知识库调用和投研报告自动生成,适用于将分散信息整理为结构化研究材料的投研流程。
𝕏 Conductor 展示 Spotlight 并行工作区流程
Conductor演示Spotlight workflow,展示在 Docker 重项目中使用并行工作区处理任务的方式,适合需要多分支探索、隔离环境和并行推进的开发工作流。
📚 论文研究
𝕏 ECHO 框架利用终端环境反馈训练 Agent,速度最高提升 2.3 倍
Microsoft Research研究员发布ECHO训练方法,让 Agent 学习终端环境返回的“回声”。该方法在 GRPO 损失之外加入environment token prediction loss,使模型预测终端输出;实验显示TerminalBench-2.0通过率翻倍,训练速度最高提升 2.3 倍,且无需额外奖励信号。
𝕏 分子胶药物 daraxonrasib 将胰腺癌中位生存期提升至 13.2 个月
daraxonrasib通过分子胶机制锁定RAS非活性状态,面向约90%含 KRAS 突变的胰腺癌患者。相关结果显示,该药物将中位生存期从约 6 个月提升至13.2 个月,为难治性胰腺癌提供了新的靶向治疗思路。
560GHz 频段实现 112Gbps 无线传输,推动 6G 太赫兹通信
日本德岛大学开发太赫兹无线通信系统,在560GHz频段实现112Gbps传输速率,成为首次在 420GHz 以上频段达到 100G 级无线传输的成果。该进展为未来6G太赫兹通信链路提供了关键实验验证。
宾夕法尼亚大学实现可计算混合光物质粒子
宾夕法尼亚大学团队首次实现计算所需的全光信号切换,相关成果发表于**《物理评论快报》**。该研究通过混合光物质粒子实现可用于计算的信息处理机制,为低能耗、高速光计算器件提供了新的物理基础。
𝕏 英国批准 Rincell-1 听力修复干细胞疗法首次人体试验
英国MHRA批准Rinri Therapeutics的Rincell-1开展首次人体临床试验,计划于2026 年 5 月测试干细胞来源听神经前体细胞。该疗法旨在修复永久性听力损伤,为感音神经性耳聋提供再生医学路径。
𝕏 Agora-1 将世界模型扩展为多人实时共享环境
Odyssey Agora-1将世界模型扩展到多人实时共享场景,支持最多4 名人类或 AI 代理同时影响同一个模拟世界。该系统重点测试共享状态一致性和多主体交互能力,是世界模型从单用户体验走向协作环境的尝试。
𝕏 Starchild-1 发布:首个支持听觉交互的实时多模态世界模型
Odyssey ML推出Starchild-1,称其为首个能够生成交互式世界模拟并支持听觉输出的多模态世界模型。该模型可实时模拟用户可听见的互动场景,被视为通向通用世界模拟器的重要一步。
𝕏 斯坦福论文称相同推理预算下单智能体通常优于多智能体
斯坦福论文在 FRAMES、MuSiQue 等任务上测试 Qwen、DeepSeek、Gemini 等模型,比较相同推理预算下的单智能体与多智能体方案。结果显示,单智能体通常胜出,提示多智能体协作并不必然带来更高性能。
智能隐形眼镜在小鼠实验中呈现抗抑郁效果
延世大学团队研发智能隐形眼镜,通过超薄电极刺激小鼠视网膜神经回路,在动物实验中呈现类似百忧解的抗抑郁效果。该研究展示了可穿戴眼部电子设备调节神经活动的潜在治疗价值。
𝕏 Boston Dynamics 展示 Atlas 搬运 100 磅冰箱
Boston Dynamics展示Atlas机器人用强化学习搬运100+磅迷你冰箱。该演示依赖接触反馈和本体感知,让机器人在负重、姿态调整和环境交互中完成复杂搬运动作。
𝕏 弱模型 Top-k 候选加验证器在 SWE-bench Verified 达到 76.4%
GPT-5.4 nano结合 critic-comparator 循环,在SWE-bench Verified上达到**76.4%**成绩。方法通过生成 k=8 个候选补丁并执行验证,说明较弱模型也可借助候选搜索与验证器显著提升代码修复表现。
𝕏 SenseNova U1-8B-MoT 被称可 15 秒生成 2K 图像
SenseNova U1-8B-MoT据称可在约15 秒生成 2K 图像,速度快于约 70 秒级的部分商业模型。该结果显示小参数或混合架构图像生成模型在高分辨率输出效率上仍有优化空间。
𝕏 PapersWithCode 复兴版用 AI Agent 解析研究进展
PapersWithCode复兴版提供领域SOTA、排行榜和方法库,并使用AI agents大规模解析论文。该项目试图恢复研究社区对论文、数据集、方法与指标的结构化追踪能力,帮助用户更快了解各领域进展。
𝕏 地球大气粒子或在月球表面保存数十亿年记录
研究认为,地球氧氢离子可经磁尾输运并沉积到月壤中,可能形成月球霜和地球大气历史档案。这意味着月球表面或许保存了跨越数十亿年的地球大气演化线索。
🚀 产品发布
𝕏 NVIDIA 首批 Vera CPU 交付 Anthropic、OpenAI、SpaceX 和 Oracle
NVIDIA交付首批Vera CPU给Anthropic、OpenAI、SpaceX、Oracle Cloud,这是其面向智能体 AI的首款自研 CPU,标志着公司在 AI 计算基础设施上进一步向自研 CPU 扩展。
𝕏 Odyssey 发布 Starchild-1 实时多模态世界模型
Odyssey发布Starchild-1,称其为首个可生成带声音的交互式世界模拟的实时多模态世界模型,面向通用世界模拟器方向,可用于更丰富的实时虚拟环境与交互体验。
🔶 戴尔 AI 工厂客户增至 5000 家,并推出 Dell Deskside Agentic AI
戴尔科技上一季度新增1000 家 AI 工厂客户,总数达到5000 家,并推出 Dell Deskside Agentic AI,同时披露将与谷歌和 SpaceX 合作,扩展企业 AI 基础设施布局。
𝕏 AMD 发布可本地运行 2000 亿参数模型的 AI 开发主机
AMD发布小型AI 开发主机,称可在本地运行2000 亿参数大模型,面向需要本地推理和开发能力的团队,降低对远程云算力的依赖。
𝕏 InsForge 发布面向编码 Agent 的后端基础设施产品
Y Combinator祝贺InsForge发布新产品,该产品能将编码 Agent 转化为Principal Backend Engineer。它提供 Postgres、认证、存储、函数及 AI 网关等原语,专门针对 Agent 实际工作方式构建,使其能独立运行完整基础设施。
𝕏 Google Search Preferred Sources 全球上线
Google Search的Preferred Sources全球上线,用户已选择34.5 万个来源,相关来源的用户点击率提升超过2 倍,帮助用户在搜索结果中优先看到偏好的媒体和内容来源。
𝕏 HY World 2.0 开源完整推理代码和模型
HY World 2.0开放完整inference code与全部模型,用于构建交互式世界,为开发者复现实验、搭建世界模拟应用和扩展相关研究提供基础资源。
𝕏 Manus 发布 Scheduled Tasks 2.0
Manus发布Scheduled Tasks 2.0,定时任务可在同一任务中延续,并支持网页应用后台动作,提升长期任务、周期任务和自动化流程的连续执行能力。
𝕏 Amazon Alexa+ 新增按需生成 AI 播客功能
Amazon Alexa+新增AI 播客生成能力,可基于约200 家新闻合作伙伴内容生成双主持节目,为用户按需提供语音化新闻与资讯消费体验。
𝕏 Tesla FSD v14.3.3 早期体验显示召唤速度和驾驶平顺性提升
Tesla FSD v14.3.3早期测试反馈称,Actually Smart Summon 速度从6mph 增至 8mph,并加入 Hey Grok、干预 streak 等功能,整体驾驶平顺性也有所改善。
𝕏 Mentra Live 开源智能眼镜开放购买
Mentra Live开源智能眼镜已出货数千台,现面向真实工作场景开放购买,强调可在实际任务中使用,并为开发者和企业探索可穿戴 AI 应用提供硬件入口。
💹 小鹏首台 Robotaxi 量产车在广州下线
小鹏集团首台Robotaxi 量产车于5 月 18 日在广州下线,计划今年下半年开启示范运营,标志着小鹏自动驾驶出行服务进入量产车落地阶段。
𝕏 苹果用轻微瑕疵芯片打造入门级 MacBook Neo
苹果在MacBook Neo中复用轻微瑕疵芯片,以降低入门产品成本。这一做法可能帮助苹果扩大低价 Mac 产品覆盖,同时提升芯片利用率。
𝕏 微信 macOS 4.1.9 支持电脑收转账和发送语音
微信 macOS 4.1.9新增1v1 收转账、发送语音功能,并调整聊天窗口按钮布局,进一步补齐桌面端在日常沟通和支付场景中的能力。
𝕏 AST SpaceMobile BlueBird 卫星开始运往卡纳维拉尔角
AST SpaceMobile确认BB-10与BB-8已装车,使用 60K 磅定制箱运往卡纳维拉尔角发射场,为后续 BlueBird 卫星发射做准备。
𝕏 PlayStation Plus 将于 5 月 20 日上调新用户订阅价
PlayStation Plus新订阅价将于5 月 20 日上涨,1 个月价格调整为10.99 美元,3 个月价格调整为27.99 美元,主要影响新订阅用户。
苹果计划在 iOS 27 加入 AI 写作、自然语言快捷指令和壁纸生成
苹果计划在iOS 27加入语法检查、自然语言创建Shortcuts和 AI 壁纸生成等能力,进一步把生成式 AI 功能整合进系统级写作、自动化和个性化场景。
𝕏 Google Workspace 展示 Gemini Enterprise 新协作界面
Google Workspace展示Gemini Enterprise新协作界面,包括 Shared Chats、Projects 和 Docs Canvas 体验,强调企业用户在 AI 辅助写作、项目管理和共享对话中的协同工作流。
🌍 国际大事
特朗普暂停对伊朗军事打击,美伊谈判仍围绕资金、停战与制裁僵持
特朗普宣布推迟原定周二对伊朗的军事打击;卡塔尔、沙特、阿联酋领导人请求暂缓,海湾国家优先关注霍尔木兹海峡开放和伊朗导弹计划。谈判中,伊朗要求释放全部冻结资金、永久停战并解除制裁,美方仅同意分阶段解冻25%资金,核问题留待后续,伊朗坚持当前只讨论结束战争和信任措施。
𝕏 美国财政部与印度阿达尼集团达成 2.75 亿美元制裁和解
美国财政部与阿达尼企业达成2.75 亿美元和解,涉及32 起明显违反伊朗制裁行为;阿达尼被指购买实际源自伊朗的 LPG,并承诺在美国投资 100 亿美元。
💹 刚果(金)埃博拉疫情扩散,116 例疑似病例死亡
刚果(金)东部埃博拉疫情已报告116 例疑似死亡、435 例疑似病例;世卫组织 17 日宣布该疫情构成国际关注突发公共卫生事件。
美国扩大折扣药品定价计划,TrumpRx 将增加 600 多种仿制药
特朗普宣布扩大折扣药品定价计划,可获得折扣的药品数量增加7 倍,TrumpRx网站将新增超过600 种仿制药。
𝕏 美国众议院提议向电动车每年收取 130 美元道路费
美国众议院提出法案,要求电动车每年缴纳130 美元道路费,插混车型缴纳35 美元;相关五年公路法案规模超过5000 亿美元。
内塔尼亚胡连续两晚召开安全会议,准备重启对伊朗战事
内塔尼亚胡在与特朗普通话后连续两晚召集安全内阁,以色列官员称对伊朗战事可能在本周结束前恢复。
𝕏 中国前四个月固定资产投资意外收缩
财新称中国前四个月固定资产投资意外下降,房地产低迷继续拖累经济,基建投资保持韧性。
𝕏 特朗普对台言论显示美国对台政策更趋交易化
经济学人称,特朗普访华后相关言论显示,其对台湾关系采取更交易化立场,凸显美国对台政策的不确定性。
𝕏 伊朗新霍尔木兹海峡机构要求船只通行前获许可
伊朗新设霍尔木兹海峡管理机构称,船只须完全协调并获得通行许可,否则通行将被视为非法。
𝕏 乌克兰今年失地仅 0.04%,近期开始收复部分阵地
The Economist测算,俄罗斯今年仅占领乌克兰**0.04%**领土,追踪器显示乌军近期收复部分地面。
𝕏 华尔街日报称中方以渔船和海警船推进争议水域控制
WSJ称中国十多年持续部署渔船和海警船,强化在亚洲争议水域的存在与控制。
🔶 特朗普撤销对美国国税局 100 亿美元诉讼
特朗普及其两个长子、特朗普集团在迈阿密联邦法院撤销对IRS的100 亿美元诉讼。
𝕏 习近平维持与普京的“无上限”伙伴关系
经济学人称,中国在稳定对美关系的同时,仍不会以牺牲中俄关系为代价,习近平继续维持与普京的伙伴关系。
格陵兰总理会见美国特使,重申“不出售”
格陵兰总理 Jens-Frederik Nielsen 会见美国特使Jeff Landry,明确表示岛屿不出售。
𝕏 事实核查:特朗普离京时扔掉中方礼品说法被追问来源
德国之声核查特朗普访华礼品照片,并向白宫随行记者求证相关说法来源。
📈 财经市场
𝕏 CoreWeave 完成 31 亿美元 GPU 抵押贷款,支持 AI 基础设施合同
CoreWeave完成31 亿美元GPU 抵押贷款,资金将用于支持两项大型客户 AI 基础设施合同。随着 AI 算力需求持续升温,公司今年融资总额已超过200 亿美元,显示 GPU 资产融资在 AI 基础设施扩张中的重要性上升。
𝕏 Meta 本周拟裁员约 8000 人,以缓解 AI 投资压力
Meta据称本周拟裁员约8000 人,相当于员工总数约 10%,同时取消约 6000 个空缺岗位。公司近期将 2026 年资本开支上限提高至1450 亿美元,裁员被视为在加大 AI 基础设施投入背景下控制成本的举措。
美国撤销对阿达尼欺诈指控,此前其承诺在美投资 100 亿美元
美国撤销对印度富豪Gautam Adani的欺诈指控;此前阿达尼承诺在美国投资100 亿美元。相关案件曾涉及印度太阳能项目贿赂指控,此次撤案使市场关注大型跨境投资与监管执法之间的关系。
🔶 SpaceX 启动 1 拆 5 拆股计划,IPO 前下调单股公允价值
SpaceX通知股东启动1 拆 5拆股,单股公允价值由526.59 美元降至约 105.32 美元。拆股本身不改变公司整体估值,但可降低单股价格,市场将其视为 IPO 前资本结构调整信号。
𝕏 AST SpaceMobile 称将约每月发射一批卫星,目标 2026 年底部署 45 颗
AST SpaceMobile CEO Abel Avellan 表示,下一批卫星正运往发射场,公司计划未来约每月发射一批卫星,目标到2026 年底部署45 颗卫星,以推进其天基移动通信网络建设。
外国投资者 3 月美债持仓减少 1384 亿美元
美国财政部数据显示,外国投资者 3 月美债持仓减少1384 亿美元,长期美债估值浮亏达1421 亿美元。数据反映海外资金对美债配置变化,也凸显利率波动对债券持仓估值的影响。
🔶 凯文·沃什将于 5 月 22 日宣誓就任美联储主席
凯文·沃什将于5 月 22 日在白宫宣誓就任美联储主席,任期 4 年。该任命将影响美国货币政策走向,市场后续将关注其对利率路径、通胀治理和金融监管的表态。
🔶 花旗与贝莱德 HPS 启动 150 亿欧元欧洲私募信贷计划
花旗集团与贝莱德 HPS达成五年合作,计划在欧洲、中东和非洲部署最高150 亿欧元私募信贷。该合作显示大型金融机构继续加码私人信贷市场,并拓展银行与资管机构的联合融资模式。
💹 韩国央行测算三星罢工最坏情形或拖累 GDP 增速 0.05 个百分点
韩国央行测算,若三星电子自 5 月 21 日起罢工 18 天,半导体生产损失可能达到30 万亿韩元,并在最坏情形下拖累韩国 GDP 增速 0.05 个百分点,凸显半导体产业对韩国宏观经济的重要性。
居民存款前四个月出现向非银体系迁移迹象
人民银行数据显示,4 月居民存款减少1.94 万亿元,非银存款增加2.47 万亿元。数据提示居民资金可能从银行存款向理财、基金等非银体系迁移,市场关注存款搬家对金融机构负债和资本市场流动性的影响。
𝕏 百度 Q1 核心 AI 业务收入超 136 亿元,同比增长 49%
百度Q1 核心 AI 业务收入超过136 亿元,同比增长49%,并首次占核心收入过半。该数据反映 AI 业务在百度收入结构中的权重提升,也显示云、模型和 AI 应用商业化进展加快。
𝕏 摩根大通称半导体交易拥挤度升至 99.3%
摩根大通数据显示,半导体板块交易拥挤度升至99.3%,而软件板块仅为22.8%。该对比显示资金和市场关注度高度集中在半导体领域,也提示板块交易拥挤带来的波动风险。
Tenstorrent 或获超 50 亿美元估值,AI 芯片赛道并购兴趣升温
Tenstorrent吸引多家竞争对手兴趣,若交易达成,这家AI 芯片初创公司估值可能超过50 亿美元。该消息反映 AI 芯片赛道并购和战略投资热度升温,资本继续寻找英伟达之外的算力硬件机会。
巨力索具登上热搜:股价一年上涨 600%
巨力索具因股价一年狂飙600%登上微博热搜。该股短期关注度快速升温,市场讨论集中在股价大幅上涨后的估值压力、资金炒作风险以及基本面能否支撑涨幅。
𝕏 美国股市屡创新高挑战衰退预期
美国股市连续刷新历史高点,与特朗普反增长政策预期形成反差。股市强势表现使市场重新评估美国经济韧性、企业盈利前景与政策不确定性之间的关系,但高位波动风险仍受关注。
🏭 工业能源
𝕏 Yum Brands 与 NVIDIA 合作的快餐 AI 系统已覆盖 3.8 万家门店
Yum Brands旗下Byte by Yum平台已覆盖约3.8 万家门店,支撑约400 亿美元数字销售;门店 AI 助手 Byte Coach 覆盖 2.8 万家,Taco Bell 语音 AI 已部署至 600 家 drive-thru。
🔵 Meta 路易斯安那 AI 数据中心投资约 2000 亿美元,需 7.5GW 电力
Meta正在路易斯安那建设大型AI 数据中心,项目融资规模约2000 亿美元,预计需要7.5GW电力和 10 座天然气电厂,凸显超大规模 AI 基础设施对电力系统的冲击。
𝕏 Ford Energy 与 EDF 签署最高 20GWh 储能供应协议
Ford Energy与可再生能源开发商EDF签署五年储能供应协议,最高供应20GWh容量;EDF 每年可采购至多4GWh DC Block 电池储能系统,单柜额定容量为 5.45MWh。
我国首个超临界二氧化碳地热取热项目在郑州投产
中国华能在河南郑州投产全国首个超临界二氧化碳地热取热项目,通过让二氧化碳进入2500 米地热井取热,探索地热开发与二氧化碳利用结合的新型能源路径。
𝕏 HIVE Digital 斥资 5800 万美元收购多伦多土地,转型 AI 数据中心
HIVE Digital宣布以5800 万美元收购多伦多约 25 英亩土地,用于建设工业级AI 数据中心。项目预计支持320MW容量及超过 10 万张 GPU,标志着其从比特币挖矿向 AI 与高性能计算基础设施转型。
💹 Tenstorrent 获英特尔、高通早期收购兴趣,估值或超 50 亿美元
Tenstorrent正与英特尔、高通等公司接触,市场消息称潜在交易估值可能超过50 亿美元。该动向显示 AI 芯片创业公司仍受到大型半导体企业关注。
𝕏 NVIDIA Networking 并入 AI 基础设施部门
NVIDIA宣布NVIDIA Networking部门正式并入NVIDIA AI Infra,以统一网络、计算和中间层能力。此举旨在整合资源,共同构建面向未来的AI 基础设施生态。
𝕏 三星前半导体负责人预警:存储价格明年下半年或下跌
三星顾问庆桂显预警称,全球存储晶圆产能将升至600 万片/月,韩国虽占 DRAM 近70%,但无晶圆厂设计领域占比仅1.5%;随着供给扩张,存储价格明年下半年存在回落风险。
我国大型数据中心以虚拟电厂形式参与电力现货交易
中国联通韶关、中国移动广州和湛江共 3 个数据中心集群参与广东电力现货交易,以虚拟电厂形式实现“算随电动”,探索数据中心负荷与电力市场协同调度。
𝕏 机器人专家称硬件供应链独立已成美国国家安全议题
前 OpenAI、苹果、Meta 机器人专家Caitlin Kalinowski表示,AI 前沿正在转向物理世界,内存涨价、无人机战争和供应链外包等因素将影响机器人产业,硬件供应链独立正上升为国家安全议题。
𝕏 马斯克称 Starship 产线已满,今年还将完成约 10 艘飞船和 5 枚助推器
马斯克表示,Starship产线已满,今年预计还将完成约10 艘飞船和约5 枚助推器,显示 SpaceX 正继续提升重型运载火箭的制造与测试节奏。
𝕏 AWS AI 战略依靠 2000 亿美元支出与定制芯片推进
亚马逊云科技正通过约2000 亿美元资本支出、定制芯片和外部合作补齐 AI 战略版图,试图在云计算、模型训练和推理基础设施竞争中保持优势。
花旗预计铝库存 6 至 12 个月降至历史新低,价格或冲 4000 美元
花旗预计铝市场今年短缺近270 万吨,库存将在6 至 12 个月内降至历史新低,并判断 3 个月铝价可能达到4000 美元/吨,反映有色金属供需偏紧预期。
🔶 日产拟缩减横滨工厂,首次重组日本国内零部件工厂
日产汽车计划在2028 年以后缩减横滨工厂,这是其首次重组日本国内零部件工厂;公司将保留全固态电池试制能力,以支撑下一代电动车技术布局。
𝕏 弗吉尼亚“数据中心之都”2019-2024 年电价反而下降
弗吉尼亚数据中心之都在2019-2024 年期间电价下降,这一数据被用来反驳“AI 数据中心必然推高居民电费”的叙事,提示电价变化还受电网结构、市场机制和能源供给等因素影响。
英特尔 CEO 称 14A 芯片将于 2028 年生产、2029 年量产
英特尔 CEO 陈立武表示,14A 芯片将于2028 年实现生产,并在2029 年进入量产阶段。这一时间表关系到英特尔先进制程和代工业务的后续竞争力。
💹 氦气供应收紧,进口价格 4 月以来一度升至 550 元每立方米
氦气价格自 4 月以来加速上涨,进口价格一度触及550 元/立方米。中东局势推升断供担忧,可能影响半导体、科研和低温工业等依赖高纯氦气的领域。
𝕏 AMD CEO 苏姿丰在北京会见中国副总理何立峰
AMD首席执行官苏姿丰在北京会见中国副总理何立峰。中方表示希望深化与 AMD 合作,释放出在半导体产业链和技术合作方面继续沟通的信号。
🔵 美国东海岸电价因高温和电网紧急警报大涨
美国东部电价飙升,最大电网运营商因高温发布紧急电网警报,电力供应承压。事件显示极端天气下区域电网备用容量和调峰能力面临考验。
𝕏 Figure F.03 完成人机包裹搬运实测
Figure AI F.03完成首场人机包裹搬运实测,人类实习生比机器人多搬192 个包裹;后续观察重点将从单次展示转向长任务中的中断率和稳定作业能力。
𝕏 Stoke Space 在 Moses Lake 启动一级结构与 Zenith 发动机测试
Stoke Space宣布在Moses Lake启动测试,覆盖一级结构和Zenith发动机,推进火箭发射前关键验证,为后续飞行测试和商业发射能力建设做准备。
🧠 深度思考
𝕏 ClickMem 重写:Agent 记忆应像保险箱,而不是自动画像
ClickMem作者反思 Agent Memory 设计,认为系统不应自动记住用户的碎片信息并生成隐性画像,而应让用户显式写入重要内容,并按项目、工作、个人等维度隔离。其核心观点是,Agent 记忆更应该像可控的保险箱,而不是持续收集信息的默认监控层。
𝕏 基础模型商品化后,AI 价值将更多转向垂直应用层
观点认为,随着基础模型能力趋同并进入价格竞争,其利润率可能逐渐下降,成为低利润的基础设施层。未来更强的利润空间和网络效应,可能出现在掌握场景数据、工作流入口和客户关系的垂直智能代理上。
𝕏 Joshua Browder 分享早期投资人筛选创始人的高压测试方法
Joshua Browder分享了早期投资人与创始人互动时的筛选方法,包括安排11 点面谈、现场查看Stripe数据,以及通过同住辅导观察创始人的执行力、抗压能力和真实业务进展。这类方式强调用行为和数据验证创始人,而不是只听融资叙事。
𝕏 美国 AI 监管碎片化加剧,2025 年州级法案已超 1200 项
Yale SOM与Gary Marcus等指出,美国2025 年已提出超过1200 项州级 AI 法案,显示监管碎片化正在加剧。他们建议先发布解释性指引,帮助企业理解现有法律适用边界,再针对选举虚假信息等高风险场景制定更窄、更明确的立法。
𝕏 编码代理仍难处理训练分布外的科学仿真需求
Omar Sar用一个 10 岁孩子提出的火箭模拟器需求测试编码代理,发现当前模型更擅长扩展已有模式,而不是处理训练分布外、需要物理直觉和仿真建模的新问题。他据此认为,LLM 虽在编程辅助上进步明显,但距离真正通用的AGI仍有差距。
𝕏 AI 工具商业模式正在转向 MCP 与 skills 分发
AI 产品如果只是单独售卖工具,商业模式仍接近卖 token 或一次性能力调用,用户黏性有限。作者认为,转向MCP和skills分发,可以让工具嵌入 Codex 等 agent 的工作流中,从而获得更高频的调用入口和更稳定的使用场景。
𝕏 Garry Tan:美国餐饮连锁的问题在于缺少“主人意识”
Garry Tan以BJ's 餐厅和海底捞作对比,认为美国餐饮连锁的核心问题不是服务流程本身,而是多层管理稀释了责任感与现场判断力。相比之下,海底捞更强调一线员工的主动性和“主人意识”,这让服务质量更容易在复杂场景中保持稳定。
𝕏 AI 应用创业需要同时设计市场、产品与组织结构
AI 应用创业不能简单照搬大厂打法,应先判断所处的市场结构,再决定产品结构和组织结构。作者认为,创业公司需要明确自己是在做工作流替代、垂直场景深耕还是平台分发,并据此配置团队能力、销售方式和产品边界。
𝕏 Philippe Laffont:AI 短缺市场的权力可能从卖方转向买方
Philippe Laffont提醒,当前AI 市场仍在奖励掌握稀缺供给的卖方,例如算力、模型能力或关键基础设施提供者。但随着供给增加和竞争加剧,市场权力可能逐步转向买方,届时真正能创造差异化需求和持续价值的公司会更占优势。
𝕏 AI 时代,公司协作能力可能比单人公司更稀缺
观点指出,OPC即单人公司在 AI 工具加持下效率会显著提高,但真正稀缺的能力可能不是个人产能,而是多人长期共同经营公司的能力。因为组织协作、信任、分工和规模化管理更难被工具完全替代,其稀缺性体现在更高的增长天花板上。
𝕏 Richard Sutton 用 26 个词重申“苦涩教训”
Richard Sutton再次概括苦涩教训:不要过度迷信人类手工知识和专家规则,长期看更有效的路径是构建能随计算规模扩展的搜索与学习系统。这一观点延续了他对人工智能发展史的判断,即通用方法最终会胜过人为设计的局部技巧。
📰 综合新闻
𝕏 马斯克诉 OpenAI 案被驳回,陪审团认定已过诉讼时效
美国陪审团认定,马斯克针对 OpenAI/Sam Altman 的诉讼已超过 3 年诉讼时效;法官 Yvonne Gonzalez Rogers 确认该裁定并驳回案件。
𝕏 波兰政府将用 ElevenLabs 语音代理提醒医保预约
波兰计划今夏在国家医疗预约系统中部署 ElevenLabs 语音代理,用于提醒医保预约;该系统每年涉及约 4000 万 次预约,并希望缓解 10%至 20%的爽约问题。
𝕏 美国年轻硕士毕业生面临近 20 年罕见高失业率
华尔街日报中文网报道称,美国 35 岁以下硕士 工作者失业率处于近 20 年 罕见高位,显示高学历年轻群体在当前就业市场中也面临更大压力。
天津高空跳伞项目发生事故,2 人遇难
天津一高空跳伞项目发生事故并登上热搜,目前已造成 2 人遇难。相关事故原因、项目运营资质及后续处置情况仍待进一步披露。
𝕏 广西柳州柳南区发生 5.2 级地震
中国地震台网测定,5 月 18 日 21 时 44 分,广西柳州市柳南区发生 5.2 级 地震,震源深度 8 千米。
𝕏 上海交大通报学生用豆包 AI 伪造竞赛奖金记录
上海交通大学通报,樊同学在“AI+能源”竞赛获奖后,使用 豆包 AI 伪造收款记录,学校已给予严重警告处分。
全村 62 人患癌事件登上微博热搜,多名村民发声
全村 62 人患癌 话题持续发酵并登上微博热搜,多名 村民 公开发声,相关环境、健康和责任调查问题受到关注。
💹 中央气象台发布暴雨黄色预警,湘桂粤局地大暴雨
中央气象台5 月 19 日 6 时发布 暴雨黄色预警,湖南、贵州、广西、广东等地部分地区有强降雨,局地降雨量可达 100 至 180 毫米。
𝕏 配音演员 Tom Kane 去世,曾为《使命召唤》角色配音
配音演员 Tom Kane 去世,享年 64 岁;他曾为《使命召唤》僵尸模式角色 Takeo Masaki、Yoda 和 Professor Utonium 等角色配音。
警方通报男子酒后殴打女儿事件
警方通报 男子酒后殴打 女儿 事件,相关话题进入微博热搜。事件处置进展及未成年人保护问题引发网友关注。
𝕏 Studio Ghibli CEO 福田博之将卸任
Studio Ghibli CEO 福田博之 将离任,外界关注吉卜力后续管理层安排及接任人选。
💡 生活建议
𝕏 诚实界定认知边界能提高判断可信度
PandaTalk8建议对不了解的问题明确说“不确定”,让读者更信任你在擅长领域的确定判断。
𝕏 培养孩子阅读和安全座椅习惯的长期收益
儿童阅读与安全座椅习惯可从低龄阶段持续强化,降低出行阻力。
🛡️ 安全研究
𝕏 阿里论文提出多智能体自动漏洞利用框架 VulnSage
阿里相关论文提出自动漏洞利用框架 VulnSage,通过多智能体协作完成数据流提取、约束生成、沙箱验证和反思修复等步骤。在 SecBench.js 基准上,其成功率较旧工具提升 34.64%,并报告发现 146 个零日,显示进攻型安全自动化能力进一步增强。
博客披露单人借助 Claude 入侵墨西哥政府系统并外泄 150GB 数据
Hacker News 热帖讨论一篇博客披露的事件:一名个人使用 Claude 攻破 墨西哥政府 系统,并外泄 150GB 数据。原文获得 44 分和 26 条评论,案例引发对大模型辅助攻击、政府系统暴露面以及个人攻击者能力放大的关注。
𝕏 纽约公立医院系统数据泄露,至少 180 万人受影响
NYC Health and Hospitals 披露一起重大数据泄露事件,黑客窃取了医疗数据和 指纹 等敏感信息,影响至少 180 万 人。该机构是美国最大公立医院系统之一,事件涉及医疗隐私、生物识别数据保护和公共医疗体系安全风险。
𝕏 Cloudflare 用 50 个自有仓库测试 Anthropic Mythos
Cloudflare 使用 50 个仓库 测试 Anthropic 的 Mythos,重点观察其在漏洞发现、代码理解和进攻型安全场景中的表现。该测试引发对进攻型 AI 与漏洞架构结合方式的讨论,属于企业在真实代码库上评估安全智能体能力的案例。
𝕏 Grafana Labs 称黑客窃取代码并拒绝支付赎金
Grafana Labs 确认公司代码被黑客窃取,并表示不会支付勒索赎金。事件显示开源与可观测性软件供应链面临持续攻击压力,也凸显企业在源码泄露、勒索谈判和安全透明度之间的处置选择。
由 X-Crawler AI 生成于 2026-05-19 08:02
EVENT-DRIVEN INTELLIGENCE
免费先看重点,Pro 再看速度、深度和可追踪性
这篇内容是公开入口。继续使用天眼时,固定沿着三条路径走:订阅每日情报、查看同主题历史上下文、升级 Pro 解锁事件追踪与研究能力。