天眼早报
英国国家AI安全研究所报告称,Mythos与GPT-5.5在网络安全任务上的能力倍增周期缩短至4.5个月,且表现主要受推理token预算限制。这意味着模型在攻防、漏洞利用和复杂自动化任务上会更快逼近人类专家,监管与企业安全团队需要重新评估测试频率和防护节奏。
Nous Research发布Token Superposition Training,在不改模型架构、优化器或分词器的情况下,将LLM预训练墙钟时间缩短2-3倍,并在270M到10B-A1B MoE规模验证。若可规模化复现,将直接降低训练排队和算力成本,给中小模型团队带来追赶窗口。
Notion发布Developer Platform,包含External Agents API、Workers沙箱、CLI、Webhook和数据库同步,可接入Claude、Codex、Cursor等外部代理。Notion正从文档协作工具升级为企业代理工作台,让代理在同一知识库中可见、可审查、可执行,强化其在办公入口的竞争力。
Android 16新增AppFunction机制,应用可用@AppFunction把本地能力暴露给Gemini等AI代理,支持跨应用动作链且无需云端服务器。这相当于在手机系统层引入MCP式接口,可能让订票、支付、消息、日程等操作被代理统一调度,影响整个Android应用生态。
Anthropic CFO Krishna Rao称,公司运行收入从2.5亿美元增至300亿美元,并已融资约750亿美元,同时参与Trainium、TPU和GPU算力分配。若口径属实,说明头部AI公司收入与资本开支同步爆发,云厂商、芯片供应链和模型价格战都会继续被算力需求牵引。
🤖 AI 大模型
𝕏 【重磅】英国国家 AI 安全研究所发布前沿模型评估:Mythos 与 GPT-5.5 能力倍增周期仅 4.5 个月
英国国家 AI 安全研究所最新报告指出,Mythos和GPT-5.5在网络安全任务上的能力正在快速提升,完成复杂任务的长度每几个月翻一番。报告显示,能力倍增周期缩短至 4.5 个月,且模型性能受限于推理 token 数量而非底层能力上限。
𝕏 【重磅】Nous Research 发布 Token Superposition Training,训练速度提升 2-3 倍
Nous Research推出Token Superposition Training (TST),一种修改标准 LLM 预训练循环的方法。该方法在匹配 FLOPs 的情况下,将墙钟时间缩短 2-3 倍,且无需改变模型架构、优化器或分词器。实验验证涵盖270M至10B-A1B MoE规模,推理模型与传统预训练完全一致。
𝕏 ⭐ Anthropic 宣布 Claude Code 周使用限额提升 50% 并新增月度额度
Anthropic宣布从即日起到7 月 13 日,Claude Code周使用限额提升50%;同时付费计划用户可获得专属月度额度,覆盖 Agent SDK、GitHub Actions等程序化调用场景。
𝕏 ⭐ LangChain 发布 SmithDB 与 Engine,重构 Agent 可观测性
LangChain发布专为Agent 可观测性设计的分布式数据库SmithDB,性能提升12 倍;同时推出Engine,能自动分析追踪数据并生成修复代码,实现自改进 Agent闭环。
𝕏 ⭐ Notion 推出开发者平台:支持外部 Agent 编排、自定义工具及数据库同步
Notion正式发布开发者平台,引入External Agents API允许集成任意 Agent,新增Workers托管计算沙箱用于构建自定义工具,并推出CLI命令行工具。新功能支持将Salesforce等数据源同步至 Notion 数据库,实现自动化工作流。
𝕏 ⭐ Android 16 引入本地 MCP 式能力,应用可向 Gemini 暴露工具函数
Android 16新增本地AppFunction机制,应用可用**@AppFunction**向 Gemini 等代理暴露工具,支持跨应用动作链且无需云端服务器。
𝕏 ⭐ LangChain 发布 SmithDB 等七大新工具加速 Agent 开发
LangChain在 Interrupt 大会上发布一系列新产品,包括专为 Agent 可观测性设计的SmithDB(速度提升15 倍)、LangSmith Engine、Sandboxes及Managed Deep Agents。这些工具旨在覆盖从开发到部署的全生命周期,支持企业级 Agent 构建。
𝕏 ⭐ SGLang 支持 Laguna-XS.2 模型,SWE-bench 验证率达 68.2%
SGLang新增对Laguna-XS.2(33.4B-A3B 混合架构)的支持,该模型专为Agent 编码设计,在SWE-bench Verified测试中达到68.2%,支持131K-token上下文及原生工具调用解析。
𝕏 ⭐ MiniCPM-V 4.6 开源,1.3B 多模态模型可在手机端做图像识别
面壁智能开源MiniCPM-V 4.6,参数量1.3B,AA 评测仅耗5.4M token,低于 Qwen3.5-0.8B 非推理版 101M。
𝕏 ⭐ PayPal 与 Anthropic 合作推出面向小企业的 AI 培训及 Claude 插件
PayPal宣布与Anthropic合作,为小企业推出免费 AI 培训课程及Claude for Small Business插件。该插件可连接QuickBooks、HubSpot等工具,协助处理发票和退款任务,需人工审批以确保合规。
𝕏 ⭐ Anthropic 将 Claude Agent SDK 程序化调用改为额度制,6 月 15 日生效
Anthropic将Claude Agent SDK、claude -p、GitHub Actions 等程序化调用纳入美元额度:Pro 20 美元、Max 20x 200 美元,6 月 15 日生效。
𝕏 ⭐ Anthropic 将为付费 Claude 套餐加入 Agent SDK 月度额度
Anthropic称自6 月 15 日起,付费Claude套餐将包含独立的Claude Agent SDK月度额度,覆盖脚本、claude -p 和第三方 SDK 应用。
𝕏 ⭐ Google Gemini 网站 4 月访问量达 27.61 亿,连续 16 个月增长
Similarweb数据显示,Gemini网站 4 月访问量达27.61 亿,环比增6.38%、同比增 574.47%,连续 16 个月增长。
𝕏 ⭐ Mythos Preview 首次完成英国 AISI 两个网络靶场
Mythos Preview被称为首个端到端完成英国AISI两个网络靶场的模型,其中包括此前无模型攻破的Cooling Tower任务。
𝕏 ⭐ Anthropic CFO 披露收入与算力采购细节
Anthropic CFO Krishna Rao 称,公司运行收入从2.5 亿美元增至300 亿美元,已融资约750 亿美元,并负责 Trainium、TPU、GPU 算力分配。
𝕏 ⭐ Supabase 推出 Agent Skills,AI 代理直接尊重 RLS 规则
Supabase发布Agent Skills,使 AI 代理(如Claude Code、Cursor)能直接理解并遵守数据库的**RLS(行级安全)**策略。通过一条命令 npx skills add supabase/agent-skills,即可让代理在构建应用时自动遵循数据权限,消除猜测 CLI 命令的需求。
𝕏 ⭐ Cursor 推出云环境运行 Agent 功能,支持完整开发栈配置
Cursor宣布用户可在云环境中运行AI Agent,支持克隆仓库、安装依赖及配置工具链凭证。企业客户如Decagon、Amplitude已利用此功能让 Agent 端到端处理任务,并具备版本回滚与审计日志功能。
𝕏 ⭐ Claude Code 每周用量上限临时提高 50%
Anthropic把Claude Code每周上限提高50%,覆盖 Pro、Max、Team、Enterprise,叠加上周5 小时窗口翻倍,有效期至7 月 13 日。
𝕏 ⭐ Mythos 模型成为首个通过 AISI 全部网络安全演练的 AI 系统
Anthropic发布的 Mythos预览版成为首个成功解决 AISI(人工智能安全研究所)所有网络安全演练的模型,展示了其在防御性 AI 领域的突破性能力。
𝕏 Finance Agent Benchmark v2 显示开源权重金融模型逼近前沿模型
Kimi K2.6、GLM 5.1、DeepSeek V4 Pro在金融智能体基准约44%-45%,距领先模型约 7 分。
𝕏 Amazon 在搜索栏推出 Alexa+驱动的 AI 购物助手
Amazon在 App 和网站加入Alexa for Shopping,可比较商品、生成购买指南、追踪价格并自动找优惠。
𝕏 Google 推出 Gemini Intelligence,深化 Android 跨应用自动化
Google将Gemini Intelligence整合进Android,支持跨应用多步骤任务自动化。
𝕏 OpenAI 向企业提供 30 天内试用 Codex 可获两个月免费额度
Sam Altman称企业在未来30 天内试用迁移到Codex,可获得两个月免费使用额度。
𝕏 Hugging Face 展示用 Claude Code 微调视觉语言模型
Hugging Face演示让Claude Code计算 VRAM、选择实例并启动模型微调任务。
𝕏 DramaBox 开源语音模型支持表演生成与可验证签名
Resemble AI发布开源DramaBox,同时提供表演式语音生成和可验证声音签名。
𝕏 本地 Qwen-3.6-35B-A3B 可在 M1 Max 64GB 上完成实际开发任务
Qwen-3.6-35B-A3B配合llama.cpp可在M1 Max 64GB上并行处理两个项目,达到可工作水平。
𝕏 Warp 接入 Claude Opus 4.7 快速模式,速度提升约 2.5 倍
Warp Agent向付费用户开放Claude Opus 4.7快速模式,在保持模型能力下速度约提升2.5 倍。
🛠️ AI 工具推荐
𝕏 ⭐ Notion 发布 Developer Platform,加入 CLI、Workers、Agent SDK 等开发能力
Notion发布Developer Platform,包含 CLI、Workers、数据库同步、Webhook 触发器、External Agents API 和Notion Agents SDK。
𝕏 ⭐ LangSmith 推出 SmithDB:专为智能体可观测性设计的分布式数据库
LangChain在 Interrupt 大会上宣布推出 SmithDB,这是专为处理智能体追踪数据构建的分布式数据库,相比传统架构在关键访问模式上性能提升12 倍。
𝕏 ⭐ Notion 发布 External Agents API,把 Claude、Codex、Cursor 等代理接入工作区
Notion推出External Agents API,支持接入 Claude、OpenAI Codex、Cursor、Warp 等外部代理,让代理任务在工作区内可见、可审查、可执行。
𝕏 ⭐ Cursor 云代理支持完整开发环境配置
Cursor云代理新增开发环境配置,可预置克隆仓库、依赖安装和工具链凭证,让云端 Agent 像工程师笔记本一样运行项目。
𝕏 ⭐ CloakBrowser:开源反检测浏览器,reCAPTCHA v3 得分 0.9
CloakBrowser是一款基于**Chromium C++**源码修改的开源反检测浏览器,通过修补Canvas、WebGL等指纹特征,在reCAPTCHA v3测试中得分0.9,完美模拟真实人类行为,替代昂贵的商业反爬方案。
𝕏 Cline 开源新版 SDK,支持开发者构建编码代理
Cline SDK基于 2024 年编码代理经验重构,可通过npm i @cline/sdk安装。
𝕏 Cline 重建 CLI 与 SDK,支持 TUI、Agent Teams、定时任务和连接器
Cline CLI基于 SDK 重建,可用npm i -g cline安装,并提供**@cline/sdk**构建自定义智能体。
𝕏 Jacq 发布云端编码代理,可跨 Slack、Linear、GitHub 工作
Jacq运行在云端,可调用多设备工具,并在Slack、Linear、GitHub中保留任务线程。
𝕏 Runway Agent 上线:用对话生成完整剪辑视频
Runway Agent支持通过对话完成创意构思、视频生成、声音设计和剪辑。
𝕏 Perplexity 披露企业级代理沙盒安全架构
Perplexity Computer采用硬件隔离沙盒、VPC 级存储计算分离和短期代理令牌。
𝕏 ⭐ OmniSocials:单指令实现跨 10 大社交平台内容分发
OmniSocials是一款集成在Claude中的社交媒体管理工具,支持通过单一指令完成Instagram、X、LinkedIn等10 个平台的内容起草、排版和排期。它自动处理各平台的字符限制和格式要求,替代了传统的 Hootsuite 或 Buffer 等付费工具。
𝕏 ⭐ SureThing 刷新 LongMemEval 记录,长记忆能力达 88.0%
SureThing在LongMemEval基准测试中取得88.0%总分,其中知识更新能力达91.0%,成为当前长短期记忆管理领域的 SOTA 解决方案,显著提升 Agent 在多轮对话中的信息保留能力。
𝕏 PayPal 每周在 Perplexity Enterprise 执行 7.4 万项任务
PayPal每周运行74000项Perplexity Enterprise任务,用于模型验证、市场趋势和竞品分析。
𝕏 ⭐ Tolaria:基于 Git 的本地 Markdown 知识库管理工具
Tolaria是一款 Mac 应用,用于管理纯文本Markdown知识库。所有笔记存储在Git 仓库中,支持离线使用、版本控制和任意远程同步。该工具兼容Claude Code等 AI 助手,适合构建第二大脑或公司文档系统,完全开源且无订阅费用。
𝕏 ⭐ Notion 发布 CLI 工具 ntn,将 Notion API 带入终端
Notion推出官方命令行工具 ntn,将完整的 Notion API集成至终端,支持构建和部署 Workers,为人类开发者及编码智能体提供高效的数据同步体验。
𝕏 网页转 Markdown 工具可为 AI Agent 降低 token 消耗
网页转 Markdown开源工具面向AI Agent优化,支持 CLI、浏览器插件和 API,并已集成 Cursor、Claude 等工具。
𝕏 ElevenCreative 推出 Templates 复用创意工作流
ElevenLabs在ElevenCreative推出 Templates,可复用产品图、样机、风格迁移等流程。
𝕏 React Review 上线,可检查 PR 中的低质量 React 代码
React Review面向 GitHub 仓库检查React代码问题,无需注册,支持团队在 PR 阶段发现坏代码。
𝕏 Lovable 接入搜索引擎发现与 Semrush SEO 数据对话
Lovable新增面向搜索引擎和 AI 的可发现能力,并支持在产品内对话查询Semrush SEO 数据。
𝕏 ⭐ PlainTab:纯原生 JS+CSS 无依赖的新标签页扩展
PlainTab是一款无需构建、无外部依赖的浏览器扩展,使用纯JavaScript和CSS开发。它作为独立网页或新标签页使用,可秒开壁纸,避免白屏加载,适合追求极简体验的用户。
𝕏 ⭐ LandingAI 推出页面级分类 API,降低文档解析成本
LandingAI发布“解析前”页面分类 API,在昂贵的 OCR 和 LLM 解析前对 PDF 逐页打标。该服务可识别发票、银行流水等不同类型页面,仅将必要页面送入下游流水线,有效解决算力浪费和抽取幻觉问题,调用方式简单且支持自定义类定义。
𝕏 ⭐ Knowly:基于 Ethan_Yang_AI 团队的视频与论文解读工具
Knowly由Ethan_Yang_AI团队开发,支持解读YouTube视频和arXiv论文,效果媲美NotebookLM。该产品已获谷歌精选,配套 Chrome 插件虽用户较少但实力强劲,提供免费额度供测试。
𝕏 git-agent v0.3.0 加入 scope 白名单校验以抑制 LLM 幻觉
git-agent v0.3.0新增scope 白名单校验,用固定逻辑减少 LLM 幻觉,并修复若干 Bug。
𝕏 Warp 代理现可从 Notion 直接调用
Warp代理新增Notion入口,用户可在 Notion 中直接与终端 Agent 对话。
𝕏 Poppy 推出主动式 AI 助手,帮助整理数字生活
Poppy发布主动式AI 助手,面向个人信息、任务和数字生活整理场景。
𝕏 React Doctor 提供本地 React 问题诊断命令
React Doctor可通过npx react-doctor@latest本地运行,用于发现 React 项目中的性能和代码问题。
📖 教程攻略
𝕏 从零构建现代 LLM:带逐行注释的 GPT 训练教程
how-to-train-your-gpt项目从零实现现代LLM,覆盖注意力机制、位置编码、LayerNorm、残差连接、训练循环和学习率调度等核心模块。项目在 GitHub 约有687 星,适合希望理解 GPT 训练细节的开发者逐行学习。
𝕏 用 Obsidian 笔记库生成个人 Memory Wiki 的完整提示词
Memory Wiki提示词可把Obsidian笔记压缩为长期记忆层,生成总索引、核心母题、高频问题、方法论、关键词词典和更新规则。该流程适合将个人知识库转化为可供大模型长期调用的结构化记忆系统。
𝕏 Igor 内部分享:初创公司即媒体公司的 7 个核心建议
Igor提出“初创公司即媒体公司”理念,强调分发与产品开发同等重要。建议包括:一半精力留给开发、新功能需具备传播性、文档即资产、冷启动靠笨功夫、创始人亲自下场分发、死磕单一阵地,并每日同步微小进展。
𝕏 Omar Sar 分享 HTML Artifacts 与 Agent 协作的个人系统工作流
Omar Sar演示如何利用HTML Artifacts结合Agent构建个人系统:用简单的 Markdown 存储数据,让 Agent 自主读取和修改,无需数据库。该方法支持递归式自我改进自动化,降低维护成本并提升个性化工作流效率。
𝕏 AI 搜索优化 GEO 实操:用 IndexNow、Schema 和 AI 友好格式提升引用率
GEO实操方法包括用IndexNow实时推送、添加Schema结构化标记、在文章开头直答问题并补充 FAQ。作者还用 Claude Agent 自动生成 37 篇文章,用于提高内容被 AI 搜索和问答系统引用的概率。
🟩 在 Ubuntu 26.04 上部署 OpenClaw 自托管 AI 代理
OpenClaw部署教程覆盖 Docker 安装、交互式向导、Gateway 配置和Caddy HTTPS暴露控制台。文章面向希望在 Ubuntu 26.04 上运行自托管 AI 代理的开发者,提供从环境准备到安全访问的完整流程。
𝕏 OpenAI 示例:用 Realtime API 构建语音交互会议看板助手
OpenAI官方示例项目演示如何用Realtime API实现语音实时交互,在会议场景中管理看板、更新任务状态并推动任务流转。该示例适合开发者参考实时语音助手、协作看板和会议自动化产品的交互设计。
🟩 在 Ubuntu 26.04 上部署 Hermes Agent 自托管 AI 代理
Hermes Agent教程介绍如何在 Ubuntu 26.04 上用Docker Compose和Traefik HTTPS完成部署,并配置 OpenAI 兼容 LLM 后端。内容适合需要快速搭建自托管智能体服务与安全入口的开发者。
𝕏 Google Cloud 教程:构建分布式多 Agent 系统
Google Cloud发布新教程,指导开发者构建分布式多 Agent 系统,展示如何让多个 Agent 协作完成共同目标。内容涵盖系统架构、通信机制与任务协同方式,适用于复杂任务自动化和企业级智能体编排场景。
𝕏 WhisperKit 中文断句与字幕生成实战指南
WhisperKit支持word level timestamp输出,可结合大模型进行中文断句与标点恢复,解决长访谈录音无法一次性处理的问题。教程包含音频分块策略、时间戳对齐算法和 Speaker 分离技巧,适合字幕生成与采访整理场景。
🟩 Ubuntu 26.04 安装 RabbitMQ 并配置 HTTPS 管理面板
RabbitMQ安装教程覆盖 Erlang 安装、管理插件启用、管理员用户创建、Nginx反向代理和 Let's Encrypt 证书配置。文章适合需要在 Ubuntu 26.04 上部署消息队列并通过安全 Web 面板管理服务的用户。
🟩 Ubuntu 26.04 搭建生产可用 LEMP 栈
LEMP教程讲解在 Ubuntu 26.04 上配置 Nginx、MySQL、PHP 8.5和 Let's Encrypt,并通过 PHP 页面验证数据库读取。内容面向需要搭建生产可用 Web 运行环境的开发者和运维人员。
𝕏 Programming Notes:收集 10000 页以上免费编程笔记
Programming Notes汇总10000+页免费资料,覆盖 Java、SQL、Python、JavaScript、Git、Linux 和 DSA 等 40 多个主题。该资源适合编程学习者按主题系统查阅,也可作为面试复习和基础知识补全资料库。
𝕏 Supabase 入门第 6 集:理解 Edge Functions 部署与调用
Supabase入门教程第6 集聚焦Edge Functions,讲解后端函数的部署、调用与应用流程。内容适合正在学习 Supabase 全栈能力的开发者,用于理解如何在项目中扩展服务端逻辑。
💎 技巧经验
𝕏 AI 字幕 SRT 制作:先做词级时间戳,再断句回填
SRT 字幕制作的关键不是直接让模型生成整段字幕,而是先获得 word level timestamp,再用大模型补标点、断句、合并语义单元,并把时间戳回填到句子级字幕中;在 Mac 上可用 WhisperKit 本地完成说话人和单词时间识别。
𝕏 开源维护者应对 AI 批量报漏洞的 4 条建议
Trail of Bits提醒,前沿模型会让开源项目更频繁收到机器速度生成的漏洞报告。维护者可提前发布 SECURITY.md,要求提交者提供 PoC 与补丁,建立可重复验证的 harness,并通过沙箱隔离降低处理恶意样本的风险。
𝕏 内容创作三步法:信息、角度与创作节奏
AI 内容创作不能只盯着 AI 工具本身,爆款内容可拆成 获取信息、找角度、创作节奏 三步推进。作者认为真正拉开差距的是选题角度,约贡献 69%,而单纯写作执行只占约 1%。
𝕏 用 AI 审计 SaaS 定价页的高强度提示词
Brett From DJ分享了一套用于审计 SaaS 定价页 的完整提示词,可让 AI 从 定价结构、页面文案、CTA、信任信号、套餐差异和 A/B 测试机会等角度系统检查,适合用于发现转化阻力并生成优化建议。
𝕏 视频复刻工作流:用参考帧提升 AI 视频可控性
AIWarper建议在视频复刻中用参考帧控制 Seedance 的生成方向,通过替换地点、动物和视觉风格来复用原视频结构,而不必拘泥于原片场景。这类方法适合提升 AI 视频 的可控性和可复现度。
⚡ 工作流
💻 Notion 将工作区升级为 AI 代理协作中心
Notion Developer Platform允许团队把AI 代理、外部数据源和自定义代码直接接入工作区,使 Notion 从知识库和项目管理工具进一步转向代理式生产力平台。案例中,Every通过该平台连接内部知识与工具,让 20 名员工与约 30 个Custom Agents协作运营 4 个以上业务,展示了自定义代理在小团队多业务运营中的落地方式。
𝕏 HTML Artifacts 成为轻量级 AI 代理工作台
HTML Artifacts可结合Obsidian中的 Markdown 数据、JavaScript 和编码代理,快速搭建个人自动化流程,覆盖写作排程、研究整理、设计迭代、评估反馈等场景。其价值在于用轻量网页组件承载可交互工作流,让个人知识库、脚本和代理能力形成可复用的小型工作台。
𝕏 Agent 原生 IM 工作流自动沉淀访谈时间线与项目状态
Agent-native IM把用户访谈、会议、语音和文字自动关联到群组,并进一步生成timeline、结构化表格和项目状态。这种工作流把即时沟通从消息传递升级为项目记忆与信息结构化入口,适合用于用户研究、会议纪要、需求跟踪和团队协作沉淀。
𝕏 聊天工具、Notion、ElevenLabs 与剪辑工具组成视频制作 SOP
聊天工具、Notion、ElevenLabs和Hyperframes可串成视频制作流程:前端用对话工具完成选题、脚本和沟通,Notion 承载 SOP 与素材管理,ElevenLabs 生成配音,Hyperframes 负责剪辑与成片组织。该条目提供的是一套轻量视频生产工具链,而非单一产品公告。
📚 论文研究
𝕏 Nous Research 发布 Token Superposition Training,LLM 预训练墙钟时间提速 2 至 3 倍
Nous Research 发布 Token Superposition Training(TST)训练方法,在相同 FLOPs 下实现 2-3 倍 墙钟时间提速。该方法已在 270M、600M、3B dense 以及 10B-A1B MoE 等规模模型上验证,目标是在不增加计算预算的前提下提升预训练吞吐效率。
𝕏 PyTorch 2.12 发布:CUDA 线性代数提速百倍并新增 Graph API
PyTorch 正式发布 2.12 版本,带来多项性能和接口更新。其中 batched linalg.eigh 在 CUDA 上速度提升 100 倍,并新增 torch.accelerator.Graph API。新版还支持微缩放量化及融合 Adagrad 优化器,进一步强化训练与推理场景的工程能力。
𝕏 δ-mem 提出 LLM 在线记忆机制:无需微调即可扩展长期记忆
δ-mem 为冻结的大语言模型加入 8×8 外部在线记忆矩阵,使模型无需微调即可获得可更新的长期记忆能力。实验显示,该方法平均得分提升 1.10 倍,并在 MemoryAgentBench 上取得 1.31 倍 提升,指向一种轻量扩展 LLM 持续记忆的新路线。
𝕏 Gemini Deep Think 驱动 Aletheia 自主解决拓扑学 Kirby 问题
Aletheia 由 Gemini Deep Think 驱动,自主解决 Kirby’s list 中的拓扑学问题,展示了 AI 系统在高阶数学研究中的潜在辅助能力。该案例表明,推理型模型不只可用于证明检查,也可能参与开放数学问题的探索和解题流程。
𝕏 新论文揭示多智能体推理中的“Sovereignty Gap”,质疑堆叠智能体能稳定提升 LLM 表现
新研究在 GAIA、SWE-bench 等基准上运行 22500 条轨迹,发现多智能体系统常出现“内部计算已得到正确答案,却为服从群体意见而压制答案”的现象,作者称之为 Sovereignty Gap。研究还指出,在多智能体管道中,谁先发言往往比智能体数量更关键,盲目堆叠智能体可能放大 对齐幻觉,并不必然带来更强推理能力。
𝕏 Nature Medicine 研究:停用减肥针后改用 Orforglipron 可减少体重反弹
ATTAIN-MAINTAIN 研究显示,停用替尔泊肽或司美格鲁肽后,改用口服小分子 GLP-1 药物 Orforglipron 一年,可显著减少体重反弹。研究报告称,两组体重维持率分别达到 74.7% 和 79.3%,提示口服方案可能成为停用注射类减重药后的维持治疗选择。
𝕏 多流 LLM 论文提出并行读写与推理,突破单一消息流瓶颈
Multi-Stream LLMs 通过指令微调支持多个并行信息流,使模型能够同时读写、调用工具和进行推理。该设计试图突破传统 LLM 单一消息流的瓶颈,有望改善 延迟、用户体验和 安全隔离,尤其适合需要并发工具使用与多任务协作的智能体场景。
𝕏 Stanford NLP 开源 SWE-ZERO-12M-trajectories 大型代码 Agent 轨迹数据集
Stanford NLP 团队开源 SWE-ZERO-12M-trajectories,称其为目前最大的 Agent 轨迹数据集。数据集包含 112B tokens、12M 条轨迹、122K 个 PRs,并覆盖 16 种语言,可为代码 Agent 训练、评估和行为分析提供重要基准资源。
𝕏 英国 AI 安全研究所:新版 Mythos 在 32 步企业网络攻击任务中 10 次完成 6 次
AI Security Institute 称,新版 Mythos Preview 在一项约需人类专家 20 小时 的 32 步企业网络攻击任务中,10 次完成 6 次。该结果显示,前沿 AI 系统在复杂网络攻防链条中的能力正在提升,也为安全评估与风险治理提出更高要求。
CryoGEN-II 用于冷冻电子断层扫描重建,缓解缺失楔问题
北京大学陈昕宇 分享 CryoGEN-II,该方法面向冷冻电子断层扫描(Cryo-ET)中的 缺失楔 数据重建问题。介绍称,CryoGEN-II 性能优于 CryoGEN、IsoNet 等方法,有望提升复杂生物结构在低信噪比和不完整角度采样条件下的重建质量。
𝕏 Positive Alignment 论文主张让 AI 促进人类繁荣,而非只避免伤害
Positive Alignment 论文提出,AI 对齐不应只关注避免伤害,还应帮助人类处理价值取舍、增强韧性并促进 人类繁荣。作者同时提醒,应避免把对齐变成自上而下的 技术家长主义,而要让智能体更好地支持人的自主判断和复杂社会目标。
𝕏 Apple 论文分析 On-Policy Distillation 的适用性与局限
Apple 发表论文《Unmasking On-Policy Distillation》,系统分析 在线策略蒸馏 在哪些场景下有效、哪些场景可能有害。研究揭示该方法在不同 模型架构 下的性能边界与潜在风险,有助于更谨慎地使用蒸馏技术改进模型训练与部署。
🟩 vLLM 在 TPU v6e 上运行 Gemma4 26B 并启用 KV FP8
vLLM 服务在 TPU v6e 上运行 Gemma4 26B,并启用 KV FP8 和推测解码。测试显示,在 1024 并发、16k 上下文预填充条件下,预填充吞吐达到 475552 tok/s,展示了大模型服务在专用加速硬件上的高吞吐部署潜力。
𝕏 Gary Marcus 建议 METR 评估图表直接对比不同准确率标准曲线
Gary Marcus 针对 METR 的评估图表提出改进建议,主张在同一图中直接展示 50%、80%、90% 等不同准确率标准下的任务表现曲线,而不是通过多个 Tab 分开展示。他还强调,应明确标注任务类型属于软件工程领域,以提升评估结果的可读性、可比较性和解释准确性。
𝕏 EpochAI 称 GPT-5.5 标记的 FrontierMath 错误多数获数学家确认
EpochAI 研究员表示,GPT-5.5 在 FrontierMath 中标记的问题多数已被数学家确认确有错误,不过这些问题大多属于轻微错误。该进展说明前沿数学评测集仍需持续校验,也显示高能力模型可能在发现基准缺陷方面发挥辅助作用。
🚀 产品发布
𝕏 LangChain 发布多款代理开发产品,覆盖观测、沙盒与网关
LangChain发布一组面向代理开发的新产品与能力,包括LangSmith Engine、SmithDB、Sandboxes、Managed Deep Agents、LLM Gateway、Context Hub 和 Deep Agents 0.6,覆盖代理观测、状态存储、沙盒执行、网关管理与上下文管理等关键环节。
𝕏 Waymo 将扩展至迈阿密等城市,服务范围覆盖 11 城超 1400 平方英里
Waymo宣布扩展至迈阿密,并计划进一步进入奥斯汀、亚特兰大、休斯顿和旧金山湾区。扩张完成后,其自动驾驶服务范围将覆盖11 城、超1400 平方英里,显示其无人驾驶出行网络继续加速铺开。
𝕏 Runway Agent 发布,可通过对话生成带声音设计的视频
Runway Agent面向广告、短视频和社媒内容创作场景,支持用户通过对话完成创意生成、执行、声音设计和剪辑流程。该产品已在Web 端开放,进一步降低视频制作与多模态内容生成门槛。
比利时批准特斯拉 FSD 在公共道路进行受监督测试
比利时弗拉芒交通部长确认特斯拉 FSD获准在公共道路进行受监督测试。继德国、挪威之后,这一进展显示特斯拉自动驾驶能力正在欧洲更多地区推进合规验证与落地准备。
𝕏 Rive Editor 0.8.4840 发布,支持自带 Agent API 密钥与状态组件
Rive Editor发布0.8.4840版本,新增Bring your own Agent API功能,引入Stateful Components以简化组件开发,同时带来 UI 刷新及 Flash 转 Rive 转换工具,提升动画与交互内容制作效率。
𝕏 Figure 展示人形机器人自主完成 8 小时轮班
Figure展示多台人形机器人运行完整8 小时班次,并使用Helix-02全自主执行任务。此次展示强调机器人在连续作业、协同运行与端到端自主控制方面的进展,是其迈向真实工作场景部署的重要信号。
𝕏 Recursive 正式启动,25 人团队研发自动发现知识的递归 AI
Recursive在旧金山和伦敦正式启动,团队包括25 名研究员与工程师,研究方向覆盖AI 科学家、世界模型、优化和可解释性。该公司聚焦可递归发现知识与改进自身能力的 AI 系统。
𝕏 NVIDIA 与 SAP 合作推出企业级 AI Agent 平台
NVIDIA与SAP宣布合作,基于NVIDIA OpenShell在SAP Business AI Platform上部署企业级 AI Agent。该平台集成安全治理与执行控制,覆盖财务、采购及供应链等核心业务场景。
𝕏 Google I/O 2026 定档 5 月 19 至 20 日,将在 Shoreline 举行
Google官方宣布Google I/O 2026将于5 月 19 日至 20 日在Shoreline举行。届时预计将发布最新产品更新和技术突破,但具体议程与发布内容尚未公开,引发开发者社区对 Android、AI 与云服务方向的猜测。
𝕏 Google 与 Albertsons 推出 AI 生鲜质量控制工具
Albertsons采用Google Cloud、Gemini Enterprise和 Vision AI 检查门店生鲜品质。该方案将 AI 视觉识别与企业级工作流结合,用于提升生鲜质量控制效率,并帮助零售门店更及时地发现货架商品问题。
𝕏 Cursor 推出云端代理运行环境,支持完整开发配置
Cursor上线新功能,允许用户在完全配置的云端开发环境中运行AI 代理。该环境支持克隆仓库、安装依赖及管理工具链凭证,提供类似工程师本地笔记本的体验,方便代理执行更完整的软件开发任务。
𝕏 Zed Editor 发布 v1.2,远程项目 Git Graph 功能上线
Zed Editor发布v1.2版本,新增远程项目 Git Graph可视化功能,并优化 macOS 渲染性能。该更新面向分布式开发场景,提升开发者在远程项目中的代码审查和版本管理体验。
𝕏 Covington 市采购 7 辆 Tesla Model Y 警车,预计降低燃料与维护成本
Covington市警察局正式采购7 辆 Tesla Model Y巡逻车,用于替换旧款燃油车。根据资助研究,此举每年可为城市节省约2.3 万美元燃料和维护费,预计8 年累计节省近 12.3 万美元,是当地执法部门向电动车队转型的重要一步。
𝕏 Goodnotes 7.0.56 加入画布元素旋转、吸附对齐和表格升级
Goodnotes 7.0.56发布,新增画布元素旋转、精准缩放和吸附对齐能力,并升级 Text Docs 中的表格功能。此次更新主要改善笔记排版、视觉整理和文档结构化编辑体验。
𝕏 Mole for Mac 1.3 发布,新增三语本地化与 Doctor 诊断
Mole for Mac 1.3发布,新增中文、法语、德语本地化,并提供更安全的清理流程、智能卸载能力和Doctor 诊断功能,帮助用户更直观地排查应用与系统清理相关问题。
𝕏 Inth 发布开源 Cookie 横幅标准 c15t
Inth发布开源c15t标准,提供 SDK、国际化和可定制 Cookie 横幅能力。该项目旨在为网站合规提示、用户同意管理和跨地区适配提供更统一的实现基础。
𝕏 Instagram 推出 Instants 功能,融合 Snapchat 与 BeReal 元素
Instagram发布全新Instants功能,结合Snapchat和BeReal的产品特性,强化即时分享与真实生活记录体验。该功能也被视为 Instagram 应对短视频、即时社交和真实感内容竞争的新尝试。
𝕏 X 推出 History 标签页,整合书签、点赞、视频与文章历史
X上线新的History标签页,用户可集中查看Bookmarks、Likes、Videos 及 Articles 的历史记录。该功能旨在优化内容回溯体验,让用户更方便地找回过往互动内容、收藏信息和浏览痕迹。
𝕏 Jacq 推出面向编码智能体的多设备工作环境
Jacq推出面向编码智能体的工作环境,支持跨设备读取文件、在云端虚拟机运行脚本,并集成Slack、Linear、GitHub 和 Gmail。该产品旨在为 AI 编码代理提供更连续的上下文与工具链访问能力。
𝕏 Infinite Machine P1 电动车降至 7995 美元,可月供 275 美元
Infinite Machine P1因供应链优化和关税降低,将售价降至7995 美元,也可选择275 美元/月的付款方案。此次降价有助于降低该电动车的购买门槛,并提升其在城市轻型出行市场的竞争力。
🌍 国际大事
𝕏 特朗普抵达北京展开国事访问,携美国科技金融巨头随行
美国总统特朗普5 月 13 日晚乘坐空军一号抵达北京,中国国家副主席韩正到场接机;特朗普将与习近平举行峰会。随行代表团包括马斯克、黄仁勋及 Tesla、Apple、BlackRock 等 16 家美国科技、金融和半导体企业高管,相关公司总市值约 14-15 万亿美元,关税、伊朗战争和台湾议题预计成为会谈重点。
伊朗霍尔木兹海峡“智能管理”方案提交议会审议
伊朗议会国安与外交政策委员会主席阿齐兹称,关于霍尔木兹海峡的“智能管理”方案已达成结论并提交议会,目前等待最终批准。
阿联酋否认内塔尼亚胡密访,以方称曾促成关系突破
阿联酋外交部5 月 14 日否认以色列总理内塔尼亚胡访阿或接待以军事代表团;以总理办公室则称其在“咆哮的狮子”行动期间曾密访阿联酋。
𝕏 华尔街日报分析特朗普再访华:中美力量天平已变化
特朗普近 10 年后再访中国,华尔街日报分析称,中国在自给自足、军事能力和经济韧性上明显增强,面对中美核心争议时,北京更可能坚持自身立场。
𝕏 全球军费 2025 年达 2.9 万亿美元,连续 11 年增长
2025 年全球军费达到2.9 万亿美元,扣除通胀后较 2024 年增长2.9%,为全球军费连续第 11 年上升,显示主要国家安全支出仍在扩张。
以军空袭黎巴嫩南部多地,造成 10 死 27 伤
黎巴嫩卫生部称,5 月 13 日以军空袭黎巴嫩南部多地,造成10 人死亡、27 人受伤,当地安全局势持续紧张。
美国航煤出口创历史新高,填补海外供应缺口
EIA称,美国上周航空煤油出口升至每日45.5 万桶,创历史新高;受海外供应缺口影响,欧洲和亚洲航煤价格上涨。
𝕏 经济学人:伊朗战争拖延下布伦特油价仍约 107 美元
经济学人称,在伊朗战争拖延背景下,布伦特原油价格约为107 美元/桶,虽处高位但低于分析师早前的恐慌预期。
𝕏 美国 PPI 创 3 年高位,市场担忧美联储重启加息风险
美国PPI升至3 年内最高,CPI 也超出预期,10 年期美债收益率逼近**4.5%**警戒线,市场对美联储重启加息的担忧升温。
欧盟召开紧急会议协调汉坦病毒疫情应对
欧盟5 月 13 日在布鲁塞尔召开会议,协调汉坦病毒疫情应对,重点讨论申根区病例共享机制和统一防控标准。
📈 财经市场
𝕏 【重磅】美国参议院确认 Kevin Warsh 为新任美联储主席,4 月 PPI 同比暴涨 6%
美国参议院以54-45票确认 Kevin Warsh 接替 Jerome Powell 出任美联储主席。与此同时,美国4 月 PPI同比上涨6%,远超市场预期的4.9%,创下新高,显示通胀压力持续扩散。
⭐ Anduril 完成 50 亿美元融资,估值翻倍至 610 亿美元
Anduril Industries获 Thrive Capital 和 Andreessen Horowitz 领投50 亿美元融资,估值升至610 亿美元,将加码产能、研发和基础设施。
⭐ Cerebras IPO 据称拟定价 185 美元,完全稀释估值逼近 490 亿美元
Cerebras Systems美股 IPO 据称拟以每股185 美元定价,募资约55.5 亿美元,完全稀释后估值约490 亿美元。
⭐ 思科上调 AI 订单预期至 90 亿美元,盘后股价一度涨近 20%
思科第三财季营收158 亿美元,预计 2026 财年超大规模云客户 AI 订单达90 亿美元,并计划裁员近4000 人聚焦 AI。
𝕏 ⭐ NBIS 一季度 AI Cloud 收入同比增 841%,全年 CapEx 上调至 200 亿-250 亿美元
NBIS Q1 营收3.99 亿美元,AI Cloud 收入3.90 亿美元同比+841%;ARR 达19.2 亿美元,FY26 指引升至 80 亿美元。
𝕏 ⭐ 谷歌股价首次突破 400 美元大关
Google (GOOGL) 股价在交易中首次收盘高于400 美元,标志着这家科技巨头市值的又一重要里程碑,反映了市场对 AI 及搜索业务的强劲信心。
𝕏 ⭐ EOSE 一季度营收同比增 445%,长时储能订单与轧空行情同步升温
EOSE Q1 营收5696 万美元同比+445%,EPS 为 0.12 美元;pipeline 达243 亿美元,在手订单 644.6 百万美元。
𝕏 ⭐ 英伟达市值首次突破 5.5 万亿美元并创历史新高
英伟达股价创历史新高,市值首次越过5.5 万亿美元,规模超过除美国和中国外所有国家 GDP。
𝕏 HubSpot 联合创始人兼 CTO 买入 180 万美元自家公司股票
HubSpot联合创始人 Dharmesh Shah 买入10000 股、约180 万美元;公司上季度净增客户 10800 个,总客户约 30 万。
𝕏 美国 4 月 PPI 同比升 6%,创 2022 年 12 月以来最高
美国 4 月 PPI同比升6%、环比升 1.4%,均高于预期,能源成本和中东供应链扰动推高通胀压力。
𝕏 TrueShort 完成 1200 万美元融资,6 个月做到 240 万美元 ARR
TrueShort获1200 万美元融资,6 个月实现240 万美元年化收入和 200 万分钟观看。
𝕏 下一代空管系统创业公司获 700 万美元融资
Initialized领投700 万美元,支持 YC 公司建设下一代空中交通系统。
𝕏 华尔街日报称 Anthropic 年化营收有望在 6 月底达到 500 亿美元
华尔街日报称Anthropic年化营收可能在2026 年 6 月底达到500 亿美元,显示 Claude 商业化增长加速。
美联储 6 月维持利率不变概率升至 99%
CME 美联储观察显示,6 月维持利率不变概率为99%,降息 25 个基点概率为 1%。
𝕏 纳斯达克中国金龙指数涨 4%,金山云涨 18.8%
中国金龙指数涨4%,金山云涨 18.8%,京东涨 7.7%,百度涨 7%。
𝕏 美股投研复盘:内存、太空、CPU 和光互连板块轮动带来超额收益
作者复盘MU翻倍、RKLB财报后涨 50%、INTC涨 50%-60%,下一阶段关注光互连和大科技资金回流。
公募存量产品 6 月 1 日起批量调整业绩比较基准
公募基金将自6 月 1 日批量调整存量产品基准,主动权益基金权益指数权重将更贴合投资风格。
𝕏 美股开盘分化,阿里财报后跌 2.9%,美光涨 6.3%
美股开盘涨跌不一,道指跌 0.3%、纳指涨 0.23%;阿里巴巴财报后跌 2.9%,美光涨 6.3%。
👤 名人解析
𝕏 Anders Hejlsberg 访谈:从 Turbo Pascal 到 TypeScript 的语言设计史
Anders Hejlsberg回顾 Turbo Pascal、Delphi、C#和TypeScript,解释语言设计为何是10 年周期。
🏭 工业能源
𝕏 软银 Q1 因 OpenAI 持股获利 250 亿美元,总利润达 116 亿美元
软银集团发布财报显示,第一季度其持有的OpenAI股份带来250 亿美元账面收益,推动当季总利润达到116 亿美元,为去年同期三倍多。受 AI 投资回报带动,软银股价过去一年上涨 216%,凸显其与 OpenAI 深度绑定的财务杠杆效应。
𝕏 英伟达 Q1 GPU 供不应求,每上线一张卡有 4 家以上客户竞争
英伟达在财报电话会议中表示,目前每上线一张GPU就有4 家以上客户竞争。Q1 产能已售罄,未来几个季度至 12 个月内上线的大部分容量已签约或 earmarked 给 AI 云客户,显示全球 AI 基础设施需求仍极度旺盛。
𝕏 Hughesnet 宽带用户较 Starlink 上线时减少 57%,公司警告持续经营风险
Hughesnet用户从 2020 年 12 月的156 万降至68.1 万,累计减少 57%。公司 Q1 净亏损 760 万美元,且现金不足以覆盖债务,反映传统卫星宽带在 Starlink 竞争下承压。
𝕏 英伟达招聘轨道数据中心架构师,探索太空 AI 算力
英伟达发布轨道数据中心系统架构师职位,探索用航天器在轨采集太阳能,并将其转化为支撑地球 AI 计算的太空数据中心能力。该岗位显示公司正在评估太空算力与能源供给结合的长期基础设施路线。
𝕏 先进封装推动 OSAT 估值重估,Amkor 与 ASE 受益
OSAT行业正从传统组装测试转向先进封装,市场认为Amkor和ASE具备更高技术壁垒和利润率。随着 AI 芯片对封装能力要求上升,相关厂商可能获得估值重估。
𝕏 Figure 展示人形机器人自主完成 8 小时班次
Figure展示多台人形机器人运行完整8 小时班次,声称由Helix-02全自主驱动,并达到接近人类的作业表现。该演示旨在证明人形机器人可在连续工业任务中稳定运行。
𝕏 NASA 启动 Artemis III 规划,将测试 Orion 与商业登月器对接
NASA正在规划Artemis III任务,拟测试 Orion 飞船与Blue Origin或 SpaceX 商业登月器在地球轨道交会对接。该安排将验证登月任务关键接口,并降低后续月面着陆复杂度。
𝕏 Cloudflare 用 Containers 重构 Browser Run,提升容量与性能
Cloudflare将Browser Run重建在 Containers 之上,以提升使用上限、性能、可靠性和产品交付速度。此次改造突出其用容器化基础设施支撑浏览器自动化工作负载的能力。
𝕏 古河电工因康宁—英伟达交易带动再涨 15%
古河电工股价再涨15%,光纤供应商板块受到康宁与英伟达合作消息刺激。市场还关注其在 CCL 用铜箔等材料领域的布局,认为其可能受益于 AI 基础设施扩张。
𝕏 Surtr 发布开放式无人机防御操作系统 ParallaxOS
Surtr推出ParallaxOS,用于整合多传感器威胁图像、AI 火控和开放标准接口。该系统面向无人机防御场景,试图以开放式架构连接传感器、识别与拦截模块。
𝕏 Covenant Logistics 启动为期 3 周的 Tesla Semi 测试
Covenant Logistics开始为期3 周的 Tesla Semi 演示,使用500 英里版本在加州完成首单运输,并计划每日执行约 200 英里的往返任务。该测试将验证电动重卡在真实货运线路中的续航与运营表现。
𝕏 42MW 小型模块化涡轮机被用于数据中心自发电方案
Superpower提出42MW小型模块化涡轮机方案,主张让数据中心自建电力,减少对公共电网和居民电价的冲击。该方案反映 AI 数据中心对独立、可扩展电力供应的需求正在上升。
🧠 深度思考
𝕏 Culper Research 做空英伟达:出口管制下中国 AI 服务器供应链或经东南亚中转
Culper Research发布做空报告,指控英伟达中国业务并未真正归零,而是可能通过Megaspeed、Speedmatrix 等东南亚实体作为中转站,再由浪潮改名后的Aivres组装服务器,实质满足中国市场需求。报告的核心价值在于把出口管制、代理实体、服务器组装和终端需求串成一条可验证的供应链路径。
𝕏 AI 创业公司不能只依赖前沿模型,应掌握工作流、上下文和分发
围绕Anthropic CFO 访谈引出的创业判断是,基于前沿模型的应用会受到算力、限速、定价和平台策略影响,难以只靠调用模型形成长期壁垒。更耐久的AI 创业公司应拥有真实工作流、专有上下文、数据权利、分发渠道与客户信任,把模型能力转化为难以迁移的业务系统。
𝕏 企业应构建“拥有型智能”,而不是把竞争力外包给通用模型
Yash Patil指出,SOTA 不再只来自模型发布,企业真正的复利来自把私有数据、内部流程和隐性知识转化为Owned AI。依赖通用模型的公司会面临供应商反向竞争、能力同质化和议价权下降,而拥有自身智能体的企业更可能形成持续学习、持续积累的组织智能。
企业 AI 治理落后于员工实际使用,Shadow AI 已成为现实风险
MarkTechPost指出,企业 AI 治理明显落后于员工工具使用,Shadow AI已普遍存在:约 40%至 65%员工使用未批准 AI 工具,47%生成式 AI 用户甚至用个人账户绕过管控。这意味着企业风险不只在模型选择,还在数据外泄、合规责任、审计缺口和员工实际工作流之间的断层。
𝕏 Paul Graham 谈创业者为何应去硅谷待一阵,再把资本与文化带回本地
Paul Graham在 YC 斯德哥尔摩活动中解释硅谷的价值:高密度的强同伴池、偶遇机会、投资人快速决策、pay-it-forward 文化,以及 YC 对这种环境的浓缩体验。他的建议并非所有公司都永久迁往硅谷,而是有抱负的创业者应去那里接触资本、公司和创业文化,再把这些资源与方法带回本地生态。
𝕏 软件行业或转向 Palantir 式端到端 AI 交付模式
观点认为,软件行业可能从传统 SaaS 销售与实施,转向更接近Palantir的端到端交付:由AIP 平台承载业务流程,以企业 Wiki 式 Ontology 统一语义,再由AI 转型顾问把组织问题映射成可运行系统。在这一框架下,智能体不是单点功能,而是未来三年软件交付和企业改造的主线。
𝕏 AI 未必导致工程师行业性失业,GitHub 提交活动是更可靠观察指标
Perry Metzger认为,企业在裁员时用 AI 解释成本收缩存在激励偏差,不能直接推出工程师行业性失业。更可靠的观察指标应是GitHub提交活动、行业总体招聘、项目数量和软件需求变化,而不是个别公司在财报或公关叙事中的裁员口径。
𝕏 AI 时代的公司竞争:应把 AI 视为架构决策,而不是临时项目
作者认为,AI正在改变公司的工作规则,未来 5 年胜出的企业不会把 AI 当作局部试点或效率项目,而会把它作为架构决策嵌入组织、流程和产品。等待技术格局完全稳定再行动,可能意味着错过组织学习曲线、数据积累和工作方式重构的窗口期。
𝕏 AI 时代生物科技的瓶颈可能在临床、监管和研发制度,而非工具能力
Ruxandra Teslo认为,AI 和新实验工具正在显著扩大生物科学能力,但生物科技的主要瓶颈可能不再是发现能力,而是西方临床试验、监管流程和研发效率。若制度环节无法同步提速,AI 带来的发现增量可能难以及时转化为药物、疗法和真实患者收益。
𝕏 前沿 AI 稀缺将重塑 AI 政治经济学,而非默认模型能力无限充裕
Dean Ball指出,许多政策讨论默认前沿 AI 能力会快速、廉价且广泛可得,但未来几年frontier AI可能仍是稀缺资源。这种稀缺会影响算力分配、模型访问、国家能力、企业权力和治理结构,因此 AI 政治经济学不应只讨论能力扩散,也要讨论谁能获得最强系统。
𝕏 职高火爆背后:技术蓝领可能比普通本科更稀缺
作者以工业机器人职高、德企定向合作和实习期 6000 元案例,讨论学历体面与技术蓝领稀缺之间的现实取舍。其信息增量在于指出,制造业升级带来的岗位需求并不总与传统本科路径匹配,一些具备设备调试、机器人操作和现场维护能力的蓝领技术工,可能比普通本科毕业生更稀缺。
📰 综合新闻
𝕏 马斯克旗下 xAI 密西西比数据中心运行近 50 台燃气轮机
TechCrunch报道,Elon Musk旗下的xAI在其密西西比州数据中心运行近50 台燃气轮机,以满足大规模 AI 训练带来的巨大电力需求。报道还称,这些设备处于无监管状态,引发外界对能源使用和监管缺口的关注。
𝕏 特朗普、马斯克与黄仁勋在北京会见中国国家副主席韩正
特朗普、马斯克和黄仁勋在北京会见中国国家副主席韩正,多名美国商业领袖随行。该会见显示中美政商高层在科技、产业和商业合作议题上仍保持接触。
𝕏 Reunite 用语义匹配寻亲线索,获公益奖后拟捐给公益组织
Reunite通过语义匹配处理寻亲过程中记忆差异、描述不一致等问题,用技术帮助匹配失散亲属线索。该项目获得Memory Genesis Competition 2026公益奖,并计划将成果捐给公益组织使用。
𝕏 日本动漫进入好莱坞流媒体主战场,美国 22%人群去年观看动漫
华尔街日报称,日本动漫正成为好莱坞和流媒体平台争夺的热门内容品类。数据显示,22%美国人去年观看了《咒术回战》等动漫作品,反映出日本动漫在美国大众娱乐市场中的渗透率持续提升。
▶️ 美国政府为限制内容审核专家入境政策辩护
特朗普政府在法院为一项签证限制政策辩护,该政策针对要求美国科技平台采用全球内容审核规则的外国官员。案件涉及平台治理、跨境监管与美国政府对外部内容审核压力的反制。
𝕏 沈伯洋因黑熊学院和民防训练遭北京通缉并悬赏追捕
BBC 中文介绍 43 岁台湾立委沈伯洋,其创办黑熊学院推动民防训练,主张提升台湾社会面对危机时的韧性。报道指出,沈伯洋因被北京方面指控“分裂国家”,已遭到通缉并被悬赏追捕。
𝕏 加州斥资 1.89 亿美元为 9 万囚犯采购平板引发争议
加州花费近1.89 亿美元,为约9 万名囚犯采购数字平板,折合每台成本超过 2000 美元。该采购项目因费用规模和单台成本过高受到质疑,引发关于监狱数字化支出合理性的争议。
纽约股市三大指数 5 月 13 日涨跌不一,纳指涨 1.20%
纽约股市三大指数 5 月 13 日涨跌不一,其中纳斯达克指数上涨**1.20%**至 26402.34 点,标普 500 指数上涨 0.58%,道琼斯工业平均指数下跌 0.14%。
💡 生活建议
全球变暖风险关键在升温速率,而非历史上是否更暖
气象喵探员解释全球变暖:PETM 在数千至上万年升温5~8℃,速率仍不到当前的1/10。
𝕏 72 小时应急准备:评估食物、水和电力中断风险
72 小时无外部食物、水或电力的应急准备,适合家庭检查水、电、食品储备。
由 X-Crawler AI 生成于 2026-05-14 09:04
EVENT-DRIVEN INTELLIGENCE
免费先看重点,Pro 再看速度、深度和可追踪性
这篇内容是公开入口。继续使用天眼时,固定沿着三条路径走:订阅每日情报、查看同主题历史上下文、升级 Pro 解锁事件追踪与研究能力。