天眼晚报
阿里首次披露模型与应用服务MaaS收入:截至3月年化超80亿元,预计6月达100亿元、年底突破300亿元。若兑现,半年增速约3.75倍,说明大模型正从算力投入转向可量化收入,也会强化云厂商围绕企业AI应用的竞争。
英伟达GB200 NVL72整机柜售价被曝达280万至340万美元,推理优化版GB300可达600万至650万美元,华尔街上调数据中心GPU均价假设至3.3万美元。系统级捆绑正提升英伟达定价权,也意味着AI算力资本开支仍可能高企。
Ramp AI Index显示,Anthropic企业采用率升至34.4%,首次超过OpenAI的32.3%;过去一年Anthropic增长四倍,OpenAI仅增长0.3%。企业AI采购不再由先发者单边主导,Claude在代码、长上下文和安全定位上的优势正在转化为付费份额。
马斯克称1.5T规模的Grok V9已完成训练,接下来将加入Cursor数据补训,并经过SFT与RL流程,预计3至4周发布。若进展属实,xAI正试图用更大模型和编程数据追赶OpenAI、Anthropic,Grok与X订阅体系的联动也会加速模型分发。
ArXiv新规明确:若作者让AI完成论文全部工作,将被封禁投稿资格一年;AI可用于润色、编辑或辅助表达,但不能替代研究与论文主体。该政策给学术出版划出AI使用红线,可能影响高校、实验室和AI科研工具的合规披露方式。
🤖 AI 大模型
𝕏 ArXiv 新规:AI 全权代写论文将封禁投稿一年
ArXiv宣布新规,若作者让AI完成论文全部工作,将被封禁投稿资格一年。这一规则明确区分辅助写作与“AI 代写”:AI 可用于润色、编辑或辅助表达,但不能替代作者完成研究与论文主体工作。
𝕏 xAI 完成 1.5T Grok V9 训练,预计 3 至 4 周发布
Elon Musk称1.5T Grok V9已完成训练,接下来将加入Cursor 数据进行补充训练,再经过 SFT 与 RL 流程,预计约3 至 4 周发布。这表明 xAI 正在加速迭代下一代 Grok 模型。
𝕏 阿里首次披露 AI 服务年化收入:超 80 亿,年底目标 300 亿
阿里巴巴首次披露模型与应用服务(MaaS)数据:截至今年 3 月年化收入超80 亿人民币,预计 6 月达100 亿,年底突破300 亿。该业务半年目标增速约 3.75 倍,显示模型与应用服务正在成为阿里 AI 商业化的重要增长线。
𝕏 NVIDIA 财报前瞻:GB200 机柜售价最高达 340 万美元
英伟达通过系统级捆绑强化定价能力,GB200 NVL72整机柜售价高达280 万至 340 万美元,推理优化版 GB300 甚至达600 万至 650 万美元。华尔街已将数据中心混合 GPU 平均售价假设上调至 3.3 万美元。
𝕏 Anthropic 企业采用率首次超过 OpenAI
Ramp AI Index数据显示,Anthropic在企业中的采用率达到34.4%,首次超过OpenAI的 32.3%。过去一年 Anthropic 采用率增长四倍,而 OpenAI 仅增长 0.3%,显示企业 AI 采购格局正在发生变化。
𝕏 KPMG:大型企业 AI 投资预期到 2026 年升至 2.07 亿美元
KPMG美国 AI Pulse 序列显示,大型企业 AI 支出预期从 2025 年 Q1 的1.14 亿美元升至 2026 年 Q1 的2.07 亿美元。作为Hyperscaler主要消费方,大型企业投入增长将继续支撑云厂商资本开支扩张。
𝕏 OpenAI 联合创始人 Greg Brockman 全面接管产品战略
OpenAI联合创始人Greg Brockman将全面接管公司产品战略,标志着公司从模型驱动进一步转向“产品驱动”。在GPT 5.6临近发布之际,这一组织调整旨在强化应用层竞争力。
开发者 30 天消耗 6030 亿 Token,OpenAI 承担约 130 万美元 API 费用
Peter Steinberger展示其应用在 30 天内消耗6030 亿 Token、产生760 万次请求,账单约130 万美元。在关闭快速模式后,成本下降约 70%,凸显大模型应用在高频调用场景下的成本压力。
大语言模型安全评估:区分离线基准与运行时护栏
文章系统讲解SALAD-Bench、TruthfulQA、Llama Guard与Moderation API等工具的分层安全评估方法,强调应区分离线基准测试、模型行为评估与运行时护栏,避免用单一指标判断 LLM 安全性。
𝕏 Anthropic CEO:AI 可能带来高增长与高失业并存
Dario Amodei称 AI 可能同时带来5%-10% GDP 增长与10%失业率,即经济效率提升与劳动力冲击并存。他还提到 Anthropic 工程负责人已让Opus写代码,显示 AI 在软件开发中的实际渗透。
𝕏 Cerebras 称正为 OpenAI 运行万亿参数内部模型
Cerebras CFO称其平台正在服务万亿参数模型,并为OpenAI运行内部5.4/5.5模型。这一说法暗示 OpenAI 除主流 GPU 集群外,也可能在部分内部模型训练或推理中使用 Cerebras 基础设施。
𝕏 陶哲轩解析 LLM 核心谜题:数学机制简单,能力预测困难
陶哲轩称 LLM 训练主要依赖线性代数与矩阵乘法,底层数学机制并不神秘;真正难题在于预测模型在不同任务上的能力跃迁,以及为何规模扩大后会出现难以提前判断的新能力。
𝕏 X Premium+ 可在 Hermes Agent 绑定使用 Grok 4.3
X Premium+会员可登录Hermes Agent绑定使用Grok 4.3,从而扩大模型订阅权益与第三方 Agent 场景覆盖。这一更新体现了 xAI 与 X 会员体系之间的模型能力联动。
🛠️ AI 工具推荐
🐙 CLI-Anything 让普通软件变成 Agent 可调用 CLI
CLI-Anything旨在桥接 AI Agent 与桌面软件,通过生成式 CLI、实时预览和轨迹循环,让 Agent 能操作 CAD、3D 场景、字幕、游戏等复杂应用。项目提供CLI-Hub用于一键安装和管理社区贡献的接口,使原本没有命令行能力的软件具备Agent 原生能力。
Vercel Labs 推出面向 AI Agent 的系统编程语言 Zero
Vercel Labs发布实验性系统编程语言Zero,目标是让 AI Agent 更容易阅读、修复并交付原生程序。其编译器默认输出JSON 诊断,可提供机器可解析的错误信息与修复提示,帮助 Agent 在编码、调试和自动修复流程中减少歧义。
🐙 CodeGraph 为 Claude Code 提供本地代码知识图谱
CodeGraph为Claude Code预索引本地代码知识图谱,让 Agent 在探索代码库前先获得结构化语义上下文。项目宣称可减少约94%工具调用、探索速度提升约77%,并支持本地运行以降低 Token 消耗和上下文检索成本。
🐙 Dograh AI 开源可自托管语音 Agent 平台
Dograh AI推出开源语音 Agent 平台,可替代 Vapi、Retell 等托管方案。它支持拖拽式工作流构建,提供灵活的LLM/TTS/STT集成,并宣称可在60 秒内完成自托管部署,降低供应商锁定风险。
𝕏 Omi v2.0 开源 Agent 可操作屏幕、浏览器和 macOS 应用
Omi v2.0开源 Agent 支持捕获屏幕任务、构建应用和执行研究流程,并可调用浏览器或任意macOS应用。该工具面向更通用的桌面自动化场景,让 Agent 不只停留在文本或代码环境中。
🐙 Adobe 发布面向 AI 编程 Agent 的官方 Skills 仓库
Adobe发布官方 AI 编程技能库Adobe Skills,覆盖 AEM 设计、品牌提取、线框图生成和原型生成等任务。该仓库支持Claude Code、Vercel Skills 和 GitHub CLI 等 Agent 环境,帮助开发者更快构建企业级应用。
🐙 openSquad 可在 IDE 内编排多 Agent 团队
openSquad允许在 IDE 中用自然语言创建多 Agent 流水线,可自动生成研究员、策略师、写作、设计和审核等角色协同工作。它支持人工审批检查点,适合内容创作、自动化流程和多步骤任务编排。
𝕏 witr:一行命令排查进程启动链路
开源工具witr可一键展示进程的完整启动链路、环境变量以及父子关系。它支持终端交互界面,可直接终止或暂停进程,适合服务器运维、异常进程定位和复杂服务链路排查。
𝕏 muxy 被推荐为远程 AI 编程的移动端方案
muxy支持同时使用Codex、Claude Code和 AMP 等 AI 编程工具,并可在设备切换时实现约0.5 秒内重新连接。该方案适合在移动端或多设备环境中远程操作 AI 编程会话。
𝕏 Codiff 0.1 发布:面向 AI 代码输出的本地审查工具
Codiff 0.1发布本地代码审查工具,面向 AI 生成代码的检查与解释场景。它支持本地审查、可选LLM讲解和行内评论,目前已推出macOS版本,适合开发者在提交前快速理解代码差异。
𝕏 开源实时地图可追踪飞机、舰船、卫星与 GPS 干扰
实时地图项目已开源,可追踪商用航班、军机、航母、25000 艘船只、卫星、GPS 干扰和监控摄像头等多类目标。它将多源地理空间与公开信号数据整合在一张地图中,适合态势感知和开放情报观察。
𝕏 Plausible Analytics:隐私优先的开源网站统计工具
Plausible Analytics是一款隐私优先的开源网站统计工具,不使用Cookie,可替代 Google Analytics。它支持实时流量、目标转化、收入归因和Slack 周报,适合希望减少追踪侵入性的站点运营者。
𝕏 Spark 推出 CLI,让 Agent 读取邮件和日历
Spark Cli支持Claude Code、Codex 等 Agent 直接读取用户邮件与日历。该工具把个人信息管理能力接入 Agent 工作流,可用于邮件检索、日程理解、任务整理和自动化办公场景。
𝕏 K-Dense 为科研 Agent 提供 135 个专业技能包
K-Dense包含135个科研 Skill,覆盖17个专业领域,并可调用**100+**科学数据库。该工具面向科研 Agent 的专业化能力扩展,可用于文献检索、数据查询和跨领域研究任务。
𝕏 Hermes Agent 接入 X Premium 并支持搜索 X 帖子
Hermes Agent现已支持使用X Premium订阅进行搜索,并可直接调用X 帖子数据。用户可在 Agent 工作流中实时检索社交媒体内容,用于舆情观察、信息收集和自动化研究。
𝕏 腾讯推出校园招聘辅导 Skill
腾讯校招 Skill可拉取真实岗位 JD,并围绕求职流程提供岗位匹配、简历诊断和模拟面试等辅导能力。该 Skill 面向校园招聘场景,帮助候选人基于真实职位要求准备申请材料和面试。
𝕏 微信读书发布官方 Skill,可查书架、笔记和阅读统计
微信读书发布官方Skill,支持查阅书架、阅读统计、笔记划线和书籍搜索。用户可在 Agent 工作流中调用个人阅读数据,用于整理读书笔记、回顾阅读进度或检索已收藏内容。
用 Cloudflare Email Routing 批量生成邮箱别名
教程介绍如何使用Cloudflare Email Routing与Catch-all能力,将任意域名前缀邮件统一转发到Gmail。该方案适合批量生成注册邮箱别名、区分不同服务来源,并减少主邮箱暴露。
𝕏 three.js 作者推出在线视频美化导出工具
mrdoob推出一款在线视频美化导出工具,支持视频圆角、边框、阴影和背景色调整,并可一键导出MP4。该工具适合快速制作更适合社交媒体发布的演示视频或产品录屏。
𝕏 Con 开源终端:为 AI Agent 理解 Terminal、SSH 与 TUI 设计
Con是一个开源非营利终端,面向 AI Agent 理解 Terminal、SSH 与 TUI 场景设计。它采用Rust和 GPU 加速实现,无 WebView,支持 Windows、Linux,并提供Agent 面板用于人机协作。
𝕏 AI Memory Reader 支持多款 Agent 记忆文件管理
AI Memory Reader可浏览、阅读和编辑Claude Code、Codex、Cursor、Gemini 等工具的记忆文件。它面向多 Agent 使用者,帮助集中查看和维护不同 AI 编程环境中的长期记忆内容。
📖 教程攻略
𝕏 7 个开源 PPT Skill 实测:用审美约束提升 AI 生成质量
作者实测 7 个 PPT Skill,覆盖 frontend-slides、huashu-design、guizang-ppt-skill 等项目,并按 Pitch、团队协作、多轮修改等场景给出推荐。核心价值在于强调用审美约束和场景选择提升 AI 生成幻灯片的稳定性。
𝕏 Anthropic Agent 构建指南:先区分 Workflow 与 Agent
基于 Anthropic 视频总结的 Agent 构建方法强调:固定步骤应使用 Workflow,只有路径不确定、需要动态决策时才适合使用 Agent。指南还提醒要把工具说明当作 Prompt 编写,并设置评估与停止条件。
从 Cursor、Claude Code 迁移到 Codex 的 30 分钟上手指南
文章详解 Codex 如何导入 Claude Code 的 skills、插件、agent.md 和 30 天聊天记录,并提供全局指令模板。适合已经依赖 Cursor 或 Claude Code、希望快速迁移到 Codex 工作流的开发者。
🟩 用 Codex 和 Claude Code 做 Terraform 安全审查
教程演示用 Codex 连接 GitHub 仓库,再用 Claude Code 在本地运行命令,对 Terraform 生产部署前进行结构化安全审查。内容聚焦 IaC 场景,适合把 AI 辅助审查纳入发布前流程的团队。
𝕏 15 门免费系统设计课程清单
这份 系统设计 学习清单覆盖 API 设计、限流、负载均衡、缓存、消息队列、分片、CAP、微服务等 15 个主题。内容适合准备系统设计面试或希望系统补齐后端架构知识的工程师。
𝕏 Google AI 搜索指南:SEO 仍是核心,强调一手经验
Google AI 搜索指南建议站点继续做好基础 SEO:确保页面可抓取、补充 结构化数据、加入一手经验,并避免批量生成 fan-out 相似页面。该指南的重点是说明 AI 搜索时代仍需要高质量内容和清晰网页结构。
𝕏 远程控制 ChatGPT Codex 与 CLIProxyAPI 的配置方法
教程给出 auth.json 与 config.toml 的配置方法,支持手机端 Codex remote control 访问电脑端 CLIProxyAPI。适合希望在移动设备上远程驱动本机 Codex 环境、继续处理代码任务的用户。
手写 LLM 推理框架的内存管理实践
TFFInfer 教程解析 3 万行 LLM 推理框架 的内存管理设计,重点讲解 Memory、Allocator、CPU/GPU 分配器和 Tensor 内存协作。适合希望深入理解推理框架底层资源管理的工程师。
𝕏 Claude Code Skills、Hooks 与 Agents 实用指南
Claude Code 实用指南系统覆盖 Skills、Hooks 和 Agents 的配置方式,重点说明如何把重复开发任务沉淀为可复用能力。适合希望用 Claude Code 构建稳定自动化流程、减少重复提示词和手工操作的开发者。
𝕏 Hermes 多机器人接入飞书与微信的配置流程
教程介绍 Hermes 通过 profile create 创建多个机器人实例,并分别配置模型、飞书、微信网关 和重启命令。内容偏向实际部署流程,适合需要在不同 IM 平台接入多机器人服务的用户。
𝕏 Modern Transformer 完整课程更新至 13 集
Modern Transformer 课程已完成 13 个视频,系统讲解近期 Transformer 技术进展。该课程适合希望持续跟进现代 Transformer 架构、训练技巧和相关研究演化的学习者。
𝕏 微信读书 CLI 安装与配置教程
教程介绍 微信读书 CLI 工具的安装与配置,提供官方指令配合 Codex/Claude Code 使用,以及优化版 Skill jerlinn/jerlin-weread 两种方案。内容还包含 API Key 获取方式和实际调用案例,适合希望把阅读数据接入 AI 工作流的用户。
Transformer 位置编码为何使用正弦函数
文章围绕 Attention Is All You Need 第 3.5 节,讲解 位置编码 的必要性与正弦公式直觉。内容适合正在学习 Transformer 基础结构、想理解模型如何表达序列顺序信息的读者。
𝕏 Cloudflare Workers 自建登录系统教程
教程给出基于 Cloudflare Workers 的自建登录方案,支持账号密码、魔术链接、邮箱验证和找回密码等能力。适合需要在 Workers 项目中快速补齐身份认证,而又不想引入复杂后端服务的开发者。
🟩 Uber 如何用 H3 六边形索引匹配附近司机
文章解释 Uber H3 如何把地理空间切成六边形网格,用于缓存、分片和减少实时距离计算。内容有助于理解网约车、配送和本地服务中常见的地理索引设计,以及如何提升附近匹配的实时性能。
🟩 Go 无需 cgo 调用 CUDA 的实现思路
教程展示用 Go 运行时加载 CUDA Driver API,从而减少 Python GPU worker 和部署复杂度。该方案适合希望在 Go 服务中直接调度 GPU 能力,同时避免 cgo 带来构建与分发负担的工程场景。
🟩 用 losetup 挂载原始虚拟机磁盘镜像
教程给出 losetup --find --show -P 挂载 raw VM 镜像 的完整流程,包括检查分区、访问文件系统和卸载步骤。内容适合需要排查虚拟机镜像、提取文件或进行离线维护的运维与开发人员。
🟩 React Native 金融应用 OWASP Mobile Top 10 检查清单
这份 OWASP Mobile Top 10 实践清单面向 React Native 金融应用,覆盖移动安全落地检查和常见风险控制。内容适合金融、支付、钱包等高敏感场景,用于上线前安全审查和团队安全规范补齐。
𝕏 用 PyTorch 从零构建 GPT 式大语言模型
教程资源演示如何用 PyTorch 从零构建 GPT 式 LLM,覆盖模型结构、训练流程和关键实现思路。适合希望通过动手实现理解大语言模型内部机制,而不是只停留在 API 调用层面的学习者。
🟩 遗留代码阅读指南:用考古法拆解旧代码库
Dev.to 教程介绍阅读 遗留代码库 的考古式方法,帮助开发者从变更历史、目录结构和关键路径逐步理解大型旧项目。该方法适合接手缺少文档、上下文复杂且风险较高的维护型代码库。
💎 技巧经验
𝕏 xAI 公开 X 推荐算法后,创作者总结 13 条分发机制
长文解析X 算法公开后的创作者分发机制,重点包括账户 embedding、前 30 分钟互动、4 类 shadowban、dwell 停留权重等因素如何影响内容扩散,并总结了 10 条可操作的内容发布建议,适合想提升 X 平台触达率的创作者参考。
𝕏 AI 时代学习做减法:用 3 个问题过滤工具焦虑
鱼皮建议在 AI 工具爆炸的环境下做减法,用工作相关、下一份工作相关、所在领域相关这3 个问题筛选值得投入的工具,并通过工作流审计找到真实使用场景,避免被工具焦虑牵着走。
𝕏 创业者的思维冲突:商务脑 vs 工程师脑
fankaishuoai指出,创业早期常面临“商务脑”与“工程师脑”的冲突:前者偏开放系统,强调机会、关系和不确定性;后者偏闭合系统,强调确定性、逻辑和实现。两种模式在同一人身上容易互相污染,导致商务和执行两边都做不好,因此需要主动区分思维模式。
🟩 LLM API 成本优化:73%请求或不需要 GPT-4o
文章以GPT-4o与GPT-4o-mini之间的16 倍价差为例,说明很多 LLM API 请求并不需要默认使用高价模型。作者提出通过模型路由、失败重试策略和 PII 清洗等方式进行成本治理,在保证质量的同时减少不必要支出。
𝕏 Claude Code 2.1.36 缓存命中率可能因随机 cch 下降
Claude Code 2.1.36在系统提示词中加入随机5 位 cch,可能让第三方 API 的缓存 key 发生变化,从而降低缓存命中率并推高 token 消耗。使用代理、转发或第三方兼容接口的用户,需要关注该变化对成本和延迟的影响。
𝕏 量化交易开源工具栈整理:109 个 GitHub 项目
GoSailGlobal整理了 GitHub 上109 个开源量化交易项目,覆盖 CCXT、Freqtrade、Hummingbot 等核心库和工具。该整理强调,算法交易的真正门槛并不只是重复造轮子,而是理解并组合现有开源工具栈,形成可运行的研究、回测和交易流程。
𝕏 微信读书 Skill 上手实践合集:安装、改造和仪表盘
实践合集整理了微信读书 Skill的安装配置、噪音删除改造、开源版本以及阅读仪表盘案例,覆盖从部署到个性化改造的多个环节。适合想把微信读书数据接入自动化流程、阅读统计或个人知识管理系统的用户参考。
⚡ 工作流
𝕏 Solo Founder 用 13 个 Agent 承接早期团队工作的路线图
这份手册拆解 13 个 Agent 如何覆盖早期团队常见工作,包括 Research、Content、Operations 等职能,并配套 Claude Code 工具链形成可执行流程。作者还给出成本测算,整套方案月成本约 1300 美元,适合单人创业者评估用智能体替代部分早期团队岗位的可行性。
𝕏 GBrain 把 Agent 记忆变成可写、可审计的生产数据
GBrain 将 Agent 记忆从不可控上下文变成可写、可审计的生产数据:以 Markdown 作为源数据,结合 Postgres/pgvector 做检索与结构化管理,并通过 30+ MCP 工具 接入工作流。案例中系统管理 7471 个文件、2.3GB 知识库,强调长期记忆、版本化和可追踪性。
𝕏 LandingAI 与 Snowflake 展示复杂文档 RAG 端到端流程
LandingAI ADE 负责解析扫描表格、嵌套表和多页图表,并将结构化结果写入 Snowflake;随后由 Cortex 负责语义搜索、NL2SQL 和 Agent 编排,形成复杂文档 RAG 的端到端流程。演示还包含 Olas Medical 生产案例,说明该方案可用于真实业务中的文档理解与检索。
𝕏 Codex 可把个人重复工作流自动蒸馏成 Skill
Codex 可回看用户的 记忆与项目记录,结合历史操作识别每日重复出现的工作流,并将其整理沉淀为 Skill 库。这类能力把个人经验从一次性操作转化为可复用自动化模块,适合用于长期项目维护、重复任务编排和个人工作流资产化。
𝕏 Hermes 硅基飞书群协同工作流搭建指南
文章分享如何搭建 Hermes 硅基 飞书群 协同工作流,让多个机器人在同一群组内分工协作。每个机器人可独立配置模型,例如 GPT 5.5 或 GLM 5.1,并通过网关进行远程协作,从而提升复杂任务拆解、并行处理和团队式 Agent 调度效率。
𝕏 金融文档 Agent 上下文层:OCR、评估和人工审核缺一不可
LlamaIndex 在金融 Agent 文档处理工作坊中强调,构建可靠的 金融文档 Agent 上下文层不能只依赖向量检索。高质量 OCR、评估检查和 HITL 人工审核都是关键环节,尤其适用于金融文档中表格、扫描件、合规文本和高风险决策场景。
𝕏 用 CLI 脚本替代管理后台,让 AI Agent 执行站点运维
方案提出让 AI Agent 通过 本地 CLI 执行会员网站后台管理任务,用脚本接口替代部分网页端管理系统。这样可降低后台开发成本,同时把用户管理、内容维护、数据查询等 站点运维 动作暴露给 Agent 执行,更适合小团队快速搭建内部自动化。
𝕏 LightOS WebShell 为 Codex 和 Claude Code 加入状态监控
LightOS WebShell 用红、蓝、黄、绿等 状态标签 显示 Codex 与 Claude Code 的运行状态,帮助用户同时管理几十个 Agent。该设计重点解决多智能体并行时的可见性问题,让操作者能快速判断任务进度、异常状态和资源占用。
📚 论文研究
𝕏 DeepMind 系统化定义 AI Agent 网页攻击面,隐藏提示注入劫持率最高达 86%
Google DeepMind提出AI Agent Traps分类,系统化梳理 AI Agent 在网页环境中的攻击面。研究显示,隐藏提示注入最高可劫持**86%**场景,记忆污染成功率超过80%。该论文强调,Agent 在浏览网页、读取工具输出和写入记忆时都可能被恶意内容操控。
𝕏 SketchVLM 让多模态模型直接在图像上绘制推理过程
Auburn University与Adobe开源SketchVLM,通过坐标网格和提示词,让 GPT-5、Claude、Gemini 等多模态模型直接在图像上绘制推理过程。实验显示,该方法使视觉任务表现提升28.5 个百分点,为可视化推理、图像定位和复杂视觉问答提供了新思路。
𝕏 阿里 VulnSage 论文:多 Agent 可自动生成真实漏洞利用
阿里团队提出VulnSage,使用多 Agent 协作并在沙盒中验证漏洞利用效果。在SecBench.js基准上,该方法成功率提升34.64%,并发现146个零日漏洞。研究显示,多 Agent 系统在漏洞理解、利用链构造和验证闭环方面具备较强自动化潜力。
𝕏 Rodin Gen 2.5 引入“思考”大脑,提升生产级 3D 资产生成质量
Rodin Gen 2.5新增自适应思考功能,将草稿生成时间从4 秒延长至80 秒,以换取更高质量的 3D 资产。该模型支持1000 万+多边形细节、原生 3D 纹理,并可并行批量生成10 种变体,面向游戏、影视和工业设计等生产级资产流程。
𝕏 LLM Agent 持续改写记忆会降低任务表现,长期状态仍难信任
Illinois与清华等团队研究发现,LLM Agent 在持续改写和复用记忆时可能出现性能退化;在小型 ARC-AGI 集合中,GPT-5.4表现从100%降至约54%。相关研究也指出,长期状态、检索与记忆复用仍存在可靠性问题,说明 Agent 记忆机制距离稳定生产化仍有明显差距。
𝕏 斯坦福论文:同等推理预算下,单 Agent 常优于多 Agent
Stanford论文在Qwen、DeepSeek、Gemini等模型上测试后认为,多 Agent 方法的收益常常来自更多测试时计算,而非协作结构本身。在相同推理预算下,单 Agent 方案经常更具性价比,提示评估 Agent 系统时应严格控制计算量,避免把算力增加误判为架构优势。
𝕏 Apple ML Research 提出归一化轨迹模型,用归一化流实现少步高质量生成
Apple ML Research发布论文《Normalizing Trajectory Models》,提出基于归一化流的轨迹建模方法,可在少量生成步数下保持高质量输出,并支持精确的轨迹似然计算。该方法为高效生成模型提供了新路径,尤其适合需要兼顾采样效率与概率评估的生成任务。
𝕏 研究发现 LLM 工具调用失败常集中在“认知到行动”转换阶段
论文发现,LLM在工具调用任务中并非总是不知道何时需要工具,而是经常已经判断应调用工具却未实际执行。研究报告的错配率达26%至54%,说明关键瓶颈可能位于从认知判断到行动执行的转换阶段,对 Agent 可靠性评测和工具调用训练具有直接意义。
𝕏 研究发现 beta-HPV 可能直接维持皮肤癌生长
一项医学研究在34 岁女性患者的肿瘤细胞中发现beta-HPV嵌入 DNA,提示其可能不仅与皮肤癌风险相关,还可能直接维持肿瘤生长。患者接受相关处理后,移植后3 年未复发,为理解病毒驱动型皮肤癌提供了新的证据线索。
𝕏 SemiAnalysis 推荐 MLSys 2026 研究:MoE 服务均衡与注意力解耦
SemiAnalysis推荐多项MLSys方向研究,重点包括MoE 专家复制、Core Attention Disaggregation,以及长上下文场景下的 GPU 负载均衡。这些工作聚焦大模型服务系统的吞吐、延迟和资源利用率,反映出推理基础设施正在从模型结构优化延伸到系统级调度优化。
𝕏 SemiAnalysis 详解 GPT 4.6 至 GPT 4.7 的分词器技术改进
SemiAnalysis发布技术分析文章,详细拆解从GPT 4.6到GPT 4.7的分词器改进细节,揭示模型在处理效率、上下文理解和底层表示上的优化逻辑。文章重点关注分词策略变化如何影响推理成本、文本压缩率与长上下文表现。
𝕏 泡菜乳酸菌 CBA3656 或帮助肠道排出纳米塑料
世界泡菜研究所研究发现,泡菜来源的CBA3656乳酸菌可结合聚苯乙烯纳米塑料,并促进其从肠道排出。该结果提示特定益生菌或可用于降低纳米塑料在消化系统中的滞留,但仍需要更多动物实验和人体研究验证其实际效果。
🚀 产品发布
Meta 为 Ray-Ban Display 推送神经腕带虚拟手写输入
Meta 向 Ray-Ban Display 推送虚拟手写功能,用户可配合 Meta Neural Band 在 WhatsApp、Messenger 等应用中输入消息,强化智能眼镜与腕带组合在轻量交互和可穿戴通信场景中的实用性。
💹 中国电信推出试商用 Token 套餐,覆盖开发者、企业与家庭用户
中国电信 于 5 月 17 日推出三类 Token Plan 试商用套餐,覆盖开发者、中小微企业、个人家庭和生态伙伴,体现运营商开始围绕模型调用、算力与智能服务探索面向多类用户的计量套餐。
𝕏 Tesla FSD V14.3.3 开始推送,智能召唤最高速度提升至 8 mph
Tesla FSD V14.3.3 已开始推送,并包含 Spring Update 更新内容;其中 Actually Smart Summon 最高速度由 6 mph 提升至 8 mph,约提升 33%,进一步改善车辆在停车场等低速场景下的自动召唤体验。
𝕏 GitHub Copilot App 开放访问申请,探索移动端或独立 Agent 编程体验
GitHub Copilot App 已开放申请访问,产品形态接近 Codex App,可能面向移动端或独立 Agent 编程体验,进一步扩展 GitHub Copilot 从 IDE 插件到独立应用的使用场景。
🏠 多家银行关停独立信用卡 App,业务转向综合 App
中国银行“缤纷生活”App 将于 6 月 30 日 停服,相关信用卡业务逐步转向综合 App;同时,全国信用卡数量已降至 6.96 亿张,反映银行信用卡业务线上入口整合与行业规模变化。
𝕏 Vercel 发布面向 AI Agent 的编程语言 Zero
Vercel 发布 Zero,定位为面向 AI Agent 阅读和执行的编程语言,重点服务于 Agent 驱动的软件开发流程,试图让代码结构更适合机器理解、规划与执行。
🏠 Google I/O 2026 定档北京时间 5 月 20 日凌晨 1 点
Google I/O 2026 将于北京时间 5 月 20 日 1 点 开幕,预计聚焦 AI 与新产品发布,是 Google 展示下一阶段平台能力、开发者工具和消费级产品更新的重要年度活动。
𝕏 阿里发布 Qoder v1,面向代码生成与开发辅助场景
阿里 发布 Qoder v1,定位为 AI 编程 IDE,面向代码生成、开发辅助和工程效率提升场景,加入国内厂商围绕智能编程工具与 Agent 化开发环境的产品竞争。
🌍 国际大事
💹 霍尔木兹海峡航运受阻冲击全球能源供应
伊朗战事导致霍尔木兹海峡航运中断,全球约两成 LNG 供应受阻。多国转向煤炭作为能源缓冲,韩国燃煤发电量增幅超过三成,澳大利亚纽卡斯尔港动力煤现货价格上涨 12%,凸显中东局势对全球能源格局的外溢影响。
世卫组织称刚果(金)和乌干达埃博拉疫情构成国际关注突发公共卫生事件
WHO称刚果(金)伊图里省暴发罕见本迪布焦型埃博拉疫情,已报告 8 例确诊、246 例疑似病例及 80 例疑似死亡。邻国乌干达首都坎帕拉出现输入病例和死亡,且该毒株暂无可用疫苗,跨境扩散风险升高。
美方回应伊朗方案提出五项关键条件
美国回应伊朗相关方案时提出五项关键条件,包括伊朗移交400 公斤浓缩铀、仅保留一处核设施、不解冻资产、不支付赔偿,并以谈判作为停火前提。这些条件显示美方在核设施与制裁问题上仍维持强硬立场。
𝕏 普京将于 5 月 19 日至 20 日对中国进行国事访问
中国外交部宣布,俄罗斯总统普京将于5 月 19 日至 20 日应中国国家主席邀请对华进行国事访问。该消息在特朗普结束访华不足 24 小时后公布,行程安排在特朗普到访后一星期,引发外界对大国外交互动的关注。
阿联酋巴拉卡核电站外围发电机遭无人机袭击起火
阿联酋巴拉卡核电站外围一台电力发电机因无人机袭击起火,未造成人员伤亡。FANR确认事件未影响辐射安全与关键系统,核电站核心运行安全未受影响。
𝕏 美国总统在北京峰会后警告台湾不要正式宣布独立
BBC 中文称,美国总统在北京峰会结束后,公开警告台湾不要正式宣布独立,相关表态触及台海政治红线,显示华盛顿在两岸议题上继续试图管控风险。
伊朗军方警告美国再次军事行动将遭进攻性回应
伊朗武装部队发言人警告,若美国再次对伊朗实施军事威胁或行动,美方在地区的军事资产和部队将遭到“进攻性回应”。该表态显示美伊紧张局势仍处高位。
赖清德重申台独两层意涵,回应特朗普涉台表态
赖清德称,台湾不属于中华人民共和国,且“中华民国”与中华人民共和国互不隶属,台湾前途由2300 万人决定。相关发言被视为对特朗普涉台表态的回应。
伊朗议长卡利巴夫被任命为对华事务特别代表
卡利巴夫经伊朗总统提议、最高领袖批准,被任命为对华事务特别代表,将协调伊朗各部门与中国合作,显示德黑兰对中伊合作机制的重视。
李显龙将访问广西和上海五天,聚焦中新地方合作
李显龙5 月 18 日起访华五天,将访问广西和上海,聚焦中新地方合作。2025 年新加坡与广西贸易额达138 亿元人民币,对沪投资约 280 亿美元。
日本超半数受访者反对解禁杀伤性武器出口
日本5 月 17 日民调显示,57.2%受访者反对解禁杀伤性武器出口,**37.1%**表示赞成。该结果反映日本社会对防卫装备出口政策调整仍存在明显分歧。
𝕏 欧盟贸易专员称中欧贸易不可持续
欧盟贸易专员 Maros Sefcovic称,欧洲与中国当前贸易关系“不可持续”,并讨论欧盟是否准备承担贸易战风险。相关表态凸显中欧经贸摩擦和政策分歧仍在升温。
💹 第 13 届世界城市论坛在巴库开幕
第 13 届世界城市论坛于 5 月 17 日至 22 日在巴库举行,注册参会者约4.1 万人。会议聚焦城市发展、住房、可持续治理等议题,是全球城市政策交流的重要平台。
📈 财经市场
长鑫科技 IPO 申报稿披露:上半年营收预计 1100 亿至 1200 亿元
长鑫科技科创板 IPO 申报稿披露,预计 2026 年上半年营收1100 亿至 1200 亿元、同比增长 612.53%至 677.31%,扣非归母净利 520 亿至 580 亿元;一季度营收 508 亿元、净利润330.12 亿元,发行前清辉集成持股 21.67%居首。
💹 星巴克将在美国裁员 300 人并计提 4 亿美元重组费用
星巴克5 月 15 日宣布在美国裁员300 人并关闭多个地区办公室,预计产生4 亿美元重组费用;尼科尔上任后已进行三轮裁员,反映其继续压缩成本、重整美国业务。
广药拟 24.18 亿元取得达安基因间接控制权
广药集团拟耗资24.18 亿元,通过交易合计控制达安基因 3.72 亿股,占总股本26.63%,从而取得达安基因间接控制权。
𝕏 软件股或迎短期反弹窗口:Salesforce、Snowflake 与微软均有催化
纳指自 3 月 31 日反弹后市场广度偏弱,部分软件股可能迎来短期催化:5 月 27 日Salesforce/Snowflake 财报、6 月 2 日微软 Build 大会被视为观察 CRM、SNOW 和微软 AI 叙事的关键窗口。
🏠 SpaceX 拟采用马斯克超级投票权架构
SpaceX拟设置B 股 10 倍投票权架构,相关股份全部由马斯克掌控;该安排可能显著强化创始人控制权,并削弱董事会制衡能力。
💹 和远气体澄清:六氟化钨仍处试生产阶段
和远气体5 天 3 板后公告澄清,六氟化钨项目仍处试生产阶段,尚无实质订单、客户认证和任何业绩贡献,提示相关概念炒作风险。
💹 衢州发展终止收购先导电科 95.4559%股份
衢州发展公告终止发行股份购买**先导电科 95.4559%**股份,并承诺1 个月内不再筹划重大资产重组事项。
💹 小崧股份关联参股公司贷款逾期,担保累计 1.55 亿元
小崧股份披露,关联参股公司贷款逾期导致公司逾期担保累计1.55 亿元,占最近一期净资产20.39%,需关注担保风险对资产负债表的影响。
𝕏 标普 500 与沪深 300ROE 差距:17%对 9.9%
标普 500成份公司 2026 年平均 ROE 约17%,相比之下沪深 300平均 ROE 约 9.9%,显示中美主要股指在盈利质量和资本回报率上的差异。
以色列一季度出口和私人消费下滑
以色列统计局称,一季度出口下降3.7%、私人消费下降4.7%,但投资增长 12.6%,显示经济内部需求与资本开支表现分化。
🔶 欧洲国债收益率走高,市场重估加息可能
德国、英国长债收益率走高,油价维持高位推升欧洲通胀与利率预期,市场开始重新评估欧洲央行及英国央行未来政策路径。
🏭 工业能源
𝕏 Figure 人形机器人自主处理包裹数突破 10 万件
Figure宣布其人形机器人已处理超过100000 件包裹,全程自主运行,并以联网方式支持24/7作业。这一里程碑事件标志着人形机器人在物流自动化领域的重大进展,展示了其在复杂环境下的持续作业能力与可靠性。
无锡落地华为昇腾 384 超节点 Token 工厂
弘信电子 与无锡高新区签约,首批部署 4 台华为昇腾 384 超节点服务器,建设国产算力 Token 工厂。该项目旨在打造本地化大模型训练与推理基地,推动国产算力生态在工业场景的深度应用。
🔵 三星与最大工会将进行最后机会谈判以避免罢工
三星电子与最大工会将于周一恢复谈判,韩国总理警告若罢工发生,可能冲击韩国经济和半导体供应链稳定。此次谈判被视为避免大规模停工的关键节点,对全球芯片供应格局具有重要影响。
杭州国家人工智能应用中试基地揭牌
杭州 具身智能中试基地揭牌,18 家企业 签约,覆盖资本、芯片、本体与应用。该基地将为具身智能技术提供从研发到量产的全链条验证服务,加速产业落地进程。
𝕏 Resonac 硬盘介质产能增 30%及 Hoya 玻璃被抢购
Resonac宣布在新加坡增加**30%**的硬盘介质产量,反映 AI 存储需求外溢。同时,光通信行业正以 HDD 厂商5 倍的价格抢购Hoya的玻璃产能,导致硬盘制造商扩产困难,产业链资源分配出现结构性变化,凸显关键材料在 AI 基础设施中的战略地位。
𝕏 General Astronautics 启动轨道制造工厂公司
General Astronautics获超额认购种子轮,计划从工业机器人切入轨道制造;宇航员时间成本达13 万美元/小时。该公司旨在利用低成本自动化技术解决太空制造的高昂人力成本问题,开启商业航天新赛道。
💹 甬舟铁路富翅门公铁两用大桥西主塔上横梁完成浇筑
甬舟铁路富翅门大桥全长1726 米、主跨388 米,采用双线铁路和 6 车道高速同层布置。该工程节点的完成标志着世界首座双层悬索桥建设取得重大进展,将极大提升区域交通效率。
𝕏 Jane Street 公开得州 AI 训练中心内部画面
Jane Street得州 AI 训练中心配备4032 张 GPU、8000 公里光纤和液冷系统,用于低延迟量化交易基础设施。该设施展示了高频交易领域对高性能计算和超低延迟网络的极致追求。
𝕏 佛山家具业受关税冲击中美贸易摩擦加剧
中国家具之都佛山面临严峻挑战,美国关税及海外竞争导致当地制造商利润受损。此前美国家具产业曾输于“中国冲击”,如今局势反转,供应链重构带来阵痛,传统制造业在全球贸易壁垒下面临转型压力。
🔶 中信证券建议关注 AI+能化杠铃结构
中信证券 认为 AI+能化 或成为全年供需缺口和超额收益来源,关注国产算力与云平台。报告指出能源与化工行业的数字化转型将释放巨大价值,形成新的投资主线。
𝕏 SpaceX 等公司押注轨道服务器但经济性仍差
SpaceX、蓝色起源等探索轨道服务器集群,试图绕开地球能源和土地限制,但当前经济效益仍不佳。尽管技术愿景宏大,但在发射成本和运维难度面前,该模式尚未展现出优于地面数据中心的商业可行性。
💹 金富科技提示液冷业务扩张与盈利不确定性
金富科技称液冷行业或面临参与者增多、毛利率下滑和阶段性产能过剩。随着 AI 算力需求爆发,液冷技术虽成热点,但过度竞争可能导致行业洗牌,企业需警惕短期盈利风险。
🧠 深度思考
𝕏 AI 创业方法论:区分语言能力与现实交付,先找昂贵产业需求
多条观点共同指向:AI 创业不应从技术想象需求,而要先识别真实且昂贵的产业问题。大语言模型擅长理解、定义和表达,也能承担预测、建模、规划、执行等工程链路;但客户付费、系统稳定运行、团队协作、风险承担仍要靠真实行动验证。因此创业者更应把精力放在BD、客户沟通、市场反馈和信任建立上。
ChatGPT 口癖“稳稳接住你”:语言传染与模式坍缩
文章解释ChatGPT口癖“稳稳接住你”的传播:后训练反馈会强化某些高频、低风险表达,使模型在相似语境中反复输出同类句式,并与Mode Collapse现象相关。该表达进入中文互联网后,又通过截图、模仿和二创变成中文互联网 meme,进一步反向影响用户对 AI 语言风格的感知。
𝕏 Palantir 的核心能力:用前线部署把客户流程搭进 AI 系统
分析称,Palantir的关键不只是销售软件,而是依靠智能体平台、业务知识图谱和FDE 前线部署工程师进入客户办公室,理解真实流程后把业务规则、数据关系和决策链条搭进 AI 系统。这使其更像“业务部署公司”,而非传统意义上的标准化软件供应商。
AI 算力扩张的能源约束:电力、天然气与原油成为命门
Jeff Currie认为,AI 万亿投资无法绕开能源供给瓶颈。数据中心扩张不仅需要芯片和资本,还依赖稳定电力、输电基础设施以及上游燃料;如果天然气和原油供应紧张,算力产业的成本、建设节奏和投资回报都可能受到放大冲击。
两位北大教授讨论 AI 时代教育与就业重构
乔晓春与张丹丹讨论 AI 对教育和就业的重塑,指出AI会先冲击白领与初级岗位,尤其是重复性强、标准化程度高的工作。教育目标也应从“学是什么”转向“学为什么”,更重视问题意识、因果理解、跨学科判断和与机器协作的能力。
𝕏 AI 时代程序员转型:职业危机来自需求结构变化,而非只会不会写代码
两条观点都讨论 AI 时代程序员的焦虑:AI 编程首先改变的是客户需求结构,就像胶卷转数码让原有技术护城河失效,危机不只是 AI 能否写复杂代码。应对上,程序员不宜盲目追逐新工具,而应通过工作流审计找出重复环节,并用低压力练习沉淀底层通用思路,把注意力从工具堆砌转回问题理解与长期能力。
𝕏 AI 渗透率可能仍处早期:X 信息流会制造成熟错觉
作者提醒,X上的AI 讨论密度会显著放大外界对 AI 成熟度的体感,因为关注者多为从业者、创业者和重度工具用户。真实大众市场里,能持续把 AI 融入工作流的重度 AI 使用者可能仍远低于圈内感受,判断市场阶段时应避免被信息流样本偏差误导。
📰 综合新闻
𝕏 刚果东部疫情已通报 246 宗疑似病例和 80 宗死亡
世卫组织称,刚果民主共和国东部伊图里省疫情已通报约246 宗疑似病例和80 宗死亡。世卫组织表示,目前疫情尚未达到全球大流行紧急标准,但当地医疗资源、监测能力和跨境传播风险仍需持续关注。
广西和山西同日发生严重交通事故
广西环江发生皮卡坠河事故,已造成1 死 9 失联;同日,山西左权一辆公交车侧翻,造成 2 名学生身亡、2 人受伤。两起事故均涉及人员伤亡和搜救处置,相关部门正在开展救援及事故原因调查。
湖北原省长王晓东接受中央纪委国家监委调查
王晓东涉嫌严重违纪违法,5 月 17 日接受中央纪委国家监委纪律审查和监察调查。王晓东曾任湖北省省长,现为十四届全国政协常委、农业和农村委员会副主任,此次调查属于反腐领域重要人事动态。
💹 未来一周中国东中部大范围强降雨,17 省份有大到暴雨
5 月 17 日至 23 日,中国东中部地区将出现持续性强降雨过程,预计17 省份有大到暴雨,其中8 省份局地可能出现大暴雨。相关地区需关注短时强降水、山洪、地质灾害及城市内涝等风险。
𝕏 汽车联网数据可能被企业和保险公司用于风险定价
BBC 中文指出,现代汽车通过传感器和联网系统持续收集驾驶行为、位置及个人信息等数据,这些数据可能被车企、数据经纪商或保险公司用于评估驾驶风险并影响保费。报道提醒,车联网带来的便利也伴随隐私与数据透明度问题。
德国普福尔茨海姆排爆 1.8 吨二战遗留炸弹
德国普福尔茨海姆5 月 17 日处置一枚重约1.8 吨的二战遗留炸弹,周边约3 万名居民被强制疏散。当地排爆行动完成后,居民将陆续返回,事件凸显欧洲多地仍面临战争遗留弹药风险。
𝕏 SpaceX 龙飞船抵达国际空间站
SpaceX确认,Dragon货运飞船已与国际空间站完成对接。该飞船此前于5 月 15 日从佛罗里达发射,任务包括向空间站运送补给、科研设备及其他货物。
厦门暂不向结婚新人直接发消费券
厦门市商务局表示,婚庆消费具有低频、大额、链条长等特点,若直接按婚姻登记向新人发放消费券,可能出现重复补贴、核销困难和执行风险。当地将继续研究通过其他方式促进婚庆消费。
💡 生活建议
𝕏 顽固高血压应排查继发性病因
一名顽固高血压患者血压曾达220/112mmHg,检查发现病因是肾上腺腺瘤;手术后血压降至130/80mmHg。长期难以控制的高血压不应只加药,还应排查内分泌、肾脏等继发性原因。
𝕏 35 岁男子胃癌晚期案例提醒重视胃镜筛查
胃癌早期症状可能隐匿,年轻人也不应忽视长期胃部不适。若上腹不适超过2 周应及时就诊;有家族史、幽门螺杆菌感染、长期胃病等高危因素者,建议40 岁起定期做胃镜筛查。
中国驻泰国使馆提醒警惕高薪招聘陷阱
中国驻泰国使馆提醒赴泰人员谨防高薪招聘诈骗,不要轻信“包吃住、轻松高薪”等诱导。赴泰工作应提前办理合法签证并核实雇主资质,遇险可拨打泰国报警电话191求助。
𝕏 家庭应做好 72 小时断水断电应急准备
《经济学人》提醒家庭建立72 小时应急准备:评估在无外部食物、水和电力供应时,饮水、耐储食品、照明、充电、常用药和联络方案是否足够,重点是提升短期自救能力。
🔒 网络安全
𝕏 Grafana Labs 确认 GitHub 环境访问令牌遭未授权获取
Grafana Labs确认有未授权方获取了可访问其GitHub 环境的令牌,攻击者可能借此下载公司代码库。该事件涉及源码访问风险,目前仍处于披露和调查处理中,后续影响范围、令牌权限及补救措施仍需关注。
🐙 Decepticon 开源自主红队黑客 Agent
Decepticon是一个面向红队场景的自主黑客 Agent 项目,定位于自动化渗透测试流程,配套提供项目文档站,并采用Apache 2.0许可开源。该项目的价值在于将红队任务流程化、自动化,便于安全研究人员评估和扩展。
Linux 7.1 新增 AI 发现内核漏洞的负责任披露文档
Linux 7.1新增面向 AI 发现内核漏洞的负责任披露文档,明确安全漏洞定义,并要求AI 生成漏洞报告提供复现器、影响评估和修复建议。该文档有助于提升 AI 辅助漏洞报告质量,减少低质量或不可复现报告带来的维护负担。
𝕏 Claude Code 可运行 50 个专业渗透测试 Agent
该项目支持在Claude Code中运行50 个专业渗透测试 Agent,面向红队自动化和安全测试场景。其重点是通过多 Agent 分工覆盖不同渗透测试能力,帮助用户在代码环境中组织和执行更复杂的安全评估流程。
由 X-Crawler AI 生成于 2026-05-17 20:03
EVENT-DRIVEN INTELLIGENCE
免费先看重点,Pro 再看速度、深度和可追踪性
这篇内容是公开入口。继续使用天眼时,固定沿着三条路径走:订阅每日情报、查看同主题历史上下文、升级 Pro 解锁事件追踪与研究能力。