天眼早报

科技|2026年05月23日|79 分钟阅读
来源:1250 条推文 + 224 篇 RSS 文章·Lanyun·BatchV2 生成·2026-05-22 — 2026-05-23
分享
AI 速读13 条精选
🔲头条Cerebras跑赢GPU云6.7倍

Cerebras在Kimi K2.6(1T参数)上跑到981 tokens/sec,号称比次优GPU云快6.7倍。晶圆级芯片减少跨芯片传输延迟,直接命中企业级编码代理最看重的低时延需求,意味着推理基础设施竞争正从“更大模型”转向“更快、更省”的交付能力。

🤖头条DeepSeek永久降价推V4-Pro

DeepSeek把V4-Pro折扣永久化,6月1日起按原价1/4长期定价,同时招聘信息显示其在做对标Claude Code和Codex的代理式编码工具。价格战从模型API延伸到开发者工作流,可能继续压低智能体、代码助手和应用层创业公司的成本门槛。

📰头条Google推Gemini Omni视频模型

Google在I/O上发布Gemini Omni,主打对话式视频生成和原生编辑,还能在Gemini App里创建带本人声音和形象的自定义头像。它把多模态能力从“生成图片”推进到“编辑视频+数字分身”,会直接冲击Runway等创作工具的产品定位。

🤖头条OpenAI模型证伪数学猜想

OpenAI内部模型据称证伪了著名的Erdős单位距离猜想,研究者认为结果足以投稿《Annals of Mathematics》。如果属实,这不仅是AI在纯数学上的里程碑,也会成为衡量前沿模型抽象推理、验证与发现能力的标志性案例。

📰头条Agent工作流压缩进权重

最新研究提出把完整Agent工作流蒸馏进模型权重,将多步LLM调用、工具调用和决策结构内化到模型里,在接近前沿任务质量的同时把推理成本降低约100倍。这会显著改善Agent经济模型,推动复杂任务从演示走向大规模部署。

🤖Qwen3.7-Max上1M上下文
🤖Gemini Spark做全天候助理
🤖Anthropic暂不公开Mythos
💡DeepSeek推进102.9亿美元融资
🤖MiniMax接入Perplexity降本27%
📰AI调研24小时完成50访谈
📰Runway升级视频编辑模型
📰中国首个1.58-bit三值LLM

🤖 AI 大模型

𝕏 【重磅】Cerebras 在 Kimi K2.6 模型上实现 981 tokens/sec,比 GPU 云快 6.7 倍

CerebrasKimi K2.6(1T 参数)模型测试中达到981 tokens/sec,速度是次优 GPU 云的6.7 倍。其晶圆级芯片架构消除了跨芯片数据传输延迟,解决了企业级编码代理对速度的严苛需求。

𝕏 【重磅】DeepSeek 永久降价并推出 V4-Pro,构建对抗性编码工具

DeepSeek宣布将折扣永久化,正式开放DeepSeek-V4-Pro模型。同时招聘显示其正在开发对标 Claude CodeCodex 的代理式编码工具,旨在提升开发者效率。

𝕏 ⭐ Anthropic 暂不公开 Mythos 级模型,披露 Project Glasswing 漏洞数据

Anthropic称约50 个合作伙伴Claude Mythos Preview扫描1000 多个开源项目,发现超1 万个高危或严重漏洞,因滥用风险暂不公开 Mythos 级模型。

𝕏 ⭐ Cursor Composer 2.5 基准测试:比 Opus 便宜 18 倍,比 GPT-5.5 便宜 32 倍

Cursor Composer 2.5在编码基准测试中表现优异,API 成本仅为Opus 4.71/18GPT-5.51/32。完成任务仅需1.6M token(平均模型需5.7M),耗时9 分钟(平均12 分钟)。

𝕏 ⭐ 首个基于中国 AI 基础设施全流程训练的 1.58-bit 三值 LLM 开源

BitCPM-CANN面壁智能、清华大学、OpenBMB开发,使用华为昇腾 910B完成 1.58-bit 三值 LLM 训练,覆盖量化算子、框架与可复现实验脚本。

𝕏 ⭐ Google 发布 Gemini Omni,可用对话生成和编辑视频

Google发布Gemini Omni,主打对话式视频生成与原生编辑,并支持在Gemini App中创建带本人声音和形象的自定义头像。

𝕏 ⭐ Gemini 3.5 Flash 性能跃升,Elo 评分达 1299 跻身第一梯队

Google DeepMind发布Gemini 3.5 Flash,在 Design Arena 排名升至第16位,Elo 评分1299,超越Claude Opus 4.5GPT-5.5。相比前代提升16 个位次,多模态理解速度提升6 倍

𝕏 ⭐ Google 发布 Gemini Spark:24/7 个人 AI 助手与 Daily Brief

Google在 I/O 大会上推出 Gemini Spark,这是一款全天候个人 AI 助手,支持设置重复任务、学习新技能及创建完整工作流。同时上线 Daily Brief 功能,主动整理待办事项。

𝕏 ⭐ Cursor Composer 2.5 编码代理成本显著低于 Opus 4.7 和 GPT-5.5

Artificial AnalysisCursor Composer 2.5编码任务成本比Opus 4.73–18 倍,比GPT-5.55–32 倍

𝕏 ⭐ Qwen3.7-Max 发布,拥有 1M 上下文并优化 Agent 工作流

Alibaba Qwen推出旗舰模型Qwen3.7-Max,支持1M 上下文长度,在智能体编码、推理及长程自主任务上表现领先,现已在Together Serverless Inference上线供生产使用。

𝕏 ⭐ Runway 发布 Aleph 2.0 视频编辑模型,支持多镜头精准控制

Runway升级视频编辑模型至 Aleph 2.0,新增 Edit Studio 功能。用户可在 1080p 分辨率下处理长达 30 秒的多镜头序列,实现“只改想改部分”的精准编辑效果。

𝕏 ⭐ Cartesia Sonic-3.5 登顶语音模型榜单

Cartesia Sonic-3.5在 Artificial Analysis 语音竞技场排名第1,支持42 种语言500+声音,价格为39 美元/百万字符

𝕏 ⭐ DeepSeek 将 V4-Pro 折扣转为永久

DeepSeek宣布V4-Pro折扣永久化,开发者可继续以约25 折价格调用模型,降低智能体和应用构建成本。

𝕏 ⭐ DeepSeek V4-Pro API 限时折扣转为长期降价

DeepSeekV4-Pro API5 月 31 日 23:59结束 2.5 折活动后,6 月 1 日起正式按原价四分之一长期定价

𝕏 ⭐ Google 每月处理 Token 量同比增长 7 倍

a16zGoogle当前每月处理超过3.2 千万亿 token,较一年前增长7 倍,显示 AI 使用规模继续扩张。

𝕏 ⭐ SGLang 集成 Kimi K2.6 优化,解决高并发乱码问题

LMSYS**与 CloudflareDev合作,Kimi K2.6的解码 KV Cache 卸载与 Mooncake 恢复机制上游提交至 SGLang。现支持在高并发下无乱码运行,且自动恢复 Peer 节点。

𝕏 DeepSeek 推进 102.9 亿美元融资,强调 AGI 与开源

BloombergDeepSeek推进102.9 亿美元融资,梁文锋继续优先发展开源 AI 模型,而非短期商业化。

𝕏 Google DeepMind 扩大 SynthID 水印合作

Google DeepMind扩大SynthID合作,并在Gemini AppGoogle Search中提供 AI 内容识别入口。

𝕏 Gemma 4 实验应用在 Pixel 硬件上实现 100% 离线运行

Google Gemma 4实验应用在野外无网络环境测试,支持视觉理解数学推理工具使用

𝕏 GPT-5.5 被 DHH 用于重写 Omarchy 4,生成 3 万行 QML 代码

DHHOmarchy 4新增3 万行代码多数由GPT-5.5生成,复杂 Agent 任务体验已超过 Opus 4.7。

𝕏 腾讯开源 Z-Image 6B 像素空间图像生成模型

腾讯 Z-Image 6B支持1K 分辨率、无VAE像素空间生成。

𝕏 Gemini 3.5 Flash 在视觉任务上快于 3.1 Pro 约 6 倍

Gemini 3.5 Flash在部分Roboflow 视觉评测超过 3.1 Pro,平均速度约快6 倍

𝕏 DeepSeek V4 Pro API 优惠转为永久降价

DeepSeek-V4-Pro API 折扣改为永久5 月 31 日后定价为原价的1/4

𝕏 OpenAI Codex 新增 Appshots 功能,可直接读取 Mac 应用窗口上下文

OpenAI Codex在 Mac 端加入Appshots,按 Command-Command 即可把应用截图和窗口文本附加到线程。

𝕏 DeepSeek 疑似降价 75%,本地与开源模型成本竞争加剧

DeepSeek被用户发现出现75%折扣,引发对推理优化、华为芯片成本和开源 AI 模型价格战的讨论。

𝕏 DeepSeek 招聘智能体编程工具岗位

DeepSeek招聘信息显示正在开发智能体编程工具,对标Claude CodeOpenAI Codex


🛠️ AI 工具推荐

𝕏 ⭐ MiniMax Agent 接入 Perplexity Search,任务成本下降 27%

MiniMax Agent改用Perplexity Search,在700+智能体任务中工具调用从32.6降至17.8,Token 用量降42%、总成本降27%

𝕏 ⭐ Understand Anything:把大型代码库自动生成可交互知识图谱

Understand Anything可扫描代码库,提取文件、函数、类、依赖关系并生成图谱;支持业务视图、语义搜索、改动影响分析,兼容 Claude Code、Cursor、Codex。

𝕏 ⭐ Hugging Face 开放 Common Crawl 2.19B 网页 SQL 查询

Common Crawl 2026 年 4 月数据与 URL 索引上线Hugging Face Storage Buckets可用DuckDB直接查询21.9 亿网页,计数约35 秒完成。

𝕏 GBrain 开源个人知识图谱工具,已支撑 25 万页 Markdown

GBrain相关软件已开源,Garry Tan 用其管理超过25 万Markdown页面的个人知识图谱。

𝕏 WorkOS 发布 auth.md,面向 AI 代理的网页登录协议

WorkOS推出auth.md开放协议,帮助 Agent 注册网页服务,首批合作方包括CloudflareFirecrawl

𝕏 Perplexity 开源 Bumblebee,扫描开发机供应链风险

Perplexity开源Bumblebee,面向macOSLinux只读扫描风险包、扩展与 AI 工具配置。

𝕏 Presenton 开源 AI 演示文稿工具支持 PPTX、PDF 和自托管

Presenton已获5000+ GitHub stars,支持提示词或文档生成演示、导出PPTX/PDF、Docker 自托管和 Ollama。

𝕏 MentraOS 支持 Even Realities G2 智能眼镜

MentraOS新增Even Realities G2支持,可同时运行字幕、翻译、AI 记笔记和主动代理应用。

𝕏 Warp Agent 开放 BYOK,可免费接入自有模型密钥和推理端点

Warp Agent现在支持免费BYOK,可配置OpenAI、Anthropic、Gemini密钥,并接入 OpenRouter、LiteLLM、DeepSeek 等兼容端点。

𝕏 ⭐ 开源工具 lark-channel-bridge 一键桥接飞书与 Claude Code

开发者分享开源项目 lark-channel-bridge,通过一条命令即可让飞书变身超级助手,实现比官方 Agent 更强的自动化能力,适合飞书重度用户。

𝕏 llama.cpp 新增 WebGPU 后端

llama.cpp/ggml新增完整WebGPU后端,项目由USCS团队推进约1.5 年,附交互博客和论文说明架构。

𝕏 ⭐ MengTo 发布图像生成自定义光标工具

MengTo**分享自制工具,利用 Images 2.0技术为屏幕录制生成自定义光标,提升演示内容的视觉吸引力与个性化体验。

𝕏 Grok 新增 Vercel、Canva、Gamma 和 S&P Global 连接器

Grok新增Vercel、Canva、Gamma、S&P Global连接器,可用于建站、设计、生成演示和调用市场数据。

𝕏 Google Cloud Run 新用户可免信用卡部署

Google Cloud Run允许新用户免信用卡即时部署live URL,降低首次云端发布门槛。

𝕏 ChatGPT 支持上传表格图片并用语音填写

ChatGPT支持上传表格图片,用户可通过语音模式说明内容并生成填写后的版本。

𝕏 Cloudsail 为编码智能体创建即时沙盒

Cloudsail可为每个任务创建Cloudflare Sandbox,内置 Shell、Codex 和 GitHub 访问,避免令牌暴露。

𝕏 ⭐ Tom Doerr 分享访问各大模型 API 免信用卡工具

Tom Doerr**推荐一款实用工具,允许用户无需绑定信用卡即可直接访问 GPTClaudeGrok的 API,降低开发者试错成本。

𝕏 OpenRouter 已接入 Warp,开发者可在终端中调用多模型服务

OpenRouter已支持Warp,开发者可在 Warp Agent 中连接统一模型路由与 OpenAI 兼容推理端点。

𝕏 Firecrawl 在 Devtool Arena 智能体搜索榜排名第一

FirecrawlDevtool Arenaagentic search评测中排名第1

𝕏 Clipport:将 Mac 剪贴板内容粘贴到远程 iTerm SSH 会话

Clipport支持把Mac 剪贴板文本和截图直接粘贴到远程iTerm SSH会话。

𝕏 Claude Code 用量终端监控工具发布

Claude Code终端监控工具可实时查看使用量和限制,适合高频开发者控制额度。


📖 教程攻略

𝕏 免费 LLM 第一性原理完整指南:从机制到本地部署

LLM 指南系统讲解Tokenizer、Transformer,并进一步覆盖 AttentionKV Cache、RAG、Agent、微调与多模态,还延伸到量化、VRAM 计算、运行时、隐私和本地部署路径,适合想系统补齐大模型底层知识的人。

𝕏 Linear 性能优化长文:IndexedDB、乐观更新与首屏加载

Linear性能文章拆解IndexedDB、首次加载优化、Optimistic Updates等实现细节,并为每个关键点配套 Demo,适合前端工程师直接复用和参考。

𝕏 斯坦福免费开放 5 门 AI/ML 课程

Stanford免费开放5 门 AI/ML 课程:CS221、CS229M、CS229、CS230、CS336,覆盖 AI、机器学习、深度学习到 LLM 从零构建的核心内容。

𝕏 芯片黑板课:从逻辑门到 GPU、TPU、FPGA

Dwarkesh Podcast发布芯片教程,从逻辑门讲到脉动阵列、流水线、GPU/TPU/FPGA差异和缓存设计,帮助理解计算硬件的底层演进。

𝕏 Agentic Engineering 推出智能体实战实验

Omar Sar推出Agentic Engineering实战实验,首期聚焦Agent Skills,后续还会覆盖规划、上下文工程、多智能体和长任务智能体等主题。

𝕏 Stanford CS336 第 7 讲:GPU 并行与多 GPU 训练

Stanford CS336第 7 讲从广播、聚合、all-gather 讲到张量并行数据并行流水线并行,并用代码解释多 GPU 训练的基础机制。

𝕏 PyTorch 2.12 发布:编译、导出、图捕获与加速器支持

PyTorch 2.12更新涵盖torch.accelerator.Graph API、CUDA Graphs、ROCm、XPU、MPS 和 Arm 平台支持,重点强化编译、导出与图捕获能力。

𝕏 用 DeepSeek 低成本微调 DistilBERT 做提示注入检测

ml-intern微调DistilBERT完成提示注入检测,流程包括选数据集、试模型、样本训练和完整训练,整个实验成本低于1 美元,很适合快速验证安全分类任务。

𝕏 GPT Image 2.0 奢侈品牌视觉系统提示词

GPT Image 2.0提示词给出3x3 品牌识别网格模板,覆盖 Logo、包装、社媒、UI 和生活方式场景,适合快速生成统一的品牌视觉系统。

𝕏 AI 训练与推理底层讲座:从逻辑门到 4 位 MAC

Reiner Pope用黑板讲解 AI 芯片,从逻辑门4 位乘加器到训练中的矩阵乘法,串起推理与训练背后的硬件计算基础。

𝕏 200 本以上编程电子书合集

tom_doerr分享200+编程电子书合集,内容覆盖语言、框架和工程知识,适合开发者系统性扩展技术阅读面。

𝕏 AI 学习资源清单:书籍、课程与论文

AI 学习清单整理书籍、课程、研究论文等资源,覆盖入门到进阶的系统学习路径,适合想补齐 AI 基础知识的人按主题查漏补缺。

𝕏 AI、数学与深度学习书单合集

AI、数学、深度学习书籍合集覆盖模型基础、训练方法和理论学习资源,适合希望从数学与算法视角补强 AI 基础的人。


💎 技巧经验

𝕏 Twitter 增长经验:先连接,再扩粉

Kevon Cheung 分享 Twitter 增长方法:先建立连接,再追求粉丝规模,核心是 PIERS 框架。执行上建议每天投入 30 分钟,内容配比可按 40%故事20%金句20%转发20%其他 来维持稳定输出。

𝕏 ChatGPT Image 2 处理美甲图像比 Photoshop 更快

ChatGPT Image 2 在美甲图像处理里做超分、增强和甲片蒙层只要 5-8 秒,而专业设计师用 Photoshop 往往要 1-2 分钟。适合快速处理电商/美甲素材,速度优势很明显。

𝕏 中国 5 万美元购汇额度不能直接用于境外投资

文件提示,个人购汇申请书中的 5 万美元 便利化额度并不等于可自由用于境外买房或 证券投资;若违规使用,可能影响后续连续 2 年 的额度申请。

𝕏 ChatGPT 侧边栏编辑 PPT 效果优于 Codex

ChatGPT 的侧边栏可以直接编辑 PPT 模板,修改文本时能尽量保持原有布局;在原创页面上的表现接近 Opus 4.7,比 Codex 更适合这类演示文稿微调任务。

𝕏 Mark Cuban 复盘雅虎股票交易:用对冲锁定收益

Mark Cuban 回顾出售公司后拿到 57 亿美元雅虎股票 的经历:先做空 互联网指数,再通过卖 call、买 put 对冲 6 个月 限售风险,最终把不确定性转成了可控收益。

𝕏 Linear 用 Slack 频道管理每个项目反馈

Linear 的做法是为每个项目单独建一个 Slack 频道,把客户反馈、问题收集和 Beta 沟通都集中到频道里,再统一转成 Issue,减少信息分散和遗漏。

𝕏 用 LangSmith 追踪 Claude Code 会话、用量与成本

Claude Code 会话接入 LangSmith,可以记录和分享对话、追踪使用模式,并统一监控 用量成本。适合团队做审计、复盘和费用控制。

𝕏 AI 冷邮件泛滥后可默认屏蔽新域名

面对 AI 批量生成的冷邮件,Gergely Orosz 建议采用 The Screener 的思路,默认拦截新域名邮件,把未知发件人先挡在外面,再按需要放行,以降低垃圾邮件和自动化骚扰。

𝕏 Lee Robinson:招聘文案少写履历,多展示作品

Lee Robinson 认为高质量招聘文案应少写履历,多展示真实作品;他建议文案保持口语化,加入数字和幽默,并要求候选人直接为 Clicky 提交设计或视频,以便更快判断能力。


⚡ 工作流

𝕏 Oliver 用旧游戏 PC 打造 TikTok 内容 Agent,5 天跑出 50 万+播放

Oliver用旧游戏 PC 搭建 TikTok 内容 Agent:借助 OpenClaw 管理本地身份与记忆,用 gpt-image 生成竖版图,再通过 Postiz 上传草稿。该流程5 天内获得50 万+播放,单条视频最高 23.4 万播放,MRR 达 588 美元;核心 Hook 公式是“[他人] + [冲突] → 展示 AI → 改变认知”。

𝕏 ListenLabs 用 AI 代理重构客户调研流程,将 8 周缩短至 24 小时

ListenLabs利用 AI 代理 改造传统市场调研,解决周期长、成本高的问题:过去单次调研可能花费 $30 万-$50 万、耗时 8 周,现在可通过 AI 访谈24 小时 内完成 50 个 深度访谈并快速分析数据。微软已作为早期客户采用这一流程。

𝕏 三步用 Codex 和 Chrome 插件把 Markdown 文章发布到 X

该流程展示如何用 CodexChrome 插件Markdown 文章发布到 X:先安装相关工具,再导入 baoyu-skill,最后通过“@chrome”把文章和配图一起发送到 X 草稿箱,适合把长文内容半自动化发布到社交平台。

𝕏 Codex 可在浏览器中自主训练 1000 万参数 Transformer

Codex 通过控制 Chrome 打开 Colab自主训练约 1065 万参数 的 Transformer;在 T4 上运行约 19 分钟,随机检查结果达到 99/100 正确。该案例展示了浏览器自动化与代码代理结合后,可执行较复杂的机器学习实验流程。

𝕏 飞书与本地文档发布到 X 的媒体顺序优化方案

该方案面向从 飞书视频 与本地文档发布到 X 的场景,处理富文本 HTML、封面上传和媒体倒序插入等细节,重点解决 X 文章 在发布时容易出现的丢图、错位和媒体顺序异常问题。

𝕏 gBrain 作为智能体团队共享记忆层的架构实践

gBrain 将上下文按 people、companies、projects 等目录组织,让研究、社媒、外联等不同 智能体 读写同一套 记忆层。这种结构有助于多 Agent 团队共享背景信息、减少重复收集,并保持项目上下文连续。

𝕏 Kakuna 用清单式 Skills 自动加固代码库并生成自审报告

Kakuna 通过 skills 清单 让 Agent 并行处理代码加固、DevOps 和产品管理任务;工作完成后,会输出功能保持结果与 审计报告,用于验证改动是否影响原有功能,并沉淀可复用的代码库加固流程。

𝕏 牛马 AI 将竞品调研结果拆成任务排期、依赖和自动执行项

牛马 AI 可把 GPT 网页调研后的竞品建议转化为 任务排期 与依赖关系,并进一步区分可自动执行和需要人工参与的任务。该流程适合把竞品分析从“报告”推进到可落地的项目管理和执行清单。


📚 论文研究

𝕏 OpenAI 内部模型据称证伪 Erdős 单位距离猜想

OpenAI 内部模型据称成功证伪著名的 Erdős 单位距离猜想,研究者认为该结果足以推荐给 Annals of Mathematics 接收。若消息属实,这将是 AI 在纯数学领域解决长期未解难题的重要突破,也可能成为评估前沿模型数学推理能力的标志性案例。

𝕏 Agent 工作流蒸馏进模型权重,推理成本降低约 100 倍

最新研究提出将完整的 Agent 工作流 蒸馏进模型权重,把多步 LLM 调用、工具调用与决策结构压缩到模型内部。该方法在接近前沿任务质量的同时,推理成本 降低约 100 倍,为 Agent 编译、部署和规模化应用提供了更强的经济论证。

𝕏 礼来 Retatrutide 三期结果显示最高减重 28.3%

礼来 Retatrutide 三期数据显示,最高剂量组在 80 周 内平均减重 28.3%,平均减重约 70 磅,且 45% 受试者减重超过 30%。该结果显示其在肥胖治疗领域具备较强潜力,也可能进一步加剧 GLP-1 类药物市场竞争。

𝕏 LT2 提出线性时间循环 Transformer,兼顾速度与性能

LT2 提出一种线性时间循环 Transformer,将循环结构与 线性注意力、稀疏注意力结合,以在长上下文场景中兼顾速度和性能。团队还蒸馏出 Ouro-hybrid-1.4B,并公开论文、代码、项目和模型,方便社区复现与进一步研究。

𝕏 Morgan Stanley 解析 VR NVL72 硬件 BOM 结构

SemiAnalysis 引用 摩根士丹利 报告,详细拆解 VR NVL72 的 BOM 结构。报告指出,内存价值包含 LPDDR5x SOCAMM 和 NVMe SSD,但不含 HBM;由于无电缆设计,PCB 含量显著增加,且 OEM 渠道价格低于超大规模云厂商。

𝕏 JAMA Neurology 研究提示孕期毒死蜱暴露影响儿童脑发育

JAMA Neurology 发表研究,追踪纽约 270 名儿童 后发现,孕期接触农药 毒死蜱 与儿童脑结构差异和运动能力下降相关。该研究来自哥伦比亚大学等机构,提示产前环境暴露可能对儿童神经发育产生长期影响。

𝕏 Google Research 在 Nature 发表 ERA 智能体科研辅助系统

Google ResearchNature 发表 ERA 研究,展示一种面向科学研究的智能体编码系统。该系统旨在辅助科研人员进行代码编写、实验推进与发现验证,体现了 AI Agent 在高价值科研工作流中的应用潜力。

𝕏 Allen AI 推出 ArtifactLinker,自动发现并验证 Hugging Face 模型评测 SOTA

Allen AI 推出 ArtifactLinker,可预测哪些模型可能在 Hugging Face 基准上刷新 SOTA,并自动运行评测验证结果。该系统有助于减少人工追踪模型进展的成本,也能提升基准评测发现和复现的效率。

𝕏 德州发现 8000 多万年前海洋爬行动物新物种 Tylosaurus rex

科学家在 德州 发现海洋爬行动物新物种 Tylosaurus rex,其生活于 8000 多万年前,体长可达 43 英尺。这一发现为研究白垩纪海洋生态系统和大型海生爬行动物演化提供了新的化石证据。

𝕏 OpenCLIP 重构训练框架并加入 FSDP2 与 NaFlex 支持

OpenCLIP 近期重构训练任务抽象,加入 FSDP2、torch.compile 改进NaFlex 管线和 CLAP 训练支持。此次更新提升了训练框架的灵活性和扩展性,有助于多模态模型训练与实验迭代。

𝕏 VPO 用向量奖励改进 LLM 强化学习后训练

Vector Policy Optimization 提出直接优化 向量奖励,用于提升 LLM 测试时搜索表现。相比将多维反馈压缩为单一标量奖励,VPO 试图保留更丰富的偏好与质量信号,从而改善强化学习后训练效果。

𝕏 RMSD 改进企业任务中的自蒸馏训练稳定性

RMSD 使用两步过滤 loss mask 筛选高信号 token,在企业任务的自蒸馏训练中,相比 OPSD 提升稳定性、数据效率和性能上限。该方法重点解决自蒸馏过程中噪声 token 影响训练质量的问题。

𝕏 ScheduleFree+ 提出无需学习率调参的大模型训练方法

ScheduleFree+ 论文称可无学习率调参 训练扩展到 LLM,并在长时训练中优于传统 schedule。该方法旨在降低大模型训练对学习率计划设计的依赖,提升训练流程的稳健性和可复用性。

𝕏 RAI Institute 机器人实现三球杂耍

RAI Institute 机器人通过 视觉和接触信息 动态调整手部动作,实现无需外部辅助的 三球杂耍。该成果展示了机器人在快速动态操作、实时反馈控制和灵巧手协调方面的进展。

𝕏 3D 感知与空间推理基础智能体研究启动

新项目聚焦 3D 感知空间推理 基础智能体,面向具身 AI 与机器人场景。研究目标是提升智能体对三维环境的理解、定位、规划和交互能力,为更通用的 具身智能 系统奠定基础。


🚀 产品发布

𝕏 Google Project Genie 上线:可将美国街景转为可交互 3D 世界

Google DeepMind联合Google Maps推出Project Genie,面向符合条件的 Google AI Ultra 订阅用户开放。该项目可将美国真实地点的 Google Maps Street View 转换为可提示、可互动的 AI 3D 场景,为街景浏览、探索和创作带来新的交互方式。

𝕏 奔驰计划 2026 年底在德国推出城市点到点自动驾驶

奔驰计划自2026 年底在德国部分城市率先推出城市点到点自动驾驶系统,覆盖红绿灯识别、车道变换等复杂城市场景,并计划从2027 年初扩展至德国全国,推动自动驾驶从高速辅助走向城市点对点出行。

𝕏 ElevenLabs 语音市场创作者累计收入突破 2200 万美元

ElevenLabs宣布语音市场创作者累计收入超过2200 万美元,较2025 年 11 月公布的 1100 万美元在6 个月内翻倍,显示 AI 语音创作者生态和商业化能力持续扩大。

𝕏 Juno 上线 6 个月,已服务全球 8 万慢性病用户

Juno定位为AI 个人健康助手上线 6 个月已支持全球8 万慢性病用户,面向长期健康管理场景提供个人化辅助服务,体现 AI 健康助手在慢性病人群中的早期应用规模。

𝕏 Lynx UI 正式发布,提供跨端原生 UI 组件

LynxJS宣布lynx-ui通用可用,提供可组合的原生 UI 组件,内置LUNA主题及 @motiondotdev 集成,支持 iOS、Android 和 Harmony 生产环境,并计划继续改善 Web 与桌面端支持。

𝕏 Cursor 发布官方 SDK,支持基于 Composer 2.5 构建智能体

Cursor推出官方SDK,允许开发者使用 Python 和 TypeScript 构建基于Composer 2.5的智能体。本周末 SDK 使用费用享受90% 折扣,旨在降低智能体开发门槛。

𝕏 特斯拉欧洲停售一次性购买 FSD,仅保留月订阅

特斯拉 FSD在欧洲调整购买方式,仅保留月订阅选项;英国价格为99 英镑/月,多数欧洲国家为99 欧元/月。这意味着欧洲用户暂时无法一次性买断 FSD 功能。

𝕏 Microsoft Foundry 接入三款 Hugging Face 开源图像模型

Microsoft FoundryHugging Face接入SDXLFLUX.1-schnell和 Z-Image-Turbo 三款开源图像模型,扩展开发者在图像生成场景中的模型选择。

𝕏 Google Docs Live 将用语音协助生成大纲和起草文档

Google Docs Live支持用语音生成大纲、调整语气和起草文档,计划于夏季向Google AI Pro/Ultra订阅者推出,进一步把语音交互引入文档创作流程。

𝕏 xAI Grok 与 X Premium 订阅可接入 opencode

xAI宣布GrokX Premium订阅可在opencode中使用,开发者可借助订阅权限获得高速代码库智能能力,用于代码理解、生成和协作开发。

𝕏 Meta 低调推出类 Reddit 社区应用 Forum

Meta推出独立应用Forum定位为围绕话题讨论的 Facebook Groups 社区产品,主打按主题聚合用户讨论,形态接近 Reddit 式社区论坛。

𝕏 Allowance 为 AI 代理提供一次性虚拟卡购物能力

AllowanceAI 代理使用一次性虚拟卡安全购买,内置旅行、比价、预订和电商结账限制,帮助代理在受控权限内完成真实支付与购物任务。

𝕏 Notion 公布首届开发者平台黑客马拉松获奖作品

Notion公布首届开发者平台黑客马拉松结果:冠军作品《The Office》将角色转化为Notion Custom Agents;亚军Snoopy AI利用数据库构建语音代理处理订单;季军 Cerebro 打造 Slack 邮件智能助手。

𝕏 Supabase 支持在 Schema Visualizer 中直接编辑表

Supabase新增在Schema Visualizer直接编辑数据库表的能力,开发者可在可视化结构视图中完成表编辑操作,减少在不同数据库管理界面之间切换。

𝕏 Figma Grid 新增拖拽重排与自动行定位

Figma Grid更新支持拖拽重排列、自动定位automatic rows,让设计师在网格布局中更方便地调整元素顺序与行布局,提升复杂界面排版效率。

𝕏 NASA 公布 5 月 27 日国际空间站太空行走直播信息

NASA5 月 27 日两名 Roscosmos 宇航员将在国际空间站安装 Zvezda 太阳辐射实验设备,并公布相关太空行走任务的直播安排。

𝕏 xAI 改版官网,集中展示模型、产品与开发者入口

xAI上线新版官网,重做模型、产品、开发者和企业入口,帮助用户更快接入Grok相关服务,也让面向开发者与企业客户的产品路径更加清晰。


🌍 国际大事

𝕏 特朗普政府收紧绿卡申请流程,多数需赴境外领馆办理

USCIS新指南要求多数绿卡申请人在申请永久居留时,通常需返回母国通过移民签证流程办理,仅特殊情况可在美国境内调整身份。

𝕏 加州签署首个 AI 就业冲击行政令

Newsom签署行政令,要求加州建立AI 劳动力仪表盘,并研究遣散、补贴岗位、就业保险与WARN 规则更新。

𝕏 巴基斯坦陆军参谋长赴德黑兰参与伊美间接谈判

Asim Munir周五前往德黑兰会见伊朗高级官员巴基斯坦此前已协助推进伊朗—美国间接谈判

𝕏 土耳其反对派领导层变动冲击股市

Ozgur Ozel被移除后土耳其反对派陷入动荡,土耳其股市下跌,埃尔多安的权力进一步集中。

𝕏 AI 安全协作或需反垄断安全港,OpenAI 与 Anthropic 成案例

Will RinehartDOJFTC提交意见,主张为 AI 安全协作设立反垄断安全港,避免未发布模型联合评估触发风险;OpenAI 与 Anthropic 的合作被视为案例。

美军将在日本部署堤丰中导系统

美军将在日本部署堤丰中导系统,这一动向可能改变西太平洋导弹部署格局。


📈 财经市场

𝕏 ⭐ SpaceX 提交 IPO 申请,或成史上最大 IPO 并收购 Cursor

SpaceX正式提交IPO文件,估值可能高达600 亿美元**。传闻计划以60 亿美元收购Cursor(年营收30 亿美元,交易结构包含15 亿美元现金及85 亿美元递延服务费,旨在强化 AI 软件层叙事。

𝕏 ⭐ Applied Digital 签下 75 亿美元 15 年租约,AI 工厂园区合同收入达 310 亿美元

Applied DigitalPolaris Forge 3园区签署15 年、75 亿美元租约,使其四个 AI 工厂园区总合同收入升至310 亿美元

𝕏 ⭐ 富途、老虎、长桥跨境互联网券商业务面临两年整治期

富途、老虎、长桥等互联网跨境券商被要求2 年整治存量业务,并关闭境内网站、交易软件和配套服务。

𝕏 ⭐ SpaceX 提交上市文件,或冲击史上最大 IPO

SpaceX已提交上市文件,市场关注其火箭、Starlink现金流和太空 AI 数据中心叙事;投资人需承担未验证技术风险。

𝕏 ⭐ Microsoft 达成 2.5 亿美元和解协议,解决 Activision Blizzard 收购案诉讼

Microsoft同意支付2.5 亿美元以解决针对其收购Activision Blizzard**的股东集体诉讼。这笔资金将用于补偿受该交易影响的Activision股东,标志着长达数年的法律纠纷即将落幕。

𝕏 沃什宣誓就任美联储主席,6 月议息会议成首个观察点

沃什宣誓就任美联储主席,未直接承诺降息;市场将观察6 月议息会议和点阵图变化。

𝕏 ⭐ Kevin Warsh 宣誓就任美联储主席

Kevin Warsh已正式宣誓出任美联储主席,接替Jerome Powell,将影响美国利率路径与全球资产定价。

𝕏 ChatGPT 答案中品牌链接增强后,推荐流量上升约 150%

Similarweb称自5 月 7 日起,ChatGPT 品牌链接更显著,来自ChatGPT的推荐访问量增加约150%

𝕏 OpenAI 向 YC 公司提供 200 万美元 API Credit 投资方案

OpenAI向当前YC公司提供200 万美元API credits,并以 uncapped SAFE 形式投资。

𝕏 富途盘前一度暴跌逾 41%,市值蒸发超 61 亿美元

富途控股盘前最低至72.92 美元,一度跌41.13%,市值蒸发约61.73 亿美元

𝕏 ⭐ Squid 完成 600 万美元战略融资,简化加密资产管理

跨链基础设施平台Squid宣布完成600 万美元战略融资,由North Island Ventures领投,Ripple等参投。Squid 原孵化于Axelar生态,本轮融资将用于推出消费者端产品。

证监会拟严厉处罚老虎、富途、长桥

证监会拟对老虎证券富途长桥采取严厉处罚,跨境互联网券商监管继续收紧。

𝕏 恒生科技指数将纳入 MiniMax-W 和智谱 AI

恒生科技指数将加入MiniMax-W智谱 AI作为成分股。

𝕏 富途监管消息前出现近 90 万美元深度虚值看跌期权交易

富途5 月 21 日四只 5 月 22 日到期看跌期权成交19828 张,金额近90 万美元

𝕏 美国利率期货交易员押注最早 10 月加息

美国利率期货交易员现在预计美联储最早可能在10 月上调政策利率

𝕏 老虎证券香港回应内地跨境证券整治:香港实体独立持牌运营

老虎证券香港首席运营官王珊称,公司持有香港证监会牌照,独立运营并受监管,相关通知不直接适用于香港实体。


🏭 工业能源

𝕏 美光弗吉尼亚工厂量产 1-alpha DRAM

美光在弗吉尼亚晶圆厂量产1-alpha DRAM,称其为美国本土最先进的内存技术;扩建完成后,该基地的DDR4 晶圆供应将增至4 倍,并与约2000 亿美元美国投资计划相配套。

𝕏 SpaceX 首次发射 Starship V3 并完成入轨滑行

SpaceX完成Starship V3首次试飞升空,官方确认 Raptor 热分离点火、上升段燃烧完成,飞船进入太空滑行阶段。

StarlinkHeleneMilton飓风期间交付1 万套设备,山火中帮助19.8 万用户,并在Melissa期间发送超200 万条短信,显示其正成为应急通信层。

𝕏 HBM 或拆出封装,光互连成下一代 AI 芯片关键战场

韩国存储厂正在与 GPU 客户讨论用光互连连接外置HBM,以突破20 层以上堆叠的良率和封装边界,被视为下一代 AI 芯片的重要技术方向。

𝕏 中国微短剧 2025 年用户达 6.96 亿

中国微短剧到 2025 年用户达6.96 亿、产值1000 亿元,截至 7 月带动133.3 万个就业岗位,成为内容产业和就业的重要增长点。

𝕏 法国投入超 10 亿美元发展本土量子计算

法国计划向本土量子计算投入超10 亿美元,以强化本土科研和产业布局;相关报道还提到美国准备约20 亿美元的量子资助方案作为对照。

𝕏 AMD 称 CPU 市场供应紧张,未来五年需求年增超 35%

Lisa Su表示CPU 市场供应偏紧,未来5 年需求年增有望超过35%AMD将按季度扩大供给,以缓解供需失衡。

𝕏 YC 公司 Synphony 用机器人采摘草莓切入加州市场

Synphony推出草莓采摘机器人,切入加州约30 亿美元市场;由于劳动力成本占比高达60%,而整个浆果市场规模约150 亿美元,自动化空间可观。

𝕏 华为展示 Ascend 950 SuperNode 运维方案

华为鲲鹏昇腾开发者大会展示Ascend 950 SuperNode集群运维方案,采用CLOS+Fullmesh架构,用于提升超节点的调度与维护能力。

𝕏 AST SpaceMobile 的 BlueBird 9 运往发射场

AST SpaceMobileBlueBird 9已从得州运往Cape Canaveral,将与 BlueBird 8 和 10 一起推进直连手机宽带网络部署。

𝕏 加州高铁成本升至 2310 亿美元

加州高铁项目成本升至2310 亿美元,折合该州平均劳动者约1.2 万美元税负,引发对项目可负担性和长期财政影响的讨论。

𝕏 PIIE 称中国制造业升级仍挤压发展中国家工业化空间

PIIE指出,中国在高端制造升级同时,仍大量保持服装、鞋类、玩具等低技能出口,这可能继续挤压其他发展中国家的工业化空间。

𝕏 美光 CEO 预计内存芯片短缺将延续至 2026 年后

Micron CEO 预计内存芯片短缺将持续到2026 年后,反映 AI 与数据中心需求仍在推高存储供给压力。

𝕏 Caitlin Kalinowski 谈 AI 硬件与机器人量产瓶颈

Caitlin Kalinowski回顾其参与MacBookMeta AR/VROpenAI硬件团队的经历,并讨论机器人量产瓶颈存储价格对 AI 硬件落地的影响。

𝕏 戴尔受益于 Agentic AI CPU 服务器需求

DellAgentic AI CPU 服务器需求受益,其传统通用服务器优势被放大;这类服务器共享组件、ASP 更高,正在成为 AI 基础设施的新增长点。

𝕏 中国商务部会见礼来、赛诺菲等外资药企

中国商务部礼来、赛诺菲、诺华、默克等外资药企举行会议,就在华合作、投资环境和产业发展进行交流,体现外资药企对中国市场的持续关注。

𝕏 特斯拉在保加利亚发布岗位为销售服务铺路

Tesla保加利亚发布多个新职位,为首次销售与服务落地做准备;公司上月已提交当地车辆销售和服务启动文件。

𝕏 AI 芯片 clock cycle 机制讲解

Reiner Pope解释 AI 芯片的clock cycle机制:电路以每秒数十亿次节奏同步状态,支撑训练和推理计算。


🧠 深度思考

𝕏 中国大模型公司掀起 AI 抢人大战

LatePost梳理中国大模型人才争夺:字节腾讯阿里DeepSeek围绕Qwen豆包等核心团队高价挖人,顶级研究员年薪已进入千万至亿元级,而 Infra 专家也可能把算力利用率提升约50%,显示头部公司正用薪酬和资源换取人才与算力效率。

𝕏 SemiAnalysis:智能体请求重写推理经济学

SemiAnalysis基于43.2 万个真实编码智能体请求分析发现,输入 Token 中位数已达9.6 万,约50%请求超过12.8 万,说明推理瓶颈正从“模型是否足够聪明”转向“如何承载长上下文、高频调用和持续执行”的经济学问题。

𝕏 红杉峰会判断 2026 年是智能体商业元年

150 位创始人参与、持续6 小时的闭门讨论后,红杉峰会得出的共识是:2026 年将成为长周期智能体商业元年,企业组织结构需要从“管理人”转向“接入智能体”,以适应新型协作方式。

𝕏 Dan Shipper:AI 廉价能力反而提高专家需求

Dan Shipper指出,AI 虽然把原本需要数小时的工作压缩到几分钟,但这反而提高了对人类专家的需求。以 Every 为例,团队从4 人扩到30 人,人的角色更像是定义问题、判断质量并制造差异化,而不是单纯执行。

𝕏 AI 正在推高验证成本

Balaji Srinivasan认为,AI 正在同时制造两种效应:一方面让代码、数学和生物医药等领域的产出成本下降,另一方面又显著抬高邮件、招聘、教育和身份验证的信任成本,诈骗和同质内容会变得更普遍。

𝕏 中美大模型生态走向安卓与 iOS 式分化

中国与美国的大模型生态正出现类似安卓iOS的分化QwenDeepSeekKimiGLM等更强调开源与商用自由,而GPTClaudeGeminiGrok则以闭源 API 和订阅为主,平台选择开始决定开发者的分发和商业模式。

𝕏 YC 访谈 Eric Ries:创始人如何保住控制权

Eric RiesYC讨论了股东至上、PBC、双重股权和董事会设计,以及Anthropic等公司常见的治理结构,核心问题是创始人如何在融资后仍保留足够控制权,让公司使命和长期目标不被短期资本冲淡。

𝕏 环境 AI 与智能体 AI 将重塑计算界面

ambient AI负责主动把信息推到用户面前,agentic AI负责替用户完成请求,两者的交界处将形成新的计算界面。这意味着未来交互不再只是应用按钮,而是环境感知、任务执行和持续反馈的结合。

𝕏 软件公司应让 AI 解决更高层级任务

Eoghan McCabe认为,AI 时代的软件公司不能只用生成式能力去增强旧功能,而应重新定义用户真正要完成的job-to-be-done,把产品重心放到更高层级任务上,才能避免被基础能力商品化。

𝕏 Jane Street 交易系统启示:速度不是唯一壁垒

Jane Street技术主管称,极端交易系统可在100 纳秒内处理信号,靠FPGA直连网络等工程手段抢时间,但真正壁垒并不只是速度,而是跨更长时间尺度的模型决策与风险管理能力。

𝕏 AI 成本正从低价工具走向任务分层

Aaron Levie认为,AI 的价格逻辑正从“便宜聊天工具”转向按任务分层的高成本智能体:简单问答可以很便宜,但需要长推理、外部工具和持续执行的任务会显著抬高成本,因此企业必须同时建立财务团队和技术方案来管理推理支出。

𝕏 AI 输出同质化让企业更需要世界观

相关讨论指出,AI 会迅速商品化“昨日能力”,如果企业缺少稳定的叙事框架世界观,AI 辅助生成的内容很容易沦为同质化的slop。真正的竞争力不只是调用模型,而是能否给模型提供判断标准与方向感。

𝕏 Demis Hassabis:语言模型需要世界模型

Demis Hassabis指出,纯语言模型只能处理文本,却无法完整表达重量、摩擦、动作反馈等现实约束;要让 AI 真正理解行为后果,仍需要把视觉、动作和物理规律结合起来的世界模型

𝕏 AI 裁员叙事可能掩盖估值修复压力

Jordi认为,部分公司把裁员归因于AI,但背后更常见的原因其实是估值回调、资源重配以及对新产品的投入优先级变化。也就是说,AI 叙事有时只是解释变化的外壳,不能自动等同于技术真的取代了岗位。

𝕏 AI 时代可能降低工程质量标准

Will McGuganClaude Code出现的文本换行 Bug 为例提醒,AI 开发正在把一些“差不多即可”的做法正常化。如果团队过度依赖生成式工具,可能在测试、审查和工程纪律上放松标准,进而拉低整体工程质量


📰 综合新闻

𝕏 SpaceX Starship 第十二次飞行测试进入第二次发射尝试

SpaceX表示,Starship 第十二次飞行测试进入第二次发射尝试,发射窗口定于美国中部时间17:30开启,目前天气有利率约85%。此次测试是 Starship 持续推进轨道级飞行验证的重要节点。

𝕏 Cloudflare 控制台出现 API 500/503 错误

Cloudflare控制台出现访问异常,页面持续抛出API 500/503错误,并反复自动重试加载。该问题可能影响用户进入控制台查看或管理相关服务,属于平台可用性异常。

神舟二十三号已完成发射前准备

神舟二十三号已做好发射前各项准备,任务进入中国载人航天发射前关键阶段。相关准备完成意味着后续将按计划推进发射流程,载人航天任务进展受到关注。

泰国长公主昏迷近 3 年半后病情恶化

泰国长公主在昏迷近3 年半后病情恶化,相关消息使泰国王室成员健康状况再次受到外界关注。此次病情变化属于王室健康动态的重要更新。

𝕏 喜马拉雅发现腹部带“笑脸”花纹的新蜘蛛物种

研究人员在印度喜马拉雅发现一种新蜘蛛物种,其腹部具有类似笑脸的花纹。此前,类似“笑脸蜘蛛”通常被认为仅存在于夏威夷,这一发现扩展了相关物种分布认知。


💡 生活建议

𝕏 大型长期研究显示儿童屏幕暴露与脑结构和 ADHD 症状相关

ABCD 研究纳入近1.2 万名儿童,结果显示,日常用于娱乐的屏幕暴露越多,儿童在脑结构上越容易出现差异,同时与ADHD 症状、注意力下降相关。研究提示,长期高强度屏幕使用可能影响神经发育,但仍需结合家庭环境与既往因素综合解读。

𝕏 自行药物流产风险案例:20 岁女孩严重感染或需切除子宫

浙江台州 20 岁女孩自行服用流产药后出现严重感染,医生提醒**药物流产并非越早越好,需先做B 超确认宫内妊娠、排除禁忌,并且一般只适用于怀孕49 天内**。若盲目用药,可能引发出血、感染,严重时甚至面临切除子宫的风险。

𝕏 JAMA Neurology:孕期毒死蜱暴露与儿童脑发育差异相关

JAMA Neurology发表的研究追踪纽约270 名儿童,发现孕期接触毒死蜱与后续脑结构差异、运动技能下降相关。研究提示,某些农药暴露可能对胎儿和儿童的长期脑发育产生影响,孕期应尽量减少接触高风险环境。


🔒 安全与隐私

𝕏 ⭐ Anthropic 称 Project Glasswing 已发现逾 1 万个高危或严重漏洞

Anthropic称其 AI 网络安全项目Project Glasswing上线一个月后,与伙伴在关键软件中发现超过1 万个高危或严重漏洞。

𝕏 Trump Mobile 确认泄露客户电话号码和家庭住址

Trump Mobile确认客户个人数据暴露,涉及电话号码家庭住址等敏感信息。

𝕏 独立 Discord 客户端支持屏蔽遥测与消息加密

Discord 独立客户端可阻止遥测数据并启用消息加密,面向重视隐私的用户。


由 X-Crawler AI 生成于 2026-05-23 09:06

EVENT-DRIVEN INTELLIGENCE

免费先看重点,Pro 再看速度、深度和可追踪性

这篇内容是公开入口。继续使用天眼时,固定沿着三条路径走:订阅每日情报、查看同主题历史上下文、升级 Pro 解锁事件追踪与研究能力。

分享

NEXT STEP · 留下邮箱

获取下一次重大事件提醒

每天一封精选情报,先用邮件帮你建立复访,再决定是否升级到更深的追踪能力。