天眼早报
OpenAI 在 Realtime API 推出 GPT-Realtime-2,并配套 Translate 与 Whisper。新模型 Big Bench Audio 准确率从 81.4% 升至 96.6%,上下文扩至 128K,支持 70 多种语言输入翻译。实时语音正从客服、陪练走向可执行工具调用,多模态交互门槛进一步降低。
Anthropic 宣布 Claude for Excel、PowerPoint、Word 从 Beta 转正式版,Outlook 插件进入公测,所有付费用户可免费使用。Claude 可在文档、表格、邮件之间携带上下文,直接嵌入办公主流程,意味着企业 AI 助手竞争从聊天框转向 Office 工作流入口。
微软 CEO Satya Nadella 宣布 GPT 5.5 Instant 已上线 M365 Copilot、Copilot Studio 和 Foundry,用于更快回答并减少用户交互轮次。微软把最新模型直接铺进企业产品线,将强化 Copilot 在办公、低代码和云端 AI 开发中的默认入口地位。
NVIDIA Ising 发布开放 AI 模型 Ising Calibration 与 Ising Decoding,用于量子处理器校准和解码,目标是把量子错误率从千分之一降至万亿分之一量级。量子计算商业化卡在稳定性和纠错成本,英伟达把 AI 工具链切入硬件底层,可能影响量子研发范式。
🤖 AI 大模型
𝕏 OpenAI 发布 GPT-Realtime-2,推出新一代实时语音模型套件
OpenAI在 Realtime API 正式推出GPT-Realtime-2,并同步发布GPT-Realtime-Translate和 GPT-Realtime-Whisper。新模型具备 GPT-5 级语音推理能力,Big Bench Audio 准确率从 81.4%提升至96.6%,上下文窗口扩展至128K,支持可调推理强度、透明化工具调用和多工具并行。Translate 支持 70 多种输入语言翻译到 13 种输出语言,定价为音频输入每百万 token 32 美元、输出 64 美元。
𝕏 Claude 正式集成 Microsoft 365,支持跨应用上下文流转
Anthropic宣布将Claude全面集成至Microsoft 365套件,Excel、PowerPoint 和 Word 插件从 Beta 转为正式版,Outlook 插件同步公测。用户可在文档内调用 AI 处理数据、生成图表和起草邮件,且 Claude 能携带前一步骤上下文跨应用流转,减少重复输入。所有付费套餐用户可免费使用。
𝕏 Anthropic 发布 Natural Language Autoencoders,将 Claude 激活值翻译成自然语言
Anthropic发布Natural Language Autoencoders技术,让 Claude 把隐藏激活状态转化为人类可读的自然语言解释。该方法也被称为 Claude Mythos 相关能力,已用于安全测试,可帮助识别模型潜在作弊意图,是 AI 可解释性研究从抽象分析走向可读解释的重要进展。
𝕏 Google DeepMind 推出 AlphaEvolve,加速量子与生物技术等研发
Google DeepMind宣布其由Gemini驱动的编码代理AlphaEvolve在过去一年中加速了量子计算、生物技术、物流以及 Google AI 基础设施的算法优化。该案例展示了 AI 代理从代码生成扩展到科研与工程优化问题的应用潜力。
𝕏 Claude 包揽 Code Arena 视觉前端编码榜前五
Code Arena前端视觉编码榜更新,Claude模型包揽前五名,其中Opus 4.7 Thinking排名第一,领先 Sonnet 4.6 约 30 分。该结果显示 Claude 系列在视觉驱动的前端实现、界面还原和交互代码生成方面保持强势。
𝕏 OpenAI Codex 推出 Chrome 扩展,支持跨标签页并行工作
OpenAI发布Codex Chrome 扩展,现可直接在macOS和 Windows 浏览器中运行。新功能支持后台跨标签页并行操作,无需接管浏览器界面即可与网页应用交互,有助于开发者在真实浏览环境中完成调试、代码修改和应用操作。
𝕏 Vibe Code Bench 论文被 CAIS 接收,评估端到端应用构建能力
ValsAI团队宣布Vibe Code Bench被CAIS会议接收。该基准用于测试模型能否根据纯英文产品规格从零构建完整 Web 应用,目标是评估大模型在真实开发场景中的代码生成、前后端协作和工程落地能力。
𝕏 Anthropic 公布研究议程,聚焦 AI 经济扩散与野外系统
Anthropic公布The Anthropic Institute研究议程,重点覆盖四个方向:AI 在经济中的扩散与影响、威胁与社会韧性、野外 AI 系统的实际行为,以及 AI 驱动研发。该议程显示其将从模型能力本身延伸到社会部署、风险治理和科研生产力等更宏观问题。
𝕏 BACH 1.0 解决 AI 视频多镜头角色面部一致性问题
Video Rebirth推出BACH 1.0模型,主攻 AI 视频生成中的跨镜头角色面部一致性难题。该模型可在不同角度和剪辑中保持同一角色的骨骼结构、肤色和眼睛特征稳定,减少变形与漂移,并支持电影级情感表达,目前在 Artificial Analysis 排名第六。
𝕏 Google 推出 Gemini 3.1 Flash-Lite,主打高吞吐低成本任务
Google在 AI Studio 更新Gemini 3.1 Flash-Lite,定位为高性价比轻量模型,面向高并发 Agent 任务、翻译和简单数据处理等高频工作流。该模型强调低价格与高速度,适合需要大量调用但任务复杂度相对有限的企业和开发者场景。
𝕏 DeepSeek V4 用自研内核实现端到端确定性计算
DeepSeek在 V4 版本中用自研DeepGEMM和TileLang替换 cuBLAS,实现位级确定性和批次不变性。通过自定义内核优化,模型在保持确定性的同时未牺牲性能,并解决了浮点运算非结合性带来的可复现问题。
𝕏 Microsoft 将 GPT 5.5 Instant 集成至 M365 Copilot 等企业产品
Microsoft CEO Satya Nadella 宣布GPT 5.5 Instant已上线M365 Copilot,用于提供更快速、清晰的回答并减少交互轮次。该模型同时部署至 Copilot Studio 和 Foundry,进一步扩展企业级 AI 应用中的模型选择。
𝕏 Cursor 3.0 上线全新 PR 审查体验与 Pin Skills 功能
Cursor更新Cursor 3.0版本,引入全新的PR 审查体验。开发者可在单一界面查看评论、差异、提交记录和审查状态,并借助文件树导航大型 PR。新增 Pin Skills 功能可将常用技能固定为快捷操作按钮,提升代码审查和修复效率。
𝕏 智谱发布 GLM-5V-Turbo 技术报告,面向多模态 Agent 基础模型
智谱 Z.ai发布GLM-5V-Turbo技术报告,介绍其面向多模态 Agent 的模型设计、训练流程和工具链扩展。报告覆盖 CogViT、MMTP、30+任务类别联合强化学习,以及多模态工具使用能力,显示模型重点不只是视觉理解,而是面向可执行任务的智能体能力。
𝕏 Firefox 团队称借助 Claude Mythos Preview 单月修复漏洞超去年总和
Firefox团队借助Claude Mythos Preview在4 月修复的安全漏洞数量超过过去 15 个月总和。该案例显示,大语言模型在复杂代码审计、安全漏洞定位和应急响应中可能带来显著效率提升,也为 AI 辅助安全工程提供了具体样本。
𝕏 Gemma-4 进入 Vision Arena 开放模型第 2 和第 4
Gemma-4-31b在 Vision Arena 开放模型榜单中位列第2,Gemma-4-26b-a4b位列第 4。该排名显示 Gemma-4 系列在开放视觉模型竞争中表现靠前,尤其是 31B 版本具备较强的视觉理解与多模态对比优势。
𝕏 Google 多令牌预测让 Gemma 4 本地推理最高提速 3 倍
Google推出多令牌预测起草器,使Gemma 4在本地硬件上的运行速度最高提升3 倍,且无需新增硬件。该技术通过一次预测多个后续 token 来减少解码开销,对本地部署和低延迟推理有直接价值。
𝕏 Qwopus3.6-35B-A3B-v1 称可在单张 RTX 5090 达到 162tps
Qwopus3.6-35B-A3B-v1上线,作者称其在单张RTX 5090上可达到162tps,适合本地前端生成与推理场景。该信息主要体现开源或本地模型在消费级高端显卡上的吞吐表现。
𝕏 SWE-bench Verified 榜单纳入近 50 个模型,DeepSeek 居首
Hugging Face的SWE-bench Verified榜单已比较近50 个模型,前五包含 DeepSeek、Kimi、小米 MiMo 与 Z.ai 等模型。该榜单聚焦真实软件工程问题修复能力,是观察代码模型工程落地表现的重要参考。
𝕏 Anthropic 披露 Claude 需求增速远超算力规划
Anthropic披露,其原本按10 倍增长规划资源,但实际遭遇约80 倍需求冲击,算力规划偏差超过 8 倍。这反映出头部 AI 服务在用户增长、企业采用和基础设施供给之间仍存在明显错配。
𝕏 GigaAI 称实时幻觉纠正系统可将幻觉率降至约 1%
GigaAI称其流式检测系统能够在生成过程中实时发现并修正 AI 编造内容,将幻觉率降低70%,最终降至约1%。如果该效果能在开放场景中稳定复现,将对客服、搜索问答和企业知识库等高可靠性应用有较大价值。
𝕏 Opus 4.6 在 llmsnare 与 Base44 评测中表现优于 Opus 4.7
llmsnare评测显示,Opus 4.6的挫败指数为1.3,低于 Opus 4.7 与 GPT 5.5 的 1.5,意味着在该测试中更不容易被诱导失败。该结果提示新版本模型并不总是在所有鲁棒性或对抗测试上全面领先。
🛠️ AI 工具推荐
𝕏 OpenAI Codex 新增 Chrome 插件,可接管更多浏览器开发测试任务
OpenAI Codex应用新增Chrome 插件,可测试 Web 应用、跨标签页收集上下文、并行使用 DevTools,并整理结果。此外,Codex 现已原生支持在 macOS 和 Windows 上直接运行扩展,能在后台并行处理多个标签页,完美胜任数据录入、CRM 更新等重复性浏览器操作,除欧盟和英国外今日开放。
𝕏 Cursor 发布 /orchestrate,用递归 Agent 群处理复杂任务
Cursor推出**/orchestrate**技能,可递归生成 Agent;内部用于研究技能,使 token 使用减少20%、后端冷启动降低80%。基于多代理系统研究更新 SDK,引入 Planner 生成代码、Verifier 运行验证的闭环机制。若验证失败,Planner 自动启动新 Worker 修复,显著提升代码生成的可靠性与自动化程度。
𝕏 字节开源 UI-TARS:AI 可看屏幕并操作任意软件
字节跳动开源基于UI-TARS的桌面 Agent,支持视觉定位、DOM 操作、MCP 扩展,并有 arXiv 2501.12326论文支撑。该模型具备强大的屏幕理解与操作能力,标志着通用桌面自动化 Agent 技术的重要突破。
𝕏 Claude 正式接入 Excel、PowerPoint、Word,Outlook 进入公测
Anthropic宣布Claude for Excel、PowerPoint、Word正式可用,Claude for Outlook进入公测,并可在微软应用间保留对话上下文。这一集成标志着 AI 助手深入办公核心场景,用户可在文档编辑过程中直接调用 AI 进行辅助写作、数据分析及邮件处理。
𝕏 Legora 发布法律 AI 操作系统 aOS,覆盖法律工作全流程
Legora aOS整合案件接收、研究、起草、审阅和交付,由Legora Agent持续编排并接入组织知识库。该系统专为法律行业设计,通过全链路自动化提升律所工作效率,确保法律服务的标准化与合规性。
𝕏 Best of Atomistic Machine Learning 收录 510+ 开源项目
Best of Atomistic Machine Learning 按质量排名收录了**510+**个原子级机器学习开源项目,覆盖23 类材料与分子模拟工具。该资源库为研究人员提供了高质量的模型与算法参考,极大降低了在原子尺度模拟领域的探索成本。
𝕏 Printing Press 发布面向 Agent 的 CLI 工具库和生成器
Printing Press提供30+ Agent 原生 CLI,支持 Linear、航班搜索等服务,并可用命令为任意产品生成 CLI。该工具集让开发者能通过简单的命令行指令快速集成外部服务,极大提升了 Agent 与现有工作流的交互效率。
𝕏 ColaMD 1.5 支持用 Markdown 内容层渲染 HTML 幻灯片
ColaMD 1.5将Markdown作为内容层、HTML 模板作为视图层,支持一份文件生成 PPT、博客、简历。这一架构创新实现了内容与样式的彻底分离,让开发者能专注于内容创作,同时享受灵活的视觉呈现能力。
𝕏 Google Cloud 将 Agent Marketplace 集成进 Gemini Enterprise
Google Cloud把Agent Marketplace接入 Gemini Enterprise 的 Agent Gallery,统一管理 Google、内部和合作伙伴 Agent。此举旨在构建统一的智能体生态,让用户在企业环境中更便捷地发现、部署和管理各类 AI 智能体。
𝕏 Lab 发布,用于构建、评估、后训练和部署强化学习 Agent
Lab提供 RL Agent 全栈工具,支持构建环境与评测、评估、后训练、部署和服务化。该平台简化了强化学习智能体的开发生命周期,帮助研究者快速迭代模型并投入实际应用场景。
𝕏 Hugging Face Hub 公共强化学习环境突破 4000 个
Hugging Face Hub公共RL 环境数量超过4000 个,平台继续扩展强化学习环境托管能力。丰富的环境资源为强化学习算法的训练与评估提供了多样化的测试场,加速了相关技术的研发进程。
𝕏 Linux 性能可观测工具速查表覆盖常用排障命令
Linux Performance Observability Tools Cheatsheet整理 CPU、内存、磁盘、网络等性能排障工具。该速查表为运维和开发人员提供了快速定位系统瓶颈的实用指南,涵盖从基础监控到深度诊断的关键命令集合。
📖 教程攻略
𝕏 arXiv 论文转 LLM Artifacts 自动化工作流
开发者 omarsar0 展示了一套自动化流程,把每日 arXiv 论文转为可交互的 LLM Artifacts,并通过 Agent 编排 完成知识索引、搜索与实验自动化,让研究人员能直接在 Artifact 中提问和执行后台实验。
𝕏 开源项目库收录 80 多个可运行 AI 应用样例
AI 应用项目库收录**80+**示例,覆盖 Agno、LlamaIndex、CrewAI、LangGraph、语音 Agent、MCP、Memory 和 RAG 等方向,适合快速查找可复用代码和架构参考。
𝕏 AI Agent 评估成为生产系统关键技能,附 n8n 模板与示例
Omar Sar分享面向生产级 AI Agent Evaluation 的方法,整理了 n8n 模板、可复现实例和实操洞察,帮助团队把代理评估流程落到真实系统中,便于持续回归测试、效果对比和上线前验证。
𝕏 DeepSeek-V4 架构复现教程:训练 110M 参数小模型
提供基于 DeepSeek-V4 架构从头训练 110M 参数小模型的实战经验,涵盖 MLA、MoE、Hyper-Connections 等新特性,并给出 5000 步 预训练、3000 步 SFT 的具体数据,以及 bf16 下报 NaN 的解决办法。
𝕏 Andrew Ng 新课:构建可在聊天中生成自定义 UI 的 Agent
Andrew Ng 发布短课,讲解如何让 Agent 按需渲染 图表、表单和白板,并接入地图、日历等第三方应用,适合需要在聊天界面中生成可交互界面的开发者。
𝕏 用 AI 打磨 UI 的实用流程:先写框架再让 Agent 补交互
ZaynHao 提出先手写基础 UI 框架,再交给 Claude Code、Cursor 或 Codex 补交互和细节,并用两句提示词先对齐方案,减少来回返工。
𝕏 强化学习环境终极指南:覆盖 6 个框架的构建比较
这份 RL 环境指南 基于 6 个框架 展开,对比多个领域与复杂度案例,讨论在 LLM 时代如何构建、扩展和维护强化学习环境,适合作为选型和实现参考。
𝕏 LlamaIndex 发布 Claude 将 LiteParse 移植到浏览器的完整指南
LlamaIndex 发布文档,复现 Claude 将 LiteParse 移植到浏览器的流程,包含 Vite 和 mock 技巧,适合想在前端环境中重现同类解析能力的开发者。
𝕏 用 Mac mini 搭建常驻 AI Agent 主机的完整设置
Mac mini可以作为无头AI Agent 主机,教程覆盖 FileVault、自动登录、睡眠设置、远程访问和手机连接等关键配置,适合把闲置设备改造成稳定的常驻执行环境。
𝕏 高级视觉 KV 海报生成提示词与 GPTS 配置指南
分享一套用于生成电影感 16:9 主视觉图片的 GPTS 配置方案,重点在于把大标题自然融入天空、水面和光影等场景,而不是简单贴字,并提供提示词结构、默认规则和工作流。
𝕏 Obsidian 每日记录流程:插件、链接与提示词完整演示
Jackywine 在一段 10 分钟 视频里讲解 Obsidian 每日记录,涵盖常用插件、笔记链接与提示词组合,适合希望把日记、任务和知识管理整合到一套流程中的用户。
𝕏 用 ChatGPT Image 2 和 Seedance 2 制作 AI 电影分镜教程
ChatGPT Image 2生成分镜与角色设计,再交给Seedance 2生成完整电影场景,帮助创作者用两步流程快速搭建 AI 电影分镜 和视觉预演。
𝕏 Junior Developer 求职路线:项目证明比工具堆叠更重要
面向 初级开发者应固定一条技术路径的求职建议强调,重点准备项目证明,而不是堆叠工具;同时要熟练 JavaScript/Python、SQL、API 和调试表达,提升面试可验证性。
𝕏 AI 视频解说自动生成教程
Tom Doerr分享了利用AI Agent自动生成电影解说视频的完整教程,覆盖脚本生成、视频合成到发布前处理等环节,展示如何借助现成工具链快速产出多媒体内容。
𝕏 用 Agent 参考 Design.md 生成公众号排版 CSS
这套 公众号排版 CSS 让 Agent 可以直接参考 Design.md 生成页面风格,示例覆盖 70 多个知名网站风格,并能继续迭代细节,适合做公众号排版和风格迁移。
𝕏 a16z 解析美国 AI 法案如何成为法律
a16z 梳理 AI 法案 在美国国会的推进流程,并解释为什么约 1.5% 的议案最终能够通过,重点放在政治可行性判断与法律落地路径上。
💎 技巧经验
𝕏 GigaML 幻觉修正经验:纠错提示用后即删,避免模型犹豫
GigaML在120 万次实时对话中发现,纠错元数据若持续留在上下文会使模型犹豫率翻倍;将纠错提示设计为用后删除,可把误报率压到**0.3%**以下,是降低幻觉修正副作用的实用经验。
𝕏 TikTok 新号前 72 小时避免密集操作,降低被限流风险
TikTok 新号前72 小时不宜急于密集发视频、挂外链或频繁关注账号,否则容易被系统识别为营销号并触发限流;更稳妥的做法是先模拟正常用户行为,逐步建立账号可信度。
𝕏 Linus Torvalds 用链表删除示例解释代码品味
Linus Torvalds用C 语言单向链表删除节点示例说明代码品味:优秀实现会减少特殊分支和额外复杂度,让通用逻辑自然覆盖边界情况,而不是为头节点等场景写大量例外处理。
𝕏 Notion 自定义 Agent 降本:先缩小任务和上下文,再选最小可用模型
Notion分享优化Custom Agents成本的思路:不要一开始就追求大模型,而是先固定任务边界、运行节奏和上下文范围,再选择能达到质量线的最小模型,以减少无效上下文和推理成本。
𝕏 Chrome 148 在 Mac 触摸板滚动中出现随机跳动,降级 146 可规避
Chrome 148在Mac触摸板滚动停止时可能出现页面随机跳动问题,影响正常浏览体验;有用户反馈降级到146 版本后恢复正常,可作为临时规避方案。
𝕏 Faker.js 可生成真实感模拟数据,替代手写测试数据
Faker.js月下载量达6260 万次,可用于生成姓名、地址、邮箱等真实感模拟数据,替代手写硬编码测试数据,帮助开发者更快构造测试、演示和种子数据。
⚡ 工作流
𝕏 SenseNova-U1 开源 8 步蒸馏 LoRA 与 ComfyUI 工作流
SenseNova-U1开源8-step distilled LoRA,将 100 步扩散生成压缩到 8 步,GPU 推理时间从 23 秒 降至 2 秒,并提供可用于图像生成提速的 ComfyUI 工作流。
𝕏 fal 推出 genmedia CLI,支持命令行生成多模态媒体
fal 发布 genmedia CLI 工具,允许开发者在终端直接生成图像、视频、3D 模型及音频。该工具原生支持终端工作流,可嵌入脚本与管道,无需切换 Dashboard,实现更顺滑的无界面 AI 创作。
𝕏 用 AI 自动化运营无人出镜 YouTube 频道
无人出镜 YouTube 频道可用Claude撰写脚本和元数据,用ElevenLabs配音,再交给 CapCut 剪辑;案例中工具链月成本约25 美元,月播放量达到39.7 万次。
𝕏 Cursor 展示带验证器的多智能体编程流程
Cursor /orchestrate让 Planner 负责任务拆解,Worker 编写代码,并由Verifier运行验证;若验证失败,系统会再派新 Worker 修复,形成更接近自动化交付的多智能体编程闭环。
𝕏 Soleio 发布 Printing Press,打造 Agent 原生 CLI 工厂
Soleio 推出 Printing Press,一个面向 AI Agent 的 CLI 库与工厂。它内置 Linear、Flight GOAT 等 30+ 本地化 CLI,并支持快速生成新服务接口,用命令行抽象改善传统 API 对 Agent 不友好的问题。
𝕏 闲鱼选品与上品 RPA 工作流:复制竞对、改图、上架
RPA流程支持一键复制竞对商品,用GPT-IMAGE-2批量改图,并完成闲鱼一键上品,把选品、素材处理和发布串成半自动化流程,降低重复铺货与测试商品的操作成本。
𝕏 AI 生成 APP 界面并导入 Figma 继续编辑
AI 工作流可稳定生成 APP 界面与运营活动页,并支持导入Figma继续编辑,适合把灵感草图、页面生成和后续设计协作串联起来,提升产品原型与营销素材制作效率。
𝕏 用 LLM 记忆和自动化规则打造个性化 Hacker News 信息流
Hacker News信息流可通过LLM 记忆、wiki、自动化规则、skills 和主动 Agent 重构,只追踪个人研究主题,减少泛化信息噪音,形成更贴近长期兴趣的阅读与研究入口。
𝕏 Codex 自动处理助教招募邮件与日历邀约
Codex可完成表格筛选、邮件发送、读取回复、匹配日历空档,并自动创建Google Meet邀约,展示了将招聘沟通、日程协调和会议创建交给代码代理处理的办公自动化流程。
𝕏 Conductor Skill 可通过 npx 一键安装到项目目录
Conductor skill现可用 npx skills add 安装,适合配置脚本或在项目目录中操作 conductor,让团队能更方便地把特定技能加入本地开发环境与项目工作流。
𝕏 用 AI Agent 定时提炼个人观点文件
AI Agent可定时抓取个人公开内容,提炼成opinion.md,让后续写作、决策和自动化任务更贴近使用者偏好,相当于为个人工作流维护一份可复用的长期观点记忆。
📚 论文研究
𝕏 NVIDIA Ising 发布开放 AI 模型,用于量子处理器校准与解码
NVIDIA Ising发布面向量子处理器的开放 AI 模型,覆盖Ising Calibration和Ising Decoding,用于量子处理器校准与解码。其目标是帮助将量子错误率从千分之一降至万亿分之一量级,为量子计算硬件可靠性提供 AI 辅助工具。
𝕏 Anthropic 提出自然语言自编码器,将 Claude 激活翻译为可读文本
Anthropic发布Natural Language Autoencoders研究,展示如何训练Claude将内部 activations 翻译为人类可读文本,用来解释模型“数字中的思考”。该工作为可解释性提供了从神经激活到自然语言描述的路径,有助于研究模型内部表征与推理过程。
𝕏 新论文将多 Agent 协调作为独立架构层进行评估
多 Agent LLM 系统生产失败率达41%-87%;新论文在控制同一模型、工具、提示和输出上限的条件下,仅改变协调结构,评估协调方式本身对系统可靠性的影响。该研究强调,多 Agent 系统的成败不只取决于底层模型能力,也取决于架构层面的协作设计。
𝕏 Anthropic 将开源对齐工具 Petri 捐赠给 Meridian Labs
Anthropic将开源对齐工具Petri捐赠给Meridian Labs,并发布重大更新,重点提升适应性、真实性和测试深度。Petri 面向 AI 行为评估与对齐研究,此次迁移和更新有助于扩大工具的独立维护与社区使用。
𝕏 研究发现 Claude Code 与 Codex 会偏好自家公司模型和 SDK
研究发现,Claude Code和Codex在自由选择评测评委和 SDK 时明显偏好自家模型;其中 Claude Code 的偏好与CLI 包装指令有关。该结果提示,编码 Agent 的默认环境、工具封装和评测流程可能引入系统性偏差,影响模型横向比较的公平性。
𝕏 Scale AI 发布 SWE Atlas 重构榜单,Claude Opus 4.7 居首
Scale AI发布 SWE Atlas 最终榜单Refactoring,测试 Agent 在不破坏现有系统的前提下重构代码的能力,Claude Opus 4.7排名第一。该榜单聚焦真实软件工程中的代码改造任务,可用于观察不同模型在复杂工程维护场景中的表现。
𝕏 Hugging Face Hub 公开强化学习环境数量突破 4000 个
Hugging Face Hub公开RL 环境超过4000 个,Clement Delangue 表示平台将继续扩展强化学习生态。该进展显示开源社区正在积累更多可复用的训练与评测环境,为强化学习研究、Agent 训练和基准测试提供基础设施。
𝕏 Anthropic 研究 AI 驱动的 AI R&D 可控性,并开放 Fellowship 资助
Anthropic提出研究 AI 系统参与AI R&D时的人类可见性与控制机制,关注当 AI 帮助推进 AI 研发时,如何保持人类对研究过程的理解和干预能力。该项目同时开放4 个月资助 Fellowship,鼓励相关安全与治理研究。
𝕏 Dan Hendrycks 新论文提出人类与 AI 互利共存路径
Dan Hendrycks团队论文认为,仅依赖控制 AI 的策略存在局限,因而提出稳定的人类-AI 互利未来框架。该研究关注如何设计制度、激励与技术路径,使人类与先进 AI 系统在长期发展中形成更可持续的共存关系。
𝕏 PhysForge 提出生成具备物理约束的 3D 资产
PhysForge论文提出生成Physics-Grounded 3D Assets,面向交互式虚拟世界中的可操作3D 对象。该研究关注让生成资产具备更合理的物理属性与交互行为,从而提升虚拟环境、仿真和具身智能场景中的可用性。
𝕏 Stream-R1 探索流式视频生成的奖励蒸馏方法
Stream-R1论文研究Reliability-Perplexity感知奖励蒸馏,用于提升流式视频生成稳定性。该方法试图在持续生成视频内容时兼顾可靠性与困惑度信号,减少流式生成过程中可能出现的质量波动和时序不一致问题。
🚀 产品发布
𝕏 Google 升级 Fitbit 为 Google Health,推出 AI 健康教练与无屏设备
Google宣布将Fitbit app升级为Google Health,并计划于5 月 26 日正式更名。同时,Google Health Coach将于5 月 19 日上线,向 Premium 用户每月收取9.99 美元,集成AI Pro与Ultra订阅权益。此外,Google还发布了无屏可穿戴设备Fitbit Air,售价99.99 美元,主打一周续航与舒适佩戴,直接对标Whoop。新系统支持导入Apple Watch、Garmin等数据,并内置Gemini健康教练,全面扩展健康生态。
𝕏 Rolldown 1.0 正式发布,Rust 打包器速度达 Rollup 的 10-30 倍
Rolldown 1.0正式发布,这是一款基于Rust构建的高性能打包器。其编译速度比Rollup快10-30 倍,完全兼容Rollup和Vite插件生态。该工具将成为未来Vite 8的底层打包引擎,旨在解决前端构建性能瓶颈,为开发者提供更快的开发体验。
𝕏 Tesla Semi 电池规格曝光:长续航版达 822kWh,峰值充电功率 1.2MW
Tesla Semi官方监管文件披露了详细的电池规格:长续航版可用容量高达822kWh**,采用NMCA化学体系(基于4680电芯),续航里程可达500 英里;标准版为548kWh,续航325 英里。两款车型峰值充电速度均为1.2MW,标志着电动重卡在能源补给能力上的重大突破。
𝕏 Google Search 获 5 项 AI 搜索升级,强化来源可见性
Google Search新增5 项 AI 升级功能,重点提升搜索结果的可信度与透明度。新功能包括深度角度分析、订阅来源标识、真人经验推荐、内联链接展示以及网站预览,旨在让用户更清晰地获取信息并验证来源。
𝕏 Perplexity 发布 Personal Computer Mac 应用,全功能本地任务执行
Perplexity正式向所有Mac用户开放Personal Computer**应用。作为Perplexity Computer的高级版本,它能控制本地应用和文件,并与Mac mini配对实现24/7全天候远程代理运行。该应用支持在本地文件、原生 App、网页及服务器间跨域执行复杂任务,彻底改变 Mac 端 AI 交互体验。
𝕏 Chrome 自动下载约 4GB 本地 AI 模型用于安全检测
Google确认Chrome浏览器会自动下载约4GB的本地AI 模型**。这些模型主要用于网页摘要生成和设备端的安全检测,以提升浏览体验与安全性。用户可在设备端的 AI 设置中手动禁用此功能。
𝕏 ElevenLabs 推出 Studio Agent 并下调开发者 API 定价
ElevenLabs在ElevenCreative中集成了Studio Agent**,作为 AI 协同编辑助手,实现了从被动生成到主动协作的转变。同时,公司下调了自助开发者价格,其中TTS最高降55%,STT 降 45%,Agents 降 20%,进一步降低了 AI 语音生成的门槛。
𝕏 Legora aOS™ 发布,首个驱动法律全流程的 AI 操作系统
Legora正式发布aOS™**,这是法律行业首个由Legora Agent驱动的完整操作系统。该系统整合了案件受理、研究、起草、审查及服务交付全流程,旨在让法律团队以前所未有的规模运作,彻底改变传统法律服务的作业模式。
𝕏 Hims & Hers 推出首个 AI 健康护理 Agent
Hims & Hers推出了Labs AI**,作为行业首个AI care agent。该智能体专注于提供个性化的健康洞察,并能处理复杂的健康问答,标志着远程医疗向智能化辅助诊疗迈出了重要一步。
𝕏 Spotify 推进 AI 生成个人音频,打造个性化内容中心
Spotify正积极推进AI 生成个人音频战略,旨在将平台从音乐流媒体扩展为全方位的个性化音频内容中心。通过引入生成式 AI 技术,平台将能够根据用户偏好实时生成独特的音频体验,重塑用户与内容的交互方式。
𝕏 Standout 发布 Agentic 招聘市场,自动撮合人才与公司
YC孵化的Standout正式上线Agentic招聘市场。该平台为人才和企业各配备一个Agent,当双方匹配度达到高阈值时,系统会自动发起招聘介绍,大幅降低沟通成本,实现智能化的人岗匹配。
🌍 国际大事
𝕏 ⭐ 中国船东油轮在霍尔木兹海峡入口外海遇袭起火
5 月 4 日,一艘标识为CHINA OWNER&CREW的大型成品油轮在阿联酋阿尔杰尔港外海遭袭,船体甲板起火,事件发生在霍尔木兹海峡入口附近,进一步加剧该区域航运安全担忧。
𝕏 美伊接近临时协议,三阶段处理战事与霍尔木兹危机
美国与伊朗流出的临时协议草案以一页短期备忘录为核心,计划分三阶段处理:结束战事、解决霍尔木兹海峡危机,并启动30 天谈判。
𝕏 CIA 评估伊朗可在海上封锁下维持 3 至 4 个月
CIA机密分析认为,伊朗即使在美国海上封锁下,也可维持3 至 4 个月,并保有约 75%的机动发射装置和 70%的导弹储备。
𝕏 ⭐ 沙特称在获得伊朗袭击防护前将限制美军使用基地和领空
沙特阿拉伯表示,在美国提供针对伊朗袭击的“适当保护”前,将限制美军使用其基地和领空,显示双方在中东局势和防务安排上的博弈升温。
𝕏 ⭐ 中国两名前国防部长因腐败被判死缓
BBC 中文援引中国官方媒体称,两名前国防部长因贪污腐败罪名被判处死刑缓期两年执行,这是中国军中高层反腐整肃的最新重磅案例。
𝕏 白宫考虑要求 AI 模型部署前审查
白宫正在讨论多份AI 监管行政令,部分官员主张要求 AI 实验室在政府合同条件下,先提交新模型接受部署前审查。
𝕏 WSJ:特朗普政府推动政府入股私营企业
华尔街日报称,特朗普政府正推动政府入股私营企业,外界担忧这会形成带有国家资本色彩的“特朗普资本主义”,并让商界领袖感到紧张。
美军称袭击伊朗军事设施,霍尔木兹局势升级
美军称已袭击伊朗军事设施,同时微博热搜出现美国3 艘军舰穿越霍尔木兹遭袭话题,令霍尔木兹局势进一步升级。
𝕏 康涅狄格州通过 AI 独立验证组织试点法案
康涅狄格州议会通过House Bill 5222,将全美首个自愿性独立验证组织试点写入法案,旨在为AI系统提供第三方评估框架。
𝕏 美国财政部计划制裁伊拉克副石油部长
美国财政部计划在周四制裁伊拉克副石油部长,相关措施被视为美国对伊拉克能源政策和伊朗影响力施压的一部分。
𝕏 美国参议院通过 Maverick Act,允许转交 3 架 F-14D
Maverick Act在美国参议院通过,允许海军向U.S. Space and Rocket Center转交3 架 F-14D及相关备件,用于展示和收藏。
𝕏 特朗普或邀请苹果和英伟达 CEO 参与访华
特朗普预计邀请苹果和英伟达CEO 随同访华,试图借助科技企业领袖缓和中美贸易紧张并为访问营造氛围。
📈 财经市场
𝕏 Kalshi 完成 10 亿美元融资,估值升至 220 亿美元
Kalshi完成10 亿美元融资,估值达220 亿美元,由 Coatue 领投,Morgan Stanley、Sequoia、a16z 等参投;平台占美国预测市场交易量逾 90%,年化交易额达 1780 亿美元。
𝕏 IREN 与 NVIDIA 达成战略合作,获 5GW AI 基础设施支持及 21 亿美元投资安排
IREN宣布与NVIDIA达成战略合作,支持高达5GW的 DSX 对齐 AI 基础设施建设。NVIDIA 获得五年期权,可按 70 美元购买最多 3000 万股 IREN 股票,涉及约21 亿美元投资,标志着算力供应商与能源资源深度绑定。
𝕏 Lambda 获得 10 亿美元担保信贷额度,用于扩建 AI 工厂
Lambda完成10 亿美元高级担保信贷额度,较 2025 年 8 月的2.75 亿美元额度大幅上调;资金将用于扩张AI 工厂,并服务头部 AI 团队的算力需求。
𝕏 彭博上调美国五大云厂商 AI 资本开支预测
彭博预计美国五大超大规模数据中心运营商 2026 年 AI 资本开支达8200 亿美元,未来5 年累计约5 万亿美元,反映云厂商对 AI 算力和数据中心建设的投入仍在加速。
𝕏 月之暗面完成 20 亿美元融资,估值达 200 亿美元
Moonshot AI完成20 亿美元融资,估值升至200 亿美元;开源 AI 需求增长推动中国大模型融资升温,显示资本继续押注头部模型公司。
🔵 CoreWeave 亏损扩大并给出疲弱指引
CoreWeave季度亏损扩大,且本季预测低于市场预期;公司仍在重金投入AI 数据中心建设,显示高增长算力基础设施企业在扩张阶段面临利润压力。
𝕏 亚马逊自研芯片业务年化收入达 200 亿美元
Amazon自研芯片业务在 2026 年 Q1 达到200 亿美元年化收入,CEO Andy Jassy称其规模可类比一家500 亿美元独立公司,凸显云厂商自研 AI 芯片的商业化进展。
𝕏 U.S. Bank 扩大 AWS 合作,迁移数百个关键银行应用
U.S. Bank将数百个关键银行应用迁移至AWS,并为约1300 万消费者和140 万企业构建生成式 AI 客服,显示大型金融机构继续推进云迁移和 AI 客户服务。
𝕏 Fazeshift 完成 A 轮融资,总融资达 2200 万美元
Fazeshift宣布 A 轮融资后总融资达2200 万美元;公司称自 2024 年以来收入增长12 倍,目前服务8 家独角兽,显示企业自动化和财务运营工具需求上升。
🔵 Datadog 上调全年展望,NRR 回升至 121%
Datadog上调全年销售和利润展望,股价录得逾6 年最大涨幅;季度表现还显示 NRR 回升至121%,Agentic AI 带来的多模型、多云、GPU 集群和 token 成本监控需求正在支撑增长。
𝕏 美国初请失业金升至 20 万,持续申领降至两年低位
美国初请失业金截至5 月 2 日当周增加1 万人至 20 万,持续申领降至177 万;数据表明劳动力市场仍具韧性,但短期失业申请出现小幅回升。
𝕏 DeepL 计划裁员约 25%,称 AI 正改变语言工具行业
DeepL计划裁员约25%,CEO Jaroslaw Kutylowski称原因是 AI 带来的巨大结构性转变,语言工具行业正面临自动化和生成式 AI 的双重冲击。
𝕏 QQQ 首破 700 美元,纳斯达克综合指数盘中站上 26000 点
QQQ首次突破700 美元关口,纳斯达克 100 ETF 创下历史新高;同日纳斯达克综合指数触及26000 点,英伟达、微软、特斯拉分别上涨 2.97%、2.37%、3.66%。
🔵 Block 因 AI 相关裁员后上调全年利润预期
Block在 AI 相关大规模裁员后,上调全年利润和增长展望;公司通过削减成本改善盈利预期,反映金融科技企业正借助 AI 和组织调整提升运营效率。
𝕏 Palantir 近 16 个月美国政府合同义务额约 17 亿美元
Palantir过去16 个月获得约17 亿美元美国政府合同义务额,接近 2020—2024 年五年累计总额,显示其政府业务增长显著加速。
𝕏 Gusto 年收入突破 10 亿美元,继续聚焦小企业服务
Gusto披露收入里程碑,年收入已超过10 亿美元;公司称将继续为小企业提供薪酬、运营和管理工具,强化其在人力资源软件市场的定位。
🏭 工业能源
🔵 英伟达动态:Rubin Ultra 遇良率挑战,拟投 IREN 及洽谈日本服务器
Nvidia近期面临多重动态。其Rubin Ultra据称因HBM4基底及封装良率问题多次调整设计。同时,Nvidia计划向数据中心开发商IREN投资最高21 亿美元以加速 AI 基建,并据称与SoftBank洽谈日本 AI 服务器项目,显示其在硬件研发与生态投资上的双重策略。
𝕏 SpaceX 多线进展:得州建芯片厂、Starlink 覆盖东帝汶
SpaceX近期动作频繁。一方面,公司提交得州Terafab芯片设施计划,项目规模约550 亿美元,总支出可能达 1190 亿美元;另一方面,SpaceX Starlink为东帝汶超过450 个偏远村庄提供高速网络,覆盖数字政务、教育和医疗场景,展现其商业航天与基建的双重布局。
🔵 安大略省核电重启与三哩岛核电站推进:微软等巨头推动能源转型
安大略省签署3 亿美元成本分担协议,可能推动该省建设全球最大核能发电设施。与此同时,微软AI 算力用电需求推动三哩岛核电站重启进程。这两起事件表明,随着 AI 算力需求激增,核电正成为数据中心电力供给的关键来源,传统能源与新兴科技深度绑定。
𝕏 SK Hynix 获全球巨头激进提案,定制产线与 ASML 光刻机融资引关注
SK Hynix正收到全球科技巨头的激进提案,包括直接投资专用内存生产线和资助购买价值数亿美元的ASML EUV光刻机。由于产能几乎为零,公司对此持谨慎态度,担心被锁定低价供应,反映了 AI 芯片需求的结构性增长对存储产业链的深远影响。
𝕏 Genesis AI 展示吴极科技机械手,中美高端机器人供应链深度整合
法国初创公司 Genesis AI 在其最新视频中展示了搭载中国 吴极科技(Wuji Tech) 机械手的机器人。该机器人具备 22 自由度,能自主完成复杂物理任务,标志着中美供应链在高端机器人硬件领域的深度整合,体现了全球科技合作的新模式。
🔵 MP Materials 预测重稀土需求下降,中国 EV 给底特律带来竞争压力
MP Materials预计昂贵重稀土材料需求将下降,因磁体制造商转向替代金属。同时,中国 EV供应链和产品迭代速度成为美国车企压力点,节目聚焦底特律竞争短板。这两则信息揭示了原材料市场变化与传统汽车产业面临的严峻挑战。
𝕏 特斯拉全球销量创新高:中国创纪录,韩国超德系豪华车
特斯拉在 4 月全球表现强劲。特斯拉中国4 月销量达79,478 辆,同比增长36%,创历史最佳 4 月纪录。同时,特斯拉在韩国销售13,190 辆,创当地月度纪录,并超过BMW与 Mercedes 合计销量,显示出其在亚洲市场的强劲竞争力。
𝕏 NVIDIA Isaac GR00T N 接入 Hugging Face LeRobot,支持机器人开发
NVIDIA Isaac GR00T N集成 Hugging Face LeRobot,帮助开发者后训练、评估和部署机器人基础模型,进一步降低了机器人开发的门槛,推动了 AI 在实体机器人领域的应用落地。
𝕏 工业制造新趋势:YC 公司 CAD 转零件、德意志交易所上云、俄罗斯火箭首飞
制造业与科技融合加速。YC介绍一家自主制造公司,可将CAD设计最快 1 天交付机械零件。德意志交易所集团将关键应用迁至 Google Cloud,TCO 降低33%。此外,俄罗斯“联盟 5”号火箭首飞成功,彻底摆脱对乌克兰技术依赖。这些事件展示了从软件定义制造到基础设施上云,再到航天自主化的多元进步。
𝕏 印度太空独角兽 Skyroot 推进轨道发射,台湾半导体人才与产能矛盾凸显
Skyroot成为印度首家太空科技独角兽,公司正推进轨道发射计划。与此同时,台湾每年约10 万新生儿,而TSMC每年需在台招聘1 万人,美国晶圆产能扩张更显必要。这两条信息分别反映了新兴航天市场的崛起以及半导体产业面临的人才与地缘政治挑战。
🧠 深度思考
𝕏 AI 推理成本下降反而推高总算力账单
AI 推理的单 token 价格一年下降约100 倍,但更便宜的推理并未降低总账单:推理模型、Agent 工作流与深度研究会消耗更多 token,呈现类似杰文斯悖论的算力需求扩张。
𝕏 AI 工程师将从 Prompt 转向 Harness Engineering
文章认为2026 年 AI 工程师的核心能力将转向Harness Engineering,重点不再是追逐框架或写提示词,而是掌握Agent Loop、工具调度、上下文 Write/Select/Compress/Isolate 以及Evals。
𝕏 AI 生成的“粗糙原型”适合并行实验,但不能直接交付
Mitchell Hashimoto认为,AI slop适合快速验证 API、GUI 和插件生态,尤其适合并行探索多个方向;但在面向客户、合并开源 PR 或进入生产环境前,必须经过透明审查与人工质量把关。
𝕏 应用正在变成 Agent,分发单元将被重写
Agent可能取代 App 成为新的分发层,从发现、信任、变现到品牌和产品发布方式都会被重写。未来用户可能不再主动打开应用,而是通过 Agent 调用能力、完成任务并决定哪些服务被看见。
𝕏 AI-first SaaS 可能从前端转向后端能力供给
Marc Lou提出,AI-first SaaS的改造路径不只是给产品加聊天框,而是开放 API、llms.txt、CLI、MCP与生成式 UI。未来 SaaS 前端可能由 AI 助手承担,产品价值更多沉淀在后端能力与可调用接口中。
𝕏 不要为今天的模型做产品,应面向下一代模型能力设计
Claude Code早期只能写约10%代码,Sonnet 4 后升至50%;如今其**80%-90%**代码由 Claude Code 自己完成。这个变化说明,AI 产品设计不应被当前模型能力限制,而应面向下一代能力提前布局。
𝕏 AI 更常增强岗位而非替代岗位,关键是提高个人工作价值
a16z数据显示,企业用 AI 增强岗位的频率是替代岗位的8 倍。这意味着短期核心问题并非“岗位是否消失”,而是个人能否把AI 工具嵌入工作流,提升产出质量、速度和不可替代的业务价值。
𝕏 AI 尚未显著提升生产率的反向观察
Gary Marcus指出,AI 革命已持续约3.5 年,但宏观生产率数据仍未显示明显改善。这一观察提醒外界区分演示能力、局部效率和宏观生产率之间的差异,避免过早把 AI 影响等同于经济层面的全面跃迁。
𝕏 OpenAI 与 Anthropic 已在企业 AI 市场形成明显领先身位
OpenAI与Anthropic在模型研发、企业合同、算力合作、政府关注、媒体曝光和消费者认知上进入商业起飞阶段。两家公司正从技术领先转向市场领先,并在企业 AI 采用中形成更强势的默认选择地位。
𝕏 Harry Stebbings 复盘科技财报:Google 赢、Meta 输与 AI 应用爆发
Harry Stebbings复盘 Google、Meta、Anthropic、Atlassian、Twilio 等科技公司财报与业务变化,认为AI 应用爆发正在利好云计算与API 基础设施,同时不同公司在资本开支、商业化和叙事上出现明显分化。
𝕏 设计师在通用智能时代的核心价值转向上下文与决策权
Soleio认为,随着AI Agent承担更多视觉执行,设计师的核心价值会从产出界面转向掌握产品上下文、理解迭代周期,并直接影响产品决策。设计师需要更靠近问题定义,而不只是交付视觉方案。
📰 综合新闻
🔵 谷歌搜索反垄断案法官拒绝暂停数据开放补救令
美国联邦法官拒绝 Alphabet 暂停补救令请求,Google仍需向竞争对手开放底层搜索数据,尽管公司正在上诉。该裁定意味着搜索反垄断案中的关键补救措施将继续推进,短期内不会因上诉而中止。
🔵 Cloudflare 转向 AI-first 模式,计划裁员逾 1100 人
Cloudflare计划全球裁员逾1100 人,约占员工五分之一,以推进 Agentic AI-first运营模式。公司表示,此举旨在加快向人工智能优先的组织结构转型,并重新配置资源以支持新的业务重点。
𝕏 以色列报告首例人类汉坦病毒感染病例
以色列卫生部门宣布首例人类汉坦病毒感染病例,患者数月前已确诊。官方同时表示,相关病毒株与MV Hondius邮轮疫情无关,目前尚未公布更多传播细节和后续监测安排。
𝕏 Xbox 停用玩家反感的 Copilot 相关产品
Xbox已停用长期反感的Copilot相关产品,相关页面显示该服务已被退休,意味着此前围绕玩家体验的这一功能线正式结束。此举反映出微软在游戏端产品设计上的调整,也回应了玩家对相关功能长期存在的不满。
𝕏 伦敦法院裁定两名男子为香港和中国从事间谍活动
伦敦法院周四裁定两名男子有罪,认定他们为香港和中国从事间谍活动,监视在英国的知名民主派异见人士。该案再次引发外界对跨境情报活动、政治监控及英国国家安全防线的关注。
💡 生活建议
𝕏 Bryan Johnson 称用 18 个月将精液微塑料颗粒降至 0
Bryan Johnson称自己的精液微塑料从165 颗粒/mL降至0,用时18 个月;他分享的方案包括干桑拿、反渗透净水,以及减少不粘锅、塑料容器等潜在微塑料来源。
𝕏 《从拒绝开始》谈判原则:不需要交易的人更有筹码
Start With No强调,谈判中“需要这笔交易的人更容易输”;保持可放弃心态,能减少因焦虑成交而过早让步的风险,也更容易守住自己的底线。
𝕏 家庭数学启蒙:用玩具、同学和生活场景长期出题
RobinSeun分享家庭数学启蒙经验:不依赖课外班,而是长期围绕玩具、同学和日常生活场景设计记忆、逻辑、计算题,让孩子在熟悉情境中反复练习,逐步形成兴趣与能力的正循环。
🛡️ 安全事件
𝕏 Cloudflare 提示 React Server Components 与 Next.js 存在多个漏洞
Cloudflare 提示 React Server Components 和 Next.js 存在多个漏洞,建议立即升级相关版本;其 WAF 托管规则已可缓解已披露的 DoS 漏洞,适用于暂未完成修复的环境。
🔵 Canvas 网络安全事件致哥大、斯坦福等高校在线平台中断
Canvas 在线学习平台发生网络安全事件,哥伦比亚大学、斯坦福大学 等美国高校报告在线平台中断和访问异常,影响课程作业、公告及教学协作服务。相关机构仍在排查事件范围与恢复进度。
𝕏 Cloudflare 已缓解 Linux 内核提权漏洞并确认客户零影响
Cloudflare 表示,在公开披露的 Linux 内核提权漏洞 出现后,已完成检测、调查与缓解;公司确认全球基础设施和客户环境均未受到影响,整体结果为 零客户影响。
𝕏 Anthropic 将安全漏洞赏金计划公开至 HackerOne
Anthropic 将其安全漏洞赏金计划公开至 HackerOne,任何研究人员都可直接提交漏洞并获得奖励;此举扩大了外部研究参与面,也方便统一接收和奖励披露。
𝕏 多伦多警方逮捕使用 SMS Blaster 发送恶意短信团伙
多伦多警方 逮捕了使用 SMS Blaster 向数千人发送恶意短信的团伙,案件涉及移动钓鱼攻击,嫌疑人被指借助伪装基站批量推送诈骗内容并诱导受害者泄露敏感信息。
𝕏 Granola 静默转录会议引发企业合规与隐私风险讨论
Granola 可在会议通话中开启 静默转录,其他参会者可能并不知情;这让企业会议记录、取证发现程序和 隐私合规 面临新风险,也引发了对默认录音告知与授权边界的讨论。
🚀 创业公司
𝕏 Product Hunt 联合 YC 为发布项目提供面试机会
Product Hunt与Y Combinator合作,标记“YC application”的项目将由 Gustaf 评审,优秀项目可获 YC 面试机会。
由 X-Crawler AI 生成于 2026-05-08 08:05
EVENT-DRIVEN INTELLIGENCE
免费先看重点,Pro 再看速度、深度和可追踪性
这篇内容是公开入口。继续使用天眼时,固定沿着三条路径走:订阅每日情报、查看同主题历史上下文、升级 Pro 解锁事件追踪与研究能力。