天眼早报
OpenAI计划将ChatGPT升级为整合Codex、AI Agent、图像生成和第三方应用的超级应用,首席产品官Tibo Sottiaux称目标是跨平台个人AI助手,预计未来几周上线。此次改版旨在提升企业客户收入占比,为即将到来的IPO铺垫,标志着ChatGPT从聊天工具向平台化生态转型,可能直接威胁谷歌、微软等竞争对手的AI助手战略,重塑数亿用户的AI入口格局。
美国5月非农就业人口增加17.2万人,远超预期的8.8万,失业率维持4.3%,强劲数据令市场对降息的期待破灭,摩根大通将10年期美债收益率预期上调至4.70%。受此影响,纳斯达克指数暴跌逾4%,三星、SK海力士盘前分别大跌12%和10.5%,全球科技股估值承压,短期内可能抑制AI相关投资的风险偏好,并加剧半导体等成长板块波动。
英伟达与SK海力士宣布多年合作,共同研发面向Vera Rubin、Vera CPU和Jetson Thor平台的先进内存,SK海力士还将使用英伟达软件优化芯片设计与制造。此举标志着HBM4等下一代内存供应链的深度垂直整合,英伟达通过锁定关键供应商来确保AI芯片性能优势,可能挤压AMD等对手的HBM供应,加速AI算力竞赛的硬件壁垒构建。
英伟达宣布在台积电支持下,将在美国完成顶尖AI芯片制造,并计划于3至4年内部署价值约5000亿美元的AI超级计算设备。这标志着先进芯片制造向美国的大规模回流,意图重塑全球半导体供应链的地缘政治版图,同时巨量资本开支预示AI算力需求将持续爆增,对数据中心、能源等领域产生深远拉动,进一步增强英伟达对AI基础设施生态的控制。
Anthropic推出的Mythos 5模型在SVG生成和UI设计方面表现卓越,其训练代码加速比高达52倍,远超过人类熟练工的4倍,有望重塑Web开发工作流。尽管公众版能力或遭削减,但已展示出代码生成领域的巨大飞跃,可能促使前端开发者转向AI辅助设计,并对OpenAI Codex等竞品及低代码平台构成直接冲击,加速软件工程自动化进程。
🤖 AI 大模型
𝕏 OpenAI 启动 ChatGPT 史上最大改版,转型超级应用
OpenAI 计划将 ChatGPT 从聊天工具升级为包含 Codex、AI Agent、图像生成及第三方应用的 超级应用。首席产品官 Tibo Sottiaux 表示目标是打造跨平台的个人 AI 助手。此次改版旨在提升企业客户收入占比,为即将到来的 IPO 讲故事,预计未来几周内上线。
𝕏 Anthropic 推出 Mythos 5 模型,训练代码加速比达 52 倍
Anthropic 推出 Mythos 5 模型,在 SVG 生成和 UI 设计领域表现卓越。数据显示其 训练代码加速比 高达 52 倍,远超人类熟练工的 4 倍。该模型预计将重塑 Web 开发工作流,但未来公众版可能为“削弱版”。
𝕏 Vercel AI Gateway 月均恢复 1T tokens,零 markup 策略
Vercel 推出 AI Gateway,通过智能重试机制每月自动恢复超过 1T tokens 的调用量。该服务提供冗余备份、零数据保留、可观测性及使用限制等功能,且对开发者 零 markup 收费,类似 Stripe 处理支付失败的逻辑。
𝕏 Ideogram 4 开源发布,原生支持 2K 分辨率生成
Ideogram 正式发布 Ideogram 4 文生图模型,这是一个 9.3B 参数的开放权重模型,支持 原生 2K 分辨率图片生成。实测显示其在复杂场景还原和创意设计方面表现优异,但在中文文本排版上略逊于 Z-Image。
𝕏 Gemma 4 MTP 合并至 llama.cpp,支持轻量化部署
Gemma 4 MTP 架构已官方合并入 llama.cpp 项目,用户现可结合 QAT(量化感知训练)与 MTP(多令牌预测)技术,实现轻量级且极速的推理部署方案。
𝕏 NVIDIA CEO 黄仁勋:HBM 内存短缺将持续数年
NVIDIA CEO Jensen Huang 指出,由于 HBM(高带宽内存)需要大量晶圆产能和先进封装技术,仅靠增加晶圆无法解决供应问题。Samsung、SK Hynix 等厂商难以在短期内缓解短缺,预计瓶颈将持续数年。
𝕏 Anthropic 未发布模型 Oceanus 遭泄露,定价高昂
Anthropic 内部代号 Oceanus 的模型(属于 Mythos 系列)在中文 API 代理上泄露,定价高达 $16/M input、$80/M output token,是 Claude Opus 的近 3 倍。该模型在安全测试尚未完成时被重新打包出售。
𝕏 Google Gemini 3 工具调用能力受限于工程接口规范
arvin17x 指出 Gemini 3 系列模型本身具备强大的 工具调用 能力(MCPMark 评分超 54%),但因 接口格式规范 奇葩导致实际体验极差。社区适配度低及空输出错误频发,凸显了 Harness 框架的重要性。
𝕏 SemiAnalysis:NVIDIA Nemotron3 Ultra 在编码任务上被 Kimi K2.6 和 GLM5.1 击败
SemiAnalysis 评测指出,NVIDIA 的 Nemotron3 Ultra 模型在 TerminalBench 等编码任务上不如 Kimi K2.6 和 GLM5.1。建议 Jensen 邀请 DeepSeek、MoonshotAI 等前沿实验室加入训练委员会。
🛠️ AI 工具推荐
𝕏 ⭐ GStack:YC 总裁开源的全自动开发工作流系统
garrytan开源GStack,包含23 个结构化技能覆盖从规划到 QA 全流程。该系统利用Claude Code实现自动化营销与开发,曾助选手在1 小时 45 分内完成游戏开发,显著降低人力成本。
𝕏 ⭐ Open Notebook:本地化私有 AI 研究助手,支持 18+ 模型
开发者构建的Open Notebook工具可完全本地运行,将 PDF、视频等文件转化为AI 研究助手。支持OpenAI、Claude、Ollama等18+ 模型,提供搜索、摘要及播客生成功能。
𝕏 ⭐ Tolaria:Obsidian 开源平替,Git 即同步的知识库
GitHub_Daily推荐开源项目 Tolaria,作为 Obsidian的替代品管理 Markdown 知识库。其核心是“文件即数据”,每个仓库即为 Git 仓库,支持完全离线、无订阅费,并适配 Claude Code等 AI 工具的上下文输入。
𝕏 ⭐ OpenClaw 推出 1600+ 技能库,赋能 AI Agent 桌面化
OpenClaw 发布包含 1600+ 精选技能的 AI Agent 工具集,为每个 Agent 提供独立的 桌面、网络和内存 环境。此外,还推出了模拟 56+ AWS 服务 的本地化工具及医疗研究技能包,显著提升 Agent 的独立执行能力。
𝕏 ⭐ Headroom:清理 AI Coding Agent 上下文,降低成本
Headroom工具专为 AI coding agent设计,用于清理和压缩上下文窗口。它能过滤日志和无关搜索结果,帮助开发者减少 token 消耗,提升长任务稳定性,目前 Star 数增长迅速。
𝕏 HALO GitHub:开源自改进循环工具,兼容所有编码 Agent
samhogan 推荐 HALO GitHub 项目,这是一个 100% 开源的自改进循环工具,可即插即用地提示你的编码 Agent,兼容所有 Agent 框架和编码工具。
𝕏 ⭐ Antigravity CLI 更新:新增 LaTeX 渲染与权限管理
Antigravity 近期发布三次更新,重点优化了开发者体验。新功能包括 LaTeX 数学公式渲染、新增 --model 标志以及通过 /permissions 命令管理 权限。这些改进使得命令行 AI 代理 的开发更加流畅。
𝕏 ⭐ Wi-Fi 运动检测:无需摄像头的隐私方案
tom_doerr分享基于 Wi-Fi 信号进行运动检测的技术实现,无需摄像头即可感知室内活动,保护用户隐私。该项目展示了利用现有硬件进行非视觉感知的创新应用。
𝕏 Box 推出网页端 Markdown 编辑器及 Claude/Cursor 集成
Box 新增网页端 Markdown 编辑器、完整 CLI 支持、评论和版本历史。Box Drive 可挂载为桌面驱动器,直接与 Claude Cowork、Codex、Obsidian、Cursor 等应用无缝协作。
📖 教程攻略
𝕏 ⭐ 本地运行 Claude Design:Cursor + Opus 4.8 实战指南
博主详细演示如何将 Claude Design集成到本地开发环境。通过 Cursor编辑器配合 Opus 4.8模型,利用 Skill 功能实现本地 UI 设计与代码生成的无缝衔接,解决了云端切换繁琐的问题,并提供了完整的配置步骤。
𝕏 ⭐ 构建 AI Agent 技能库:从经验到可复用系统
hnshah分享如何建立技能库(Skill Libraries),将组织内最佳员工的隐性知识转化为可复用的 AI 技能。文章强调这是提升 AI ROI 的关键,而非仅仅提供工具,并给出了具体的实施思路。
𝕏 OpenAI 发布 Codex 真实工作流案例:从收件箱管理到代码部署
OpenAI 发布了数十个 Codex 真实世界工作流案例,涵盖管理收件箱、审查 PR、Figma 转代码、理解代码库、自动化 Bug 分类、自然语言查询表格、部署应用、构建 Mac/iOS 应用、自动生成幻灯片等。
𝕏 ⭐ Claude Code 技能自我提升四步循环法
分享Claude Code技能优化的四步循环:定义优质输出标准、指向技能文件、自动运行评分、次日查看改进结果。该方法可实现技能的可测量提升,适合开发者日常实践。
💎 技巧经验
𝕏 你应设计循环来提示编码 Agent,而不是手动输入提示
steipete 强调,不要再手动提示编码 Agent,而应设计循环来自动提示 Agent,这是更高效的方法。
𝕏 创始人建议:不要将融资作为公司更新的头号亮点
Harry Stebbings 指出,公司更新中排名第一的亮点不应该是成功融资,而应是客户签约、解决问题、产品发货和人才招聘。客户永远第一。
⚡ 工作流
𝕏 OpenAI Codex 工作流:用 /goal 一句提示生成 GBA 模拟器
开发者 ewind_dev 分享,使用 Codex 的 /goal 命令只需一句提示就能生成一个可运行的 GBA 模拟器,经过两轮调整后甚至能正常模拟游戏场景。
📚 论文研究
𝕏 ⭐ 后训练推理数据指南:为何检查信号比问答对更重要
Rohan Paul分享论文《A Primer in Post-Training Reasoning Data》,指出推理数据不应仅是问答对,核心在于包含检查信号**(checkable training evidence)。论文强调保留失败重试、状态差异等原始混乱数据对模型学习至关重要。
🚀 产品发布
🔵 【重磅】英伟达与 SK 海力士签署多年协议,联合研发 Vera 芯片内存
英伟达** 与 SK 海力士 宣布达成多年期合作伙伴关系,共同研发面向 Vera Rubin、Vera CPU 及 Jetson Thor 平台的先进内存。SK 海力士 还将利用英伟达软件提升芯片设计与制造效率。此举标志着 HBM4 等核心组件供应链的深度整合。
💹 ⭐ 斗山集团宣布与英伟达深度合作,拓展 AI 工厂与机器人业务
斗山集团** 宣布将其能源解决方案、工程机械及机器人业务与 英伟达 平台整合。预计其燃气轮机、SMR(小型模块化反应堆)及氢燃料电池将为英伟达 AI 工厂 提供支持,同时将在物理人工智能领域展开联合开发。
🌍 国际大事
𝕏 特朗普政府拆除价值 3.68 亿美元海洋监测系统
特朗普政府被指拆除正在运行的3.68 亿美元海洋监测设备,该系统已投入运营并记录了破纪录的海洋温度。此举发生在海洋气候异常之际,被批评为破坏科学监测以掩盖深海采矿可能造成的环境破坏。
𝕏 金正恩向朝鲜核武问题发出强硬信号
The Economist报道,在习近平访问朝鲜前夕,金正恩明确传达其核武计划不可谈判的信号。这一举动加剧了地缘政治紧张局势,显示朝鲜在核问题上的坚定立场。
📈 财经市场
💹 ⭐ 美国非农数据爆表,美联储加息预期重燃
美国 5 月非农就业 人口新增 17.2 万人,远超预期的 8.8 万人,失业率维持在 4.3%。强劲数据导致市场对降息期望破灭,摩根大通 将 10 年期美债收益率预期上调至 4.70%。美股科技板块重挫,纳指 单日暴跌超 4%。
💹 ⭐ 三星与 SK 海力士盘前大跌,受加息预期拖累
受美国非农数据超预期引发的 加息预期 影响,全球半导体板块遭遇抛售。三星电子 盘前跌幅达 12%,SK 海力士 下跌 10.5%。此前英伟达 CEO 黄仁勋刚在韩国会见过这两家企业高管,强调合作紧密。
💹 ⭐ 云南对老挝进出口增长近 50%,贸易额超百亿元
今年前 4 月,云南 对老挝进出口达 104 亿元,同比增长 49.7%,占中老贸易总额的 37.5%。云南已成为我国对老贸易最大省份,双边经贸合作持续深化。
🏭 工业能源
𝕏 ASML 邀请马斯克参加闭门会议,讨论 550 亿美元 Terafab 项目
ASML邀请 Elon Musk参加内部会议,讨论价值 550 亿美元的 Terafab项目。该项目旨在生产用于 AI、机器人和太空计算的2nm芯片,标志着半导体制造与航天科技的深度交叉,展现了高端芯片技术在多领域融合的巨大潜力。
𝕏 英伟达美国本土化制造:3-4 年内部署 5000 亿美元设备
英伟达宣布在美国本土完成顶尖 AI 芯片制造,计划在3-4 年内完成价值约5000 亿美元的 AI 超级计算设备部署。此举标志着台积电支持下,美国重新掌控关键科技制造环节的重大进展,对全球半导体供应链格局产生深远影响。
𝕏 微软 Copilot 在英国 NHS 推广,员工日均节省 43 分钟
Microsoft宣布将Copilot扩展至英国NHS England的50 万名员工中。早期测试显示,员工平均每天节省43 分钟工作时间,使其能更专注于患者护理,验证了AI在医疗行政场景的效率价值,体现了技术对公共部门生产力的显著提升。
𝕏 麦当劳测试 AI 点餐系统,已处理超 100 万订单
麦当劳在美国五家门店测试名为ArchIQ的AI 点餐系统,由 AI 助手Archy负责处理得来速订单。该系统已成功处理超过100 万笔订单,标志着AI在餐饮自动化领域的规模化落地,展示了人工智能在高频服务场景中的实际应用价值。
🧠 深度思考
𝕏 执行的价值永远被低估:高认知无法替代行动
作者通过抖音控评案例反思,高认知朋友的建议往往无效,真正的解决方案源于执行。即便面对负面评论,亲自测试发现控评能显著提升转粉率,证明行动比单纯讨论策略更具决定性意义。这一观点强调了在复杂决策中,实践验证远比理论推演重要,只有将想法转化为具体操作,才能打破认知局限,获得真实反馈。
𝕏 LLM Agent 工具过多反而降低效率:少即是多
BohuTANG**通过对比实验发现,给LLM Agent过多的细粒度工具(如 LS, Grep)会导致模型机械式排队调用;而减少工具数量(仅 Bash, Read, Edit, Write)反而让模型自主组合出更优路径,证明隐式 Prompt过多会限制决策灵活性。实验表明,工具精简能激发模型的推理能力,避免陷入过度依赖外部指令的陷阱,从而提升整体任务完成效率。
由 X-Crawler AI 生成于 2026-06-08 08:04
EVENT-DRIVEN INTELLIGENCE
免费先看重点,Pro 再看速度、深度和可追踪性
这篇内容是公开入口。继续使用天眼时,固定沿着三条路径走:订阅每日情报、查看同主题历史上下文、升级 Pro 解锁事件追踪与研究能力。