天眼早报

科技|2026年06月15日|约 103 分钟阅读

来源：1107 条推文 + 1070 篇 RSS 文章·Lanyun·DeepSeek 生成·2026-06-07 — 2026-06-08

AI 速读15 条精选

🤖 AI 大模型

🔶 OpenAI 计划对 ChatGPT 进行史上最大改版，打造超级应用

OpenAI计划推出史上最大ChatGPT改版，将其从聊天机器人转型为集编程、AI 代理、图像生成、第三方服务（如Canva、Booking.com）于一体的超级应用，为潜在IPO铺路。月活用户已突破10 亿，但付费率不足 5%。改动将在未来几周内开始推出。

🔶 OpenAI 推出全新记忆系统 Dreaming V3，回忆准确率提升至 82.8%

OpenAI推出全新记忆系统Dreaming V3，可自动整理用户偏好、项目等信息，支持记忆摘要、来源查看与手动干预。测试显示事实回忆准确率从 41.5%提升至82.8%，偏好遵循率从 31.4%提升至 71.3%。先向美国 Plus 和 Pro 用户开放，免费用户几周内逐步推出。

Claude Code 引入动态工作流，用于并行代理协调

Anthropic推出 Claude Code 新功能动态工作流（研究预览），可在单一工作流中协调大量 AI 代理处理复杂软件工程任务。该功能自动生成协调脚本，并行执行子任务并验证结果，消耗令牌较高。

💹 英伟达与 SK 海力士签署多年合作协议，联合研发下一代芯片

英伟达与SK 海力士宣布达成多年技术合作伙伴关系，共同开发面向Vera Rubin、Vera CPU、RTX Spark 和 Jetson Thor 的新一代存储芯片。黄仁勋确认三星、美光也是HBM4供应商。Vera Rubin 已全面量产，预计 Q3 交付。

谷歌 Gemini API 现 BUG，开发者每小时被收取 200 美元缓存费

有开发者反映谷歌 Gemini API因缓存问题每小时被收取200 美元费用且无法删除缓存。谷歌 AI 论坛多名用户遭遇类似问题，官方支持工单无人处理。

中国 AI 大模型周调用量反超美国，包揽全球前四

全球 AI 大模型上周总调用量达36.1 万亿 Token。中国周调用量14.19 万亿 Token，环比增长27.49%，连续六周超越美国。DeepSeek-V4-Flash连续三周蝉联全球榜首。

对话 MiniMax 择因：Agent 终将超越人类，架构即认知

MiniMax Agent 研发工程师择因详述Agent Team的 Leader-Worker-Verifier 架构设计，认为模型差距已缩小，核心竞争在于harness（脚手架），并预测 AGI 时代人才将需"付费上班"。

𝕏 Anthropic 未发布模型 Oceanus 泄露，定价为 Opus 三倍

Anthropic未发布的Mythos版本模型Oceanus泄露，通过中文 API 代理流出。定价**$16/M 输入**、$80/M 输出，比Claude Opus贵近 3 倍。泄露时 Anthropic 尚未完成安全测试。

𝕏 OpenAI 多名核心负责人离职：Sora 负责人与芯片负责人分别离开

OpenAI的Sora项目负责人和芯片负责人近期先后离职，芯片负责人转投Anthropic。分析认为 OpenAI“同时押注多个大赌注”的策略开始显露脆弱性，尤其在代码领域与 Anthropic 的竞争中承压。

华为天才少年王裕鑫创业形界智能，聚焦流式视频生成

华为天才少年王裕鑫创立形界智能，方向为流式视频生成，强调实时性和连续交互。公司成立首月即完成数千万级首轮融资。王裕鑫曾任元石科技核心技术成员，主导过 200B+大模型训练。

📄 dots.tts 开源 2B 参数连续自回归 TTS 基础模型，性能 SOTA

dots.tts 建模语音连续隐空间，在 Seed-TTS-Eval 上中英文 WER 分别低至 0.94%/1.30%，SIM 分达 81.0/77.1。已完全开源。

📄 Socratic-SWE：自进化编码 Agent，SWE-bench Verified 达 50.40%

Socratic-SWE 利用历史求解轨迹提炼为结构化技能，指导生成针对性修复任务，经三轮迭代在 SWE-bench Verified 上达到 50.40%，超越自进化基线。

🔶 AI 数学家 AxiomProver：上午出题下午交卷，8 篇论文被接收

AI 工具AxiomProver使用Lean形式化语言生成数学证明，自 2 月以来已有8 篇论文登上 arXiv，覆盖代数几何、数论等领域，其中 5 篇被权威期刊接收。机器验证消除了人类审稿的信用瓶颈。

DeepSeek V4 Pro 在精度上超越 GPT-5.5 Pro

据基准测试，DeepSeek V4 Pro 在精度指标上超越 GPT-5.5 Pro，引发社区对开源模型追赶闭源模型的讨论。评测涵盖数学、代码、推理等多领域。

xAI 被曝曾利用 Claude 输出数据训练编码模型

据《The Information》，xAI 直接利用 Anthropic 的 Claude 输出数据训练 Grok 编码模型，API 权限被撤销后转用个人账户及第三方服务提取。

𝕏 Claude Mythos 新一轮造势：SVG 生成、代码加速 52 倍

Anthropic 数据称 Mythos 在优化任务中可实现 52 倍 训练代码加速，SVG 生成细节极丰富，使用成本将极其高昂。

EVENT-DRIVEN INTELLIGENCE

免费先跟踪重点，再决定是否升级

每篇公开内容都对应三步：订阅每日情报、查看同主题历史上下文、升级 Pro 解锁搜索、研究和事件详情。

订阅每日情报查看同主题历史事件升级 Pro 解锁搜索 / 研究 / 事件详情

NEXT STEP · 留下邮箱

获取下一次重大事件提醒

每天一封精选情报，先用邮件建立复访，再决定是否升级到更深的追踪能力。

查看同主题历史事件升级 Pro 解锁事件详情