06月15日 · 科技早报

天眼早报

科技|2026年06月15日|103 分钟阅读
来源:1107 条推文 + 1070 篇 RSS 文章·Lanyun·DeepSeek 生成·2026-06-07 — 2026-06-08
分享
AI 速读15 条精选

🤖 AI 大模型

🔶 OpenAI 计划对 ChatGPT 进行史上最大改版,打造超级应用

OpenAI计划推出史上最大ChatGPT改版,将其从聊天机器人转型为集编程、AI 代理、图像生成、第三方服务(如Canva、Booking.com)于一体的超级应用,为潜在IPO铺路。月活用户已突破10 亿,但付费率不足 5%。改动将在未来几周内开始推出。

🔶 OpenAI 推出全新记忆系统 Dreaming V3,回忆准确率提升至 82.8%

OpenAI推出全新记忆系统Dreaming V3,可自动整理用户偏好、项目等信息,支持记忆摘要、来源查看与手动干预。测试显示事实回忆准确率从 41.5%提升至82.8%,偏好遵循率从 31.4%提升至 71.3%。先向美国 Plus 和 Pro 用户开放,免费用户几周内逐步推出。

Claude Code 引入动态工作流,用于并行代理协调

Anthropic推出 Claude Code 新功能动态工作流(研究预览),可在单一工作流中协调大量 AI 代理处理复杂软件工程任务。该功能自动生成协调脚本,并行执行子任务并验证结果,消耗令牌较高。

💹 英伟达与 SK 海力士签署多年合作协议,联合研发下一代芯片

英伟达SK 海力士宣布达成多年技术合作伙伴关系,共同开发面向Vera Rubin、Vera CPU、RTX Spark 和 Jetson Thor 的新一代存储芯片。黄仁勋确认三星、美光也是HBM4供应商。Vera Rubin 已全面量产,预计 Q3 交付。

谷歌 Gemini API 现 BUG,开发者每小时被收取 200 美元缓存费

有开发者反映谷歌 Gemini API因缓存问题每小时被收取200 美元费用且无法删除缓存。谷歌 AI 论坛多名用户遭遇类似问题,官方支持工单无人处理。

中国 AI 大模型周调用量反超美国,包揽全球前四

全球 AI 大模型上周总调用量达36.1 万亿 Token中国周调用量14.19 万亿 Token,环比增长27.49%,连续六周超越美国。DeepSeek-V4-Flash连续三周蝉联全球榜首。

对话 MiniMax 择因:Agent 终将超越人类,架构即认知

MiniMax Agent 研发工程师择因详述Agent Team的 Leader-Worker-Verifier 架构设计,认为模型差距已缩小,核心竞争在于harness(脚手架),并预测 AGI 时代人才将需"付费上班"。

𝕏 Anthropic 未发布模型 Oceanus 泄露,定价为 Opus 三倍

Anthropic未发布的Mythos版本模型Oceanus泄露,通过中文 API 代理流出。定价**$16/M 输入**、$80/M 输出,比Claude Opus贵近 3 倍。泄露时 Anthropic 尚未完成安全测试。

𝕏 OpenAI 多名核心负责人离职:Sora 负责人与芯片负责人分别离开

OpenAISora项目负责人和芯片负责人近期先后离职,芯片负责人转投Anthropic。分析认为 OpenAI“同时押注多个大赌注”的策略开始显露脆弱性,尤其在代码领域与 Anthropic 的竞争中承压。

华为天才少年王裕鑫创业形界智能,聚焦流式视频生成

华为天才少年王裕鑫创立形界智能,方向为流式视频生成,强调实时性和连续交互。公司成立首月即完成数千万级首轮融资。王裕鑫曾任元石科技核心技术成员,主导过 200B+大模型训练。

📄 dots.tts 开源 2B 参数连续自回归 TTS 基础模型,性能 SOTA

dots.tts 建模语音连续隐空间,在 Seed-TTS-Eval 上中英文 WER 分别低至 0.94%/1.30%,SIM 分达 81.0/77.1。已完全开源。

📄 Socratic-SWE:自进化编码 Agent,SWE-bench Verified 达 50.40%

Socratic-SWE 利用历史求解轨迹提炼为结构化技能,指导生成针对性修复任务,经三轮迭代在 SWE-bench Verified 上达到 50.40%,超越自进化基线。

🔶 AI 数学家 AxiomProver:上午出题下午交卷,8 篇论文被接收

AI 工具AxiomProver使用Lean形式化语言生成数学证明,自 2 月以来已有8 篇论文登上 arXiv,覆盖代数几何、数论等领域,其中 5 篇被权威期刊接收。机器验证消除了人类审稿的信用瓶颈。

DeepSeek V4 Pro 在精度上超越 GPT-5.5 Pro

据基准测试,DeepSeek V4 Pro 在精度指标上超越 GPT-5.5 Pro,引发社区对开源模型追赶闭源模型的讨论。评测涵盖数学、代码、推理等多领域。

xAI 被曝曾利用 Claude 输出数据训练编码模型

据《The Information》,xAI 直接利用 AnthropicClaude 输出数据训练 Grok 编码模型,API 权限被撤销后转用个人账户及第三方服务提取。

𝕏 Claude Mythos 新一轮造势:SVG 生成、代码加速 52 倍

Anthropic 数据称 Mythos 在优化任务中可实现 52 倍 训练代码加速,SVG 生成细节极丰富,使用成本将极其高昂。


EVENT-DRIVEN INTELLIGENCE

免费先跟踪重点,再决定是否升级

每篇公开内容都对应三步:订阅每日情报、查看同主题历史上下文、升级 Pro 解锁搜索、研究和事件详情。

分享

NEXT STEP · 留下邮箱

获取下一次重大事件提醒

每天一封精选情报,先用邮件建立复访,再决定是否升级到更深的追踪能力。