天眼早报

科技|2026年06月15日|约 93 分钟阅读

来源：1135 条推文 + 800 篇 RSS 文章·Lanyun·DeepSeek 生成·2026-06-14 — 2026-06-15

AI 速读18 条精选

🤖 AI 大模型

𝕏 Anthropic Claude Fable 5 遭美国政府出口管制及后续进展

美国政府以国家安全为由，对Anthropic发布仅 3 天的旗舰模型Claude Fable 5实施出口管制，要求切断所有外国用户访问，包括盟友。亚马逊CEO 安迪·贾西在测试中发现越狱漏洞后向白宫报告，Anthropic 拒绝修复漏洞，导致封禁。公司已派遣技术团队赴华盛顿斡旋，希望尽快恢复访问。同时，Fable 5 在代码迁移和重构方面表现突出，Stripe 用其一天完成 5000 万行 Ruby 代码迁移。此外，有疑似 Fable 5 系统提示词在 GitHub 泄露，包含产品身份、工具路由等详细设计。Anthropic CEO 达里奥·阿莫代伊长期预警 AI 风险，此次反噬引发争议。

🔶 OpenAI 遭美国多州总检察长集体调查，传票关注“模型谄媚”

由多州总检察长组成的联盟对OpenAI展开调查，上周五收到传票，要求提供广告、用户数据、模型谄媚等相关文件。传票首次将“模型谄媚”写入取证清单，此前多起用户伤害诉讼指向 ChatGPT。OpenAI 表示将建设性合作，这是各州针对 AI 公司的最新法律行动，正面临 IPO 与监管赛跑。

智谱 AI 发布 GLM-5.2 旗舰模型，支持 1M 上下文，超越 Fable 5 成本仅十分之一

智谱 AI发布GLM-5.2旗舰模型，核心升级为100 万 token上下文窗口（5 倍于 5.1 版），最大输出 131072 token。新增 High 和 Max 两级推理力度。将遵循MIT 协议开源。在BridgeBench基准上以100.0分排名第一，推理得分42.8超过 Fable 5，成本仅为Fable 5的1/10，速度达300 tokens/秒。港股盘中一度涨47.68%。兼容 Claude Code、Cline 等 8 种编程工具。

AI 大模型厂商陷入“订阅困局”：重度用户导致严重亏损

SemiAnalysis测评显示，OpenAI和Anthropic的订阅模式面临成本危机。ChatGPT Pro200 美元计划在重度使用下 API 成本高达1.4 万美元；Claude Max极限下成本8000 美元。厂商被迫收缩不限量策略。企业正采用任务路由将 AI 成本削减95%。

🔶 Google DeepMind 发布 57 页报告《从 AGI 到 ASI》

Shane Legg等十余位 DeepMind 研究员发布报告，系统分析从通用人工智能到超级人工智能的四条路径：持续扩大规模、算法范式转变、递归自我改进、多智能体协作。报告也指出数据墙、资源极限等六道减速关卡。

🔶 巴西黑马大模型 Rio3.5 发布后翻车，被指套壳缝合国产模型

巴西里约热内卢市政府旗下 IT 公司开源的Rio 3.5 397B模型，采用 MoE 架构和 SwiReasoning 框架，在多项基准测试中超越Qwen 3.7 Plus等开源模型，引发 AI 社区轰动。不到 24 小时被Nex-AGI指认套壳缝合，该模型实际拼接国产开源模型。

𝕏 SemiAnalysis 深度解析：SMIC N+3 节点金属间距小于 Intel 18A？

SemiAnalysis发布对SMIC N+3节点的深度评测，对比TSMC N6，并分析了HiSilicon Kirin 9030、工艺技术、单元架构等关键指标，揭示国产芯片最新进展。

WWDC 2026：Apple 租用 Google 的 1.2 万亿参数模型重建 Siri

Apple 在 WWDC 2026 发布全新 Siri AI，基于与 Google 合作的 1.2 万亿参数 模型，年成本约 10 亿美元。新 Siri 具备屏幕感知、个人上下文理解能力，最少需要 12GB 内存。

Google 发布 Gemini-SQL2，Text-to-SQL 执行准确率 80.04%刷新纪录

Google Research 发布 Gemini-SQL2，基于 Gemini 3.1 Pro 构建，在 BIRD 基准上达到 80.04% 执行准确率，覆盖 37 个专业领域 的 95 个数据库。刷新榜单纪录，但未公布 API 细节。

OpenAI 斥资 1.5 亿美元启动合作伙伴网络，加速企业 AI 转型

OpenAI 宣布推出合作伙伴网络，投入 1.5 亿美元，目标 2026 年底认证 30 万 专业顾问。首批加入者包括 埃森哲、贝恩、波士顿咨询、麦肯锡、普华永道 等顶级咨询公司。

𝕏 OpenRouter 发布 Fusion：一次调用融合多模型输出，低成本超越前沿模型

模型聚合平台OpenRouter推出Fusion，将同一提示并行发给一组模型，再由 judge 模型合成答案。在 DRACO 基准测试中，由Gemini 3 Flash、Kimi K2.6和DeepSeek V4 Pro组成的预算面板得分64.7%，接近 Fable 5 单模型，成本约一半。三个平价模型组合以约半价达到64.7%，超过 GPT-5.5 和 Opus4.8。

𝕏 研究揭示 AI Agent 部署后会逐渐不可靠，提出 AgingBench 基准

德克萨斯大学论文发现 AI 代理在部署后即使模型不变也会逐渐退化，因为记忆压缩、事实混同、维护清空等过程会悄悄劣化。提出的AgingBench基准检查代理跨会话的可靠性。研究警告“给更多记忆”往往是错误修复。

Anthropic 即将启用实名制刷脸验证

Anthropic发送隐私政策更新邮件，从7 月 8 日起可能要求用户验证年龄或身份，通过第三方Persona上传身份证件和自拍照。验证针对消费级账户（Free、Pro、Max），且未来随 Agent 任务复杂化可能扩大范围。

古尔曼：苹果新版 Siri 相当于头部 AI 六个月前水平

彭博社古尔曼测试新版Siri后表示，苹果终于进入现代 AI 市场，但能力大致相当于领先 AI 聊天机器人六个月前的水平。新功能包括个人情境和屏幕感知。

18.42 万亿 Token！中国 AI 大模型周调用量连续七周领跑

据 OpenRouter 数据，上周全球大模型总调用量 44.6 万亿 Token，中国 18.42 万亿，连续七周超美国。DeepSeek-V4-Flash 周调用量 4.41 万亿蝉联第一，MiniMax M3 升至第二。

EVENT-DRIVEN INTELLIGENCE

免费先跟踪重点，再决定是否升级

每篇公开内容都对应三步：订阅每日情报、查看同主题历史上下文、升级 Pro 解锁搜索、研究和事件详情。

订阅每日情报查看同主题历史事件升级 Pro 解锁搜索 / 研究 / 事件详情

NEXT STEP · 留下邮箱

获取下一次重大事件提醒

每天一封精选情报，先用邮件建立复访，再决定是否升级到更深的追踪能力。

查看同主题历史事件升级 Pro 解锁事件详情