天眼晚报

科技|2026年06月15日|约 161 分钟阅读

来源：1647 条推文 + 1140 篇 RSS 文章·Lanyun·DeepSeek 生成·2026-06-08

AI 速读16 条精选

🤖 AI 大模型

苹果 WWDC 2026 发布全新 Siri AI 与 Apple Intelligence，深度整合 Google Gemini

在WWDC 2026上，苹果正式发布基于Apple Intelligence的新一代Siri AI，采用与Google Gemini合作的基础模型，支持设备端和云端运行，涵盖 App actions、屏幕感知、图像理解等功能，并推出独立 Siri 应用。苹果在 WWDC 2026 宣布与Google深度合作，基于Gemini技术构建新Apple Foundation Models，支持设备端和Private Cloud Compute运行。全新Siri AI将于 2026 年随iOS 27上线，支持上下文理解、个性化回应，比最初承诺推迟两年。苹果官方确认，Siri AI今年晚些时候以 Beta 版推出，但欧盟地区和中国大陆用户无法使用，原因是欧盟DMA法规及中国监管要求。macOS/visionOS/watchOS 在欧盟可用。

Anthropic 发布 Claude Opus 4.8 及 Claude Code 动态工作流

Anthropic发布Claude Opus 4.8，并推出Claude Code动态工作流（research preview）。该功能允许 Claude 编写脚本并行调度多个子 Agent（最高数百个），将上下文开销移出主窗口，实测 5 个 Agent 并行构建 CLI 工具耗时约 7 分钟。

小米 MiMo 与 TileRT 实现万亿参数模型每秒 1000 tokens 推理

小米 MiMo团队与TileRT合作，在商品 GPU上实现1 万亿参数模型解码速度超过1000 tokens/秒，采用 FP4 量化、DFlash 推测解码和 TileRT 运行时。小米发布 MiMo-v2.5-Pro-UltraSpeed 模型，拥有 1T 参数，推理速度达到 1000 tokens/s。

Google 升级 NotebookLM：Gemini 3.5 默认模型，新增多格式输出

Google升级NotebookLM，底层模型切换至Gemini 3.5并结合Antigravity技术，提升准确性。新增详细推理步骤展示、多格式输出，面向全球付费用户开放。同时新增从聊天构建源仓库功能，将Gemini 3.5设为默认模型。

💹 微信发布 AI 生态指引，小程序可接入微信 AI

微信发布《关于开发者接入微信 AI 生态的指引》，提供自动模式与开发模式两种接入选项。自动模式无需额外开发，由微信自动分析操控小程序完成任务；开发模式供开发者自助开放特性，审核后由微信 AI 调用。当前仍处于内测阶段。

𝕏 Anthropic 联合创始人警告 AI 递归自我改进已近在眼前，呼吁全球暂停

Anthropic 联合创始人 Jack Clark 在 CNN 采访中透露：Claude 已产出公司 80% 以上合并代码，每位工程师日均合并代码量为 2024 年的 8 倍。他预测几年内 Claude 将处理 100% 编码工作，并呼吁建立可验证的协调暂停机制。Anthropic建议建立类似核武器条约的AI 紧急暂停机制，理由是自我改进模型可能在2-3 年内超出人类监督节奏。截至 2026 年 5 月，合并进Anthropic代码库的代码中，超过80%是Claude写的。自Claude Code发布前，这个比例还只有个位数。

𝕏 Demis Hassabis 称 AGI 可能 2030 年左右到来

Google DeepMind CEO Demis Hassabis 在斯坦福商学院访谈中表示，我们正站在奇点山脚，AGI可能在2030 年左右到来，未来几年将至关重要。

𝕏 百度文心 NAVA 音视频模型登顶 Hugging Face 趋势榜

百度文心团队发布的NAVA音视频模型以6.3B参数实现音视频同步生成，在Hugging Face趋势榜文生视频类别排名第二，达到 SOTA。

𝕏 JetBrains 开源 Mellum2 模型，12B 参数专注欧洲 AI

JetBrains发布开源模型Mellum2，12B总参数、2.5B激活参数，评分低于Qwen 3.5 9B，但为纯正欧洲模型。

𝕏 Cohere 开源代码模型 BLS-Mini-Code-1.0，适合本地部署

Cohere发布开源代码模型BLS-Mini-Code-1.0，30B总参数、3B激活参数，适合本地运行，已开放 Hugging Face 下载。

ChatGPT 新增交互式图表生成功能

ChatGPT Web 和移动 App 新增交互式图表生成功能，用户可直接在对话中创建可视化数据图表。

𝕏 Nex AGI 开源 Nex-N2 系列 agent 模型，多项 benchmark 领先

Nex-N2-Pro 为 397B 参数，Nex-N2-mini 为 35B 参数。在 SWE-Bench Verified 上达到 80.8，BrowseComp 上 83.7。采用 Apache 2.0 许可。

𝕏 Similarweb：Gemini 网站 5 月访问量达 29 亿次，同比增长 450%

Gemini 网站 5 月访问量达 29.03 亿 次，连续 17 个月 增长，月环比增 5.13%，同比增 450.09%，成为全球第 12 受欢迎网站。

𝕏 Mira Murati 首次深度披露 Thinking Machines Labs 愿景

前 OpenAI CTO Mira Murati 自离开后首次接受全面采访，详述 AGI 初创公司 Thinking Machines Labs 的愿景：强调人类不会被排除在决策循环之外。

𝕏 OpenAI 筹备 IPO 前最大改版，转向 Codex 与 AI 智能体

OpenAI筹备 IPO 前对ChatGPT进行最大改版，目标打造集编程、AI 智能体、图像生成于一体的超级应用，转向企业业务，争取高利润收入。

𝕏 Notion 公开点名 Anthropic Opus 4.7/4.8 模型性能下降

Notion公开表示Anthropic Opus 4.7 和 4.8模型性能下降，Anthropic 状态页面显示其可用性未达99%，问题发生频率高于其他模型。

𝕏 ChatGPT 推出“锁定模式”阻止模型联网处理数据

ChatGPT推出锁定模式，类似 iOS 高级安全保护，开启后无法连接互联网或外部端点，防止数据外泄。

MiniMax 发布 M3 模型：支持 1M 上下文、多模态与 Coding Agent

MiniMax 正式发布新一代语言模型 M3，核心卖点包括：最高 1M tokens 上下文、原生多模态（图像/视频输入）、面向 Coding Agent 和长程任务执行的优化，并引入 MiniMax Sparse Attention (MSA) 降低长上下文计算成本。官方称将开放权重，API 已可用。

🔶 9 天内 Claude Code 重写 Bun 100 万行 Rust 代码，留下超 1 万个 unsafe 块

Anthropic 收购的 Bun 项目，在 9 天 内由 Claude Code 重写超过 100 万行 Rust 代码，共 6755 次提交，测试通过率 99.8%。但代码中留下超过 1 万个 unsafe 代码块（分布于 700+ 文件），引发关于 AI 生成代码安全性和可审计性的激烈讨论。

阿里巴巴成立 Token Foundry 事业部，升级大模型组织架构

阿里巴巴合并通义大模型事业部和未来生活实验室，成立Token Foundry事业部，由集团CEO 吴泳铭直接负责。AI 模型与应用服务 ARR 预计突破100 亿元。

𝕏 微软 Build 2026 发布 7 个自研 MAI 模型，降低 OpenAI 依赖

微软在 Build 2026 大会上发布 7 个自研模型，统一品牌 MAI，包括推理、代码、图像、语音等模型，同时推出 Agent 专用服务器处理器和下一代量子芯片，核心叙事从“租用”转向“所有权”。

🔵 苹果 AI 危机幕后：新 Siri 诞生的内部攻防

Bloomberg 报道苹果内部极密会议，揭示 Siri 刷新背后的团队博弈，苹果认真应对 AI 领域落后局面，新 Siri 即将在 WWDC26 亮相。

AI 工具定价转向 Token 计费，企业成本治理压力上升

GitHub Copilot自6 月 1 日转向 Token 计费，高级模型成本乘数最高达60 倍，Uber 等企业开始限制 AI 预算。

𝕏 AI Agent 自主发现 FFmpeg 21 个零日漏洞，仅花费约 1000 美元

安全初创公司 depthfirst 的自主 AI Agent 扫描 FFmpeg 约 150 万行 C 代码，发现 21 个 确认零日漏洞（CVE-2026-39210 至 39218），多数存在 15-20 年，整个扫描仅花费约 1000 美元。

𝕏 Weaviate 发布 Engram 托管记忆服务，突破 AI Agent 记忆瓶颈

Weaviate 宣布 Engram 全面可用（2026 年 6 月 3 日），它是一个托管记忆服务，让 LLM Agent 能从对话中学习而不降低速度，被视为 Agent 基础设施的关键缺失环节。同时开放 Weaviate Cloud 免费阶层。

微软发布 MAI-Transcribe-1.5 语音识别模型

微软发布 MAI-Transcribe-1.5，支持 43 种语言，词错误率 2.4%，长音频转录速度提升 5x，支持关键词偏置。

OpenAI 前研究员 Ethan He 深度解析视频模型现状

前 NVIDIA/xAI 研究员 Ethan He 访谈揭示：视频模型的关键进步来自语言模型而非视觉本身，视频智能体 今年年底将爆发。

CVPR 2026 最佳论文揭晓：D4RT 封神，ResNet/YOLO 获时间检验奖

CVPR 2026闭幕，Google DeepMind的D4RT获最佳论文奖，Oxford VGG实现背靠背两连冠；何恺明团队的ResNet与YOLO同获Longuet-Higgins 时间检验奖；PhysInOne数据集发布，被誉为视觉物理的 ImageNet 时刻。

EVENT-DRIVEN INTELLIGENCE

免费先跟踪重点，再决定是否升级

每篇公开内容都对应三步：订阅每日情报、查看同主题历史上下文、升级 Pro 解锁搜索、研究和事件详情。

订阅每日情报查看同主题历史事件升级 Pro 解锁搜索 / 研究 / 事件详情

NEXT STEP · 留下邮箱

获取下一次重大事件提醒

每天一封精选情报，先用邮件建立复访，再决定是否升级到更深的追踪能力。

查看同主题历史事件升级 Pro 解锁事件详情