天眼晚报

科技|2026年06月15日|约 172 分钟阅读

来源：1798 条推文 + 1171 篇 RSS 文章·Lanyun·DeepSeek 生成·2026-06-02

AI 速读16 条精选

🤖 AI 大模型

微软 Build 2026 发布 7 款 AI 模型，包括 MAI-Thinking-1 推理模型

微软在 Build 2026 发布7 款新 AI 模型，包括旗舰推理模型MAI Thinking-1（对标 Anthropic Sonnet 4.6）和超高效编码模型MAI-Code-1-Flash（5B 参数）。MAI-Thinking-1 是微软首个通用推理模型，声称在不依赖第三方模型蒸馏的情况下匹配领先模型。AI 负责人 Mustafa Suleyman 称六个月缩小了与 Anthropic 的巨大差距。

英伟达与微软合作打造面向 Agentic AI 的统一技术栈

英伟达与微软宣布合作，开发面向代理式人工智能的统一技术栈，涵盖从 Windows 设备到云端的全栈部署。双方在 Build 2026 上展示 RTX Spark、DGX Station 等新品。

𝕏 Anthropic 向 SEC 秘密提交 IPO 文件，计划秋季上市

Anthropic已向 SEC 秘密提交S-1草案，启动上市流程。这是开发了Claude AI 模型的公司正式走向 IPO 的第一步，预计将披露营收、亏损、毛利率等核心财务数据。Anthropic 周一表示已秘密申请 IPO，可能使公司有望于今年秋季上市，这将是 AI 领域最具影响力的 IPO 之一。

💻 Anthropic 将 Claude Mythos 扩展至 15 国关键基础设施，覆盖 150 家机构

Anthropic宣布将高端Mythos模型访问权扩展至15 个国家的约150 家新机构，覆盖电力、水务、医疗和通信基础设施，影响可达1 亿人。合作伙伴总数达约 200 家。据 Palo Alto Networks 测试，Mythos 安全模型三周发现 20 多个严重漏洞，是传统工具的 5 倍，但费用高昂，两周烧掉超100 万美元，定价为 Opus 的 6 倍。

OpenAI 推出 Codex 新功能 Sites 和 Annotations，面向知识工作者发布专用插件

OpenAI为Codex推出 Sites（创建可分享网站）、Annotations（选定区域修改）以及 6 个针对数据分析、销售、投行等知识工作的专用插件。同时推进金融、法律领域 AI 工具计划，目标年底企业客户收入占比达 50%。目前 Codex 每周活跃用户达500 万，其中**20%**为非程序员的知识工作者。从 6 月起 OpenAI 加强 Codex 风控，免费额度从周限额改为月限额，登陆必须验证手机号，打击号池。Codex 用户增长在达到 500 万后有所放缓。

OpenAI 挖走中科大少年班校友、哈佛最年轻正教授

OpenAI挖走中科大少年班校友，12 岁上大学、哈佛史上最年轻正教授，同时挖走苏炜杰。

🔶 Claude Opus 4.8 发布：更强编码、更诚实，ARC-AGI-3 断崖领先

Anthropic发布Claude Opus 4.8，SWE-bench Pro 从 64.3 升至69.2，新增动态工作流和努力级别控制，价格不变。在 ARC-AGI-3 上得分1.5%为史上最高，是第二名Opus 4.6的 3 倍、GPT-5.5的 4 倍，单次评测成本高达1 万美元。评论称其为当前最强模型。

𝕏 GPT-6 代号 Spud：原生多模态架构，200 万 token 上下文

OpenAI即将发布GPT-6，代号 Spud。采用Symphony架构原生处理文本/图像/音频/视频，上下文窗口达200 万 token，编码推理性能提升40%+，同时关停烧钱的 Sora。

🤗 Holo3.1 发布：快速本地化计算机使用 Agent

Hugging Face博客发布Holo3.1，一个快速、本地的计算机使用代理模型，可在用户设备上运行，无需云端。

𝕏 英伟达即将发布 Nemotron 3 Ultra 模型，采用混合 SSM+MoE 架构

英伟达CEO 黄仁勋在 GTC Taipei 2026 上宣布，Nemotron 3 Ultra将在几天内可用，采用混合 SSM（状态空间模型）+MoE 架构，优化长序列推理和工具使用。

𝕏 OpenAI 后训练团队负责人详解 GPT-5.5 背后的三大突破

OpenAI后训练前沿团队联合负责人Yann Dubois在播客中称，AI 进步是连续的，当可靠性跨过阈值（2024 年 12 月），工具突然"可用"。三大驱动力：可靠性达标、模型自我加速、RL 扩展到真实用例。

阿里发布 Qwen3.7-Plus 多模态智能体，支持视觉与 Agent 能力

阿里巴巴发布Qwen3.7-Plus多模态混合 AI 智能体，同时支持图像、视频、屏幕输入和 CLI 命令执行，具备深度推理、自编程、工具调用和自主迭代能力。在 Vision Arena 成绩中国第 1、全球前 5，无需 API 即可操控电脑。

🔶 豆包即将收费：最高 5088 元/年，三级订阅体系公布

字节跳动旗下 AI 助手豆包将于 6 月下旬上线付费内容，标准版68 元/月，加强版200 元/月，专业版500 元/月（年付 5088 元）。免费基础功能保留，旨在探索增值服务。

🔶 美团 AI 助手“小美”与腾讯“元宝”合作，Agent 间交互落地

美团AI 助手“小美”即将接入腾讯元宝，用户可通过元宝调用外卖等本地生活服务。这是 AI Agent 间的直接交互，美团成为本地生活底层能力提供者。

𝕏 微信即将推出 AI Agent，第三季度上线调用小程序

据多个信源证实，微信计划在2026 年第三季度推出内置AI Agent，可通过混元大模型调用平台内数百万个小程序，深度绑定微信生态。英国《金融时报》报道腾讯接近推出微信 AI 助手，可协助用户在微信内完成任务，最早本月启动合规流程。

𝕏 MiniMax M3 开源并发布多模态实测，100 万 token 上下文

MiniMax发布新一代模型M3并开源，支持100 万 token上下文，编码/Agent/多模态三合一，定价**$0.05**，对标 GPT-5.5 与 DeepSeek。量子位实测显示其能识别老黄 PPT 中74 个 Logo并规划同款旅游路线。在 Vercel Next.js 评估中排名第6，基础分75%，使用 AGENTS.md 后达96%，成本仅为闭源模型的十分之一。

百度发布 PaddleOCR-VL-1.6，准确率 96.33%刷新文档解析 SOTA

百度发布PaddleOCR-VL-1.6，在 OmniDocBench 评测中以**96.33%**准确率超越 Gemini-3-Pro 等模型，支持超 100 种语言。

Mistral AI 全面转型全栈服务商，自建数据中心

Mistral AI在峰会上宣布从模型研发向全栈 AI 供应商转型，已在巴黎拥有40MW数据中心，并推出企业 AI 助手、多款垂直模型。

🔶 腾讯云大模型全面降价：DeepSeek-V4 系列最高降 97.5%

腾讯云宣布 6 月 3 日起DeepSeek-V4-Pro推理价格降75%，缓存命中价格降97.5%；V4-Flash缓存价格降90%，彻底持平官方原厂价，大幅降低企业接入门槛。模型服务能力保持不变。

字节跳动开源视频统一框架 Bernini，AI 视频编辑先理解再动手

字节跳动开源Bernini框架，为 DiT 模型配备“大模型军师”，实现 AI 视频编辑的先理解后操作。该项目已提交 ComfyUI 实现，可对Wan 2.2进行微调。

JetBrains 开源 Mellum2：12B MoE 模型，专注软件工程

JetBrains开源Mellum2，12B 总参数/2.5B 激活的 MoE 模型，Apache 2.0 许可，支持131K上下文，在 EvalPlus 达78.4，专为多模型 AI 流水线中的快速专用任务设计。

🔶 北京新增 10 款已完成备案的生成式 AI 服务

据网信北京，截至2026 年 6 月 2 日，北京市新增 10 款已完成备案的生成式人工智能服务，累计完成 241 款备案。

奥特曼反驳 AI 导致裁员说法：采用 AI 最多的公司招聘最多

Sam Altman反驳 AI 导致裁员观点，指出实际采用 AI 最多的企业招聘投入也最多。他承认此前模型能力"不均衡"，并后悔GPT-5.2新闻稿措辞引发失业恐慌。

Anthropic 与 OpenAI 全面开战：营收反超、抢上市、抢国防合同

Anthropic与OpenAI正式进入全面竞争，营收反超、利润转正、同步抢上市、抢客户，甚至国防合同正面对抗，AI 行业双寡头格局形成。

EVENT-DRIVEN INTELLIGENCE

免费先跟踪重点，再决定是否升级

每篇公开内容都对应三步：订阅每日情报、查看同主题历史上下文、升级 Pro 解锁搜索、研究和事件详情。

订阅每日情报查看同主题历史事件升级 Pro 解锁搜索 / 研究 / 事件详情

NEXT STEP · 留下邮箱

获取下一次重大事件提醒

每天一封精选情报，先用邮件建立复访，再决定是否升级到更深的追踪能力。

查看同主题历史事件升级 Pro 解锁事件详情