天眼晚报
🤖 AI 大模型
微软 Build 2026 发布 7 款 AI 模型,包括 MAI-Thinking-1 推理模型
微软在 Build 2026 发布7 款新 AI 模型,包括旗舰推理模型MAI Thinking-1(对标 Anthropic Sonnet 4.6)和超高效编码模型MAI-Code-1-Flash(5B 参数)。MAI-Thinking-1 是微软首个通用推理模型,声称在不依赖第三方模型蒸馏的情况下匹配领先模型。AI 负责人 Mustafa Suleyman 称六个月缩小了与 Anthropic 的巨大差距。
英伟达与微软合作打造面向 Agentic AI 的统一技术栈
英伟达与微软宣布合作,开发面向代理式人工智能的统一技术栈,涵盖从 Windows 设备到云端的全栈部署。双方在 Build 2026 上展示 RTX Spark、DGX Station 等新品。
𝕏 Anthropic 向 SEC 秘密提交 IPO 文件,计划秋季上市
Anthropic已向 SEC 秘密提交S-1草案,启动上市流程。这是开发了Claude AI 模型的公司正式走向 IPO 的第一步,预计将披露营收、亏损、毛利率等核心财务数据。Anthropic 周一表示已秘密申请 IPO,可能使公司有望于今年秋季上市,这将是 AI 领域最具影响力的 IPO 之一。
💻 Anthropic 将 Claude Mythos 扩展至 15 国关键基础设施,覆盖 150 家机构
Anthropic宣布将高端Mythos模型访问权扩展至15 个国家的约150 家新机构,覆盖电力、水务、医疗和通信基础设施,影响可达1 亿人。合作伙伴总数达约 200 家。据 Palo Alto Networks 测试,Mythos 安全模型三周发现 20 多个严重漏洞,是传统工具的 5 倍,但费用高昂,两周烧掉超100 万美元,定价为 Opus 的 6 倍。
OpenAI 推出 Codex 新功能 Sites 和 Annotations,面向知识工作者发布专用插件
OpenAI为Codex推出 Sites(创建可分享网站)、Annotations(选定区域修改)以及 6 个针对数据分析、销售、投行等知识工作的专用插件。同时推进金融、法律领域 AI 工具计划,目标年底企业客户收入占比达 50%。目前 Codex 每周活跃用户达500 万,其中**20%**为非程序员的知识工作者。从 6 月起 OpenAI 加强 Codex 风控,免费额度从周限额改为月限额,登陆必须验证手机号,打击号池。Codex 用户增长在达到 500 万后有所放缓。
OpenAI 挖走中科大少年班校友、哈佛最年轻正教授
OpenAI挖走中科大少年班校友,12 岁上大学、哈佛史上最年轻正教授,同时挖走苏炜杰。
🔶 Claude Opus 4.8 发布:更强编码、更诚实,ARC-AGI-3 断崖领先
Anthropic发布Claude Opus 4.8,SWE-bench Pro 从 64.3 升至69.2,新增动态工作流和努力级别控制,价格不变。在 ARC-AGI-3 上得分1.5%为史上最高,是第二名Opus 4.6的 3 倍、GPT-5.5的 4 倍,单次评测成本高达1 万美元。评论称其为当前最强模型。
𝕏 GPT-6 代号 Spud:原生多模态架构,200 万 token 上下文
OpenAI即将发布GPT-6,代号 Spud。采用Symphony架构原生处理文本/图像/音频/视频,上下文窗口达200 万 token,编码推理性能提升40%+,同时关停烧钱的 Sora。
🤗 Holo3.1 发布:快速本地化计算机使用 Agent
Hugging Face博客发布Holo3.1,一个快速、本地的计算机使用代理模型,可在用户设备上运行,无需云端。
𝕏 英伟达即将发布 Nemotron 3 Ultra 模型,采用混合 SSM+MoE 架构
英伟达CEO 黄仁勋在 GTC Taipei 2026 上宣布,Nemotron 3 Ultra将在几天内可用,采用混合 SSM(状态空间模型)+MoE 架构,优化长序列推理和工具使用。
𝕏 OpenAI 后训练团队负责人详解 GPT-5.5 背后的三大突破
OpenAI后训练前沿团队联合负责人Yann Dubois在播客中称,AI 进步是连续的,当可靠性跨过阈值(2024 年 12 月),工具突然"可用"。三大驱动力:可靠性达标、模型自我加速、RL 扩展到真实用例。
阿里发布 Qwen3.7-Plus 多模态智能体,支持视觉与 Agent 能力
阿里巴巴发布Qwen3.7-Plus多模态混合 AI 智能体,同时支持图像、视频、屏幕输入和 CLI 命令执行,具备深度推理、自编程、工具调用和自主迭代能力。在 Vision Arena 成绩中国第 1、全球前 5,无需 API 即可操控电脑。
🔶 豆包即将收费:最高 5088 元/年,三级订阅体系公布
字节跳动旗下 AI 助手豆包将于 6 月下旬上线付费内容,标准版68 元/月,加强版200 元/月,专业版500 元/月(年付 5088 元)。免费基础功能保留,旨在探索增值服务。
🔶 美团 AI 助手“小美”与腾讯“元宝”合作,Agent 间交互落地
美团AI 助手“小美”即将接入腾讯元宝,用户可通过元宝调用外卖等本地生活服务。这是 AI Agent 间的直接交互,美团成为本地生活底层能力提供者。
𝕏 微信即将推出 AI Agent,第三季度上线调用小程序
据多个信源证实,微信计划在2026 年第三季度推出内置AI Agent,可通过混元大模型调用平台内数百万个小程序,深度绑定微信生态。英国《金融时报》报道腾讯接近推出微信 AI 助手,可协助用户在微信内完成任务,最早本月启动合规流程。
𝕏 MiniMax M3 开源并发布多模态实测,100 万 token 上下文
MiniMax发布新一代模型M3并开源,支持100 万 token上下文,编码/Agent/多模态三合一,定价**$0.05**,对标 GPT-5.5 与 DeepSeek。量子位实测显示其能识别老黄 PPT 中74 个 Logo并规划同款旅游路线。在 Vercel Next.js 评估中排名第6,基础分75%,使用 AGENTS.md 后达96%,成本仅为闭源模型的十分之一。
百度发布 PaddleOCR-VL-1.6,准确率 96.33%刷新文档解析 SOTA
百度发布PaddleOCR-VL-1.6,在 OmniDocBench 评测中以**96.33%**准确率超越 Gemini-3-Pro 等模型,支持超 100 种语言。
Mistral AI 全面转型全栈服务商,自建数据中心
Mistral AI在峰会上宣布从模型研发向全栈 AI 供应商转型,已在巴黎拥有40MW数据中心,并推出企业 AI 助手、多款垂直模型。
🔶 腾讯云大模型全面降价:DeepSeek-V4 系列最高降 97.5%
腾讯云宣布 6 月 3 日起DeepSeek-V4-Pro推理价格降75%,缓存命中价格降97.5%;V4-Flash缓存价格降90%,彻底持平官方原厂价,大幅降低企业接入门槛。模型服务能力保持不变。
字节跳动开源视频统一框架 Bernini,AI 视频编辑先理解再动手
字节跳动开源Bernini框架,为 DiT 模型配备“大模型军师”,实现 AI 视频编辑的先理解后操作。该项目已提交 ComfyUI 实现,可对Wan 2.2进行微调。
JetBrains 开源 Mellum2:12B MoE 模型,专注软件工程
JetBrains开源Mellum2,12B 总参数/2.5B 激活的 MoE 模型,Apache 2.0 许可,支持131K上下文,在 EvalPlus 达78.4,专为多模型 AI 流水线中的快速专用任务设计。
🔶 北京新增 10 款已完成备案的生成式 AI 服务
据网信北京,截至2026 年 6 月 2 日,北京市新增 10 款已完成备案的生成式人工智能服务,累计完成 241 款备案。
奥特曼反驳 AI 导致裁员说法:采用 AI 最多的公司招聘最多
Sam Altman反驳 AI 导致裁员观点,指出实际采用 AI 最多的企业招聘投入也最多。他承认此前模型能力"不均衡",并后悔GPT-5.2新闻稿措辞引发失业恐慌。
Anthropic 与 OpenAI 全面开战:营收反超、抢上市、抢国防合同
Anthropic与OpenAI正式进入全面竞争,营收反超、利润转正、同步抢上市、抢客户,甚至国防合同正面对抗,AI 行业双寡头格局形成。
EVENT-DRIVEN INTELLIGENCE
免费先跟踪重点,再决定是否升级
每篇公开内容都对应三步:订阅每日情报、查看同主题历史上下文、升级 Pro 解锁搜索、研究和事件详情。