06月15日 · 科技晚报

天眼晚报

科技|2026年06月15日|161 分钟阅读
来源:1647 条推文 + 1140 篇 RSS 文章·Lanyun·DeepSeek 生成·2026-06-08
分享
AI 速读16 条精选

🤖 AI 大模型

苹果 WWDC 2026 发布全新 Siri AI 与 Apple Intelligence,深度整合 Google Gemini

WWDC 2026上,苹果正式发布基于Apple Intelligence的新一代Siri AI,采用与Google Gemini合作的基础模型,支持设备端和云端运行,涵盖 App actions、屏幕感知、图像理解等功能,并推出独立 Siri 应用。苹果在 WWDC 2026 宣布与Google深度合作,基于Gemini技术构建新Apple Foundation Models,支持设备端和Private Cloud Compute运行。全新Siri AI将于 2026 年随iOS 27上线,支持上下文理解、个性化回应,比最初承诺推迟两年。苹果官方确认,Siri AI今年晚些时候以 Beta 版推出,但欧盟地区中国大陆用户无法使用,原因是欧盟DMA法规及中国监管要求。macOS/visionOS/watchOS 在欧盟可用。

Anthropic 发布 Claude Opus 4.8 及 Claude Code 动态工作流

Anthropic发布Claude Opus 4.8,并推出Claude Code动态工作流(research preview)。该功能允许 Claude 编写脚本并行调度多个子 Agent(最高数百个),将上下文开销移出主窗口,实测 5 个 Agent 并行构建 CLI 工具耗时约 7 分钟。

小米 MiMo 与 TileRT 实现万亿参数模型每秒 1000 tokens 推理

小米 MiMo团队与TileRT合作,在商品 GPU上实现1 万亿参数模型解码速度超过1000 tokens/秒,采用 FP4 量化、DFlash 推测解码和 TileRT 运行时。小米发布 MiMo-v2.5-Pro-UltraSpeed 模型,拥有 1T 参数,推理速度达到 1000 tokens/s

Google 升级 NotebookLM:Gemini 3.5 默认模型,新增多格式输出

Google升级NotebookLM,底层模型切换至Gemini 3.5并结合Antigravity技术,提升准确性。新增详细推理步骤展示、多格式输出,面向全球付费用户开放。同时新增从聊天构建源仓库功能,将Gemini 3.5设为默认模型。

💹 微信发布 AI 生态指引,小程序可接入微信 AI

微信发布《关于开发者接入微信 AI 生态的指引》,提供自动模式与开发模式两种接入选项。自动模式无需额外开发,由微信自动分析操控小程序完成任务;开发模式供开发者自助开放特性,审核后由微信 AI 调用。当前仍处于内测阶段。

𝕏 Anthropic 联合创始人警告 AI 递归自我改进已近在眼前,呼吁全球暂停

Anthropic 联合创始人 Jack Clark 在 CNN 采访中透露Claude 已产出公司 80% 以上合并代码,每位工程师日均合并代码量为 2024 年的 8 倍。他预测几年内 Claude 将处理 100% 编码工作,并呼吁建立可验证的协调暂停机制。Anthropic建议建立类似核武器条约的AI 紧急暂停机制,理由是自我改进模型可能在2-3 年内超出人类监督节奏。截至 2026 年 5 月,合并进Anthropic代码库的代码中,超过80%Claude写的。自Claude Code发布前,这个比例还只有个位数。

𝕏 Demis Hassabis 称 AGI 可能 2030 年左右到来

Google DeepMind CEO Demis Hassabis 在斯坦福商学院访谈中表示,我们正站在奇点山脚,AGI可能在2030 年左右到来,未来几年将至关重要。

𝕏 百度文心 NAVA 音视频模型登顶 Hugging Face 趋势榜

百度文心团队发布的NAVA音视频模型以6.3B参数实现音视频同步生成,在Hugging Face趋势榜文生视频类别排名第二,达到 SOTA。

𝕏 JetBrains 开源 Mellum2 模型,12B 参数专注欧洲 AI

JetBrains发布开源模型Mellum212B总参数、2.5B激活参数,评分低于Qwen 3.5 9B,但为纯正欧洲模型。

𝕏 Cohere 开源代码模型 BLS-Mini-Code-1.0,适合本地部署

Cohere发布开源代码模型BLS-Mini-Code-1.030B总参数、3B激活参数,适合本地运行,已开放 Hugging Face 下载。

ChatGPT 新增交互式图表生成功能

ChatGPT Web 和移动 App 新增交互式图表生成功能,用户可直接在对话中创建可视化数据图表。

𝕏 Nex AGI 开源 Nex-N2 系列 agent 模型,多项 benchmark 领先

Nex-N2-Pro397B 参数Nex-N2-mini35B 参数。在 SWE-Bench Verified 上达到 80.8BrowseComp83.7。采用 Apache 2.0 许可。

𝕏 Similarweb:Gemini 网站 5 月访问量达 29 亿次,同比增长 450%

Gemini 网站 5 月访问量达 29.03 亿,连续 17 个月 增长,月环比增 5.13%,同比增 450.09%,成为全球第 12 受欢迎网站。

𝕏 Mira Murati 首次深度披露 Thinking Machines Labs 愿景

OpenAI CTO Mira Murati 自离开后首次接受全面采访,详述 AGI 初创公司 Thinking Machines Labs 的愿景:强调人类不会被排除在决策循环之外。

𝕏 OpenAI 筹备 IPO 前最大改版,转向 Codex 与 AI 智能体

OpenAI筹备 IPO 前对ChatGPT进行最大改版,目标打造集编程、AI 智能体、图像生成于一体的超级应用,转向企业业务,争取高利润收入。

𝕏 Notion 公开点名 Anthropic Opus 4.7/4.8 模型性能下降

Notion公开表示Anthropic Opus 4.7 和 4.8模型性能下降,Anthropic 状态页面显示其可用性未达99%,问题发生频率高于其他模型。

𝕏 ChatGPT 推出“锁定模式”阻止模型联网处理数据

ChatGPT推出锁定模式,类似 iOS 高级安全保护,开启后无法连接互联网或外部端点,防止数据外泄。

MiniMax 发布 M3 模型:支持 1M 上下文、多模态与 Coding Agent

MiniMax 正式发布新一代语言模型 M3,核心卖点包括:最高 1M tokens 上下文、原生多模态(图像/视频输入)、面向 Coding Agent 和长程任务执行的优化,并引入 MiniMax Sparse Attention (MSA) 降低长上下文计算成本。官方称将开放权重,API 已可用。

🔶 9 天内 Claude Code 重写 Bun 100 万行 Rust 代码,留下超 1 万个 unsafe 块

Anthropic 收购的 Bun 项目,在 9 天 内由 Claude Code 重写超过 100 万行 Rust 代码,共 6755 次提交,测试通过率 99.8%。但代码中留下超过 1 万个 unsafe 代码块(分布于 700+ 文件),引发关于 AI 生成代码安全性和可审计性的激烈讨论。

阿里巴巴成立 Token Foundry 事业部,升级大模型组织架构

阿里巴巴合并通义大模型事业部和未来生活实验室,成立Token Foundry事业部,由集团CEO 吴泳铭直接负责。AI 模型与应用服务 ARR 预计突破100 亿元

𝕏 微软 Build 2026 发布 7 个自研 MAI 模型,降低 OpenAI 依赖

微软在 Build 2026 大会上发布 7 个自研模型,统一品牌 MAI,包括推理、代码、图像、语音等模型,同时推出 Agent 专用服务器处理器和下一代量子芯片,核心叙事从“租用”转向“所有权”。

🔵 苹果 AI 危机幕后:新 Siri 诞生的内部攻防

Bloomberg 报道苹果内部极密会议,揭示 Siri 刷新背后的团队博弈,苹果认真应对 AI 领域落后局面,新 Siri 即将在 WWDC26 亮相。

AI 工具定价转向 Token 计费,企业成本治理压力上升

GitHub Copilot6 月 1 日转向 Token 计费,高级模型成本乘数最高达60 倍,Uber 等企业开始限制 AI 预算。

𝕏 AI Agent 自主发现 FFmpeg 21 个零日漏洞,仅花费约 1000 美元

安全初创公司 depthfirst 的自主 AI Agent 扫描 FFmpeg150 万行 C 代码,发现 21 个 确认零日漏洞(CVE-2026-39210 至 39218),多数存在 15-20 年,整个扫描仅花费约 1000 美元

𝕏 Weaviate 发布 Engram 托管记忆服务,突破 AI Agent 记忆瓶颈

Weaviate 宣布 Engram 全面可用(2026 年 6 月 3 日),它是一个托管记忆服务,让 LLM Agent 能从对话中学习而不降低速度,被视为 Agent 基础设施的关键缺失环节。同时开放 Weaviate Cloud 免费阶层。

微软发布 MAI-Transcribe-1.5 语音识别模型

微软 发布 MAI-Transcribe-1.5,支持 43 种语言,词错误率 2.4%,长音频转录速度提升 5x,支持关键词偏置。

OpenAI 前研究员 Ethan He 深度解析视频模型现状

前 NVIDIA/xAI 研究员 Ethan He 访谈揭示:视频模型的关键进步来自语言模型而非视觉本身视频智能体 今年年底将爆发。

CVPR 2026 最佳论文揭晓:D4RT 封神,ResNet/YOLO 获时间检验奖

CVPR 2026闭幕,Google DeepMindD4RT获最佳论文奖Oxford VGG实现背靠背两连冠;何恺明团队的ResNetYOLO同获Longuet-Higgins 时间检验奖PhysInOne数据集发布,被誉为视觉物理的 ImageNet 时刻。


EVENT-DRIVEN INTELLIGENCE

免费先跟踪重点,再决定是否升级

每篇公开内容都对应三步:订阅每日情报、查看同主题历史上下文、升级 Pro 解锁搜索、研究和事件详情。

分享

NEXT STEP · 留下邮箱

获取下一次重大事件提醒

每天一封精选情报,先用邮件建立复访,再决定是否升级到更深的追踪能力。