天眼早报

科技|2026年06月15日|约 122 分钟阅读

来源：1740 条推文 + 1082 篇 RSS 文章·Lanyun·DeepSeek 生成·2026-06-03 — 2026-06-04

AI 速读13 条精选

🤖 AI 大模型

🔶 大模型安全攻防实测：GPT-5.5 成功率 70%夺冠，DeepSeek V4 Pro 性价比最佳

安全研究员 Kasra Rahjerdi 花费1500 美元，让十余款大模型对含漏洞的 APK 进行渗透测试。GPT-5.5以**70%**成功率排名第一，DeepSeek V4 Pro以30%成功率位居第二，每次成本仅0.19 美元。Qwen 3.7 Max未能复现预期，Gemini系列因安全策略多次拒绝任务。

𝕏 Google 发布 Gemma 4 12B：无编码器多模态开源模型，16GB 显存本地运行

Google正式发布Gemma 4 12B，采用无编码器架构，原生支持文本、图像、音频输入，256K上下文，Apache 2.0许可证。仅需16GB VRAM即可在笔记本上本地运行，性能接近26B MoE模型。AIME 2026 得分 77.5%，LiveCodeBench v6 得分 72.0%，支持 140+种语言。已获 llama.cpp、vLLM、Transformers 等框架首日支持，同时由 DeepMind CEO Demis Hassabis 宣布。

𝕏 Miso One 开源：8B 参数高情感语音模型，延迟仅 110 毫秒

Miso One发布，一个8B参数的文本转语音模型，支持高度情感化表达，延迟仅110 毫秒。专为短视频、播客、教育内容设计，模型权重已开源，API 即将开放，可自托管和微调。

𝕏 Ideogram 4.0 开放权重，成为最佳开源文生图模型

Ideogram 4.0正式开放模型权重，支持下载、微调并运行在自有硬件上。在 Text-to-Image Arena 中得分1204，成为第一开源模型，覆盖摄影、艺术、卡通、文字设计等多种视觉风格，文本渲染和商业设计提升显著。

🔶 阶跃 Step 3.7 Flash 位列输出速度榜主流第一

阶跃 Step 3.7 Flash以409 tokens/s速度位列 Artificial Analysis 输出速度榜第一。

xAI 暂停招聘用于训练 Grok 的“AI 导师”

知情人士透露，xAI已暂停招聘AI 导师，原因包括 HR 不堪重负。去年已裁减多名全能型导师，转向专门数据标注人员。

谷歌 AI Edge Gallery 登陆 macOS，支持本地运行 Gemma 模型

6 月 4 日，谷歌 AI Edge Gallery登陆macOS，提供Gemma-4-12B-it等 5 个模型。附带免费听写应用Google AI Edge Eloquent。

𝕏 MiniMax-M3 加入英伟达和微软本地 LLM 阵容

MiniMax-M3亮相GTC Taipei，支持1M 上下文、强编码能力和原生多模态，属于开源权重模型。

奥特曼：OpenAI 内部最高用户每月消耗约 1000 亿个 token

Sam Altman透露，OpenAI内部最高 token 用户每月消耗约1000 亿个 token，外部用户更多。6 年半前最高用户仅10 万 token。AI 成本压力已成为“巨大问题”。

谷歌 Gemini 搜索 AI 概览月活达 25 亿，Gemini App 月活超 9 亿

Alphabet披露，Gemini App月活跃用户突破9 亿，AI Overviews月活跃用户达25 亿（全球超 30%人口）。Gemini 3.5 Pro预计本月推出。

Meta 推出 Business Agent，企业可用 AI 客服智能体

Meta推出Meta Business Agent，企业可使用 AI 智能体回复客户消息、推荐商品、完成销售转化，并决定何时由真人接手。

𝕏 微软发布 MAI-Thinking-1 推理模型与强化学习系统

微软发布MAI-Thinking-1推理模型，采用1T 参数 MoE 架构（35B 活跃参数），在 AIME 2025 达到97.0%，LiveCodeBench v6 达 87.7%，从零训练 30T token，未使用第三方模型蒸馏。同时发布基于SGLang和Ray的大规模强化学习推理系统，整合异步 RL 和容错推理基础设施。

𝕏 百度文心开源 6.3B 参数音视频生成模型 NAVA

百度文心团队开源NAVA模型（6.3B 参数），在音视频生成任务上实现 SOTA，图像质量胜率80%，音视频对齐胜率72.5%，超越daVinci和Ovi等更大模型。

𝕏 Anthropic 将 Claude Mythos 安全模型扩展至 200 家机构，发现超 1 万个严重漏洞

Anthropic将Claude Mythos Preview从约 50 个合作伙伴扩展到约200 个经过审查的机构，涉及电力、医疗、水务等关键领域。合作伙伴已发现**1 万+**高危或严重漏洞。

𝕏 Claude AI 5 月流量首超 9 亿次，连续五个月增长

Similarweb初步数据显示，Claude AI 5 月总访问量超过9 亿次，月环比增长12%，实现连续第五个月增长。

𝕏 Gemini Thinking Levels 现已在 Web、iOS 和 Android 全平台上线

Google Gemini的Thinking Levels功能已覆盖 Web、iOS 和 Android 全平台。

🐙 Datalab 发布 Surya OCR 2，650M 参数性能领先小模型

Datalab发布Surya OCR 2，650M 参数模型在olmOCR-bench上得分83.3%，支持 90+语言，速度达5 页/秒。支持布局分析、表格识别和阅读顺序。

🔶 Meta 一再推迟面向开发者的新 AI 模型发布

Meta多次推迟发布 Muse Spark AI 模型 API，尚未确定日期。

EVENT-DRIVEN INTELLIGENCE

免费先跟踪重点，再决定是否升级

每篇公开内容都对应三步：订阅每日情报、查看同主题历史上下文、升级 Pro 解锁搜索、研究和事件详情。

订阅每日情报查看同主题历史事件升级 Pro 解锁搜索 / 研究 / 事件详情

NEXT STEP · 留下邮箱

获取下一次重大事件提醒

每天一封精选情报，先用邮件建立复访，再决定是否升级到更深的追踪能力。

查看同主题历史事件升级 Pro 解锁事件详情