06月15日 · 科技早报

天眼早报

科技|2026年06月15日|122 分钟阅读
来源:1740 条推文 + 1082 篇 RSS 文章·Lanyun·DeepSeek 生成·2026-06-03 — 2026-06-04
分享
AI 速读13 条精选

🤖 AI 大模型

🔶 大模型安全攻防实测:GPT-5.5 成功率 70%夺冠,DeepSeek V4 Pro 性价比最佳

安全研究员 Kasra Rahjerdi 花费1500 美元,让十余款大模型对含漏洞的 APK 进行渗透测试。GPT-5.5以**70%**成功率排名第一DeepSeek V4 Pro30%成功率位居第二,每次成本仅0.19 美元Qwen 3.7 Max未能复现预期,Gemini系列因安全策略多次拒绝任务。

𝕏 Google 发布 Gemma 4 12B:无编码器多模态开源模型,16GB 显存本地运行

Google正式发布Gemma 4 12B,采用无编码器架构,原生支持文本、图像、音频输入,256K上下文,Apache 2.0许可证。仅需16GB VRAM即可在笔记本上本地运行,性能接近26B MoE模型。AIME 2026 得分 77.5%,LiveCodeBench v6 得分 72.0%,支持 140+种语言。已获 llama.cpp、vLLM、Transformers 等框架首日支持,同时由 DeepMind CEO Demis Hassabis 宣布。

𝕏 Miso One 开源:8B 参数高情感语音模型,延迟仅 110 毫秒

Miso One发布,一个8B参数的文本转语音模型,支持高度情感化表达,延迟仅110 毫秒。专为短视频、播客、教育内容设计,模型权重已开源,API 即将开放,可自托管和微调。

𝕏 Ideogram 4.0 开放权重,成为最佳开源文生图模型

Ideogram 4.0正式开放模型权重,支持下载、微调并运行在自有硬件上。在 Text-to-Image Arena 中得分1204,成为第一开源模型,覆盖摄影、艺术、卡通、文字设计等多种视觉风格,文本渲染和商业设计提升显著。

🔶 阶跃 Step 3.7 Flash 位列输出速度榜主流第一

阶跃 Step 3.7 Flash409 tokens/s速度位列 Artificial Analysis 输出速度榜第一

xAI 暂停招聘用于训练 Grok 的“AI 导师”

知情人士透露,xAI已暂停招聘AI 导师,原因包括 HR 不堪重负。去年已裁减多名全能型导师,转向专门数据标注人员。

6 月 4 日,谷歌 AI Edge Gallery登陆macOS,提供Gemma-4-12B-it等 5 个模型。附带免费听写应用Google AI Edge Eloquent

𝕏 MiniMax-M3 加入英伟达和微软本地 LLM 阵容

MiniMax-M3亮相GTC Taipei,支持1M 上下文、强编码能力和原生多模态,属于开源权重模型。

奥特曼:OpenAI 内部最高用户每月消耗约 1000 亿个 token

Sam Altman透露,OpenAI内部最高 token 用户每月消耗约1000 亿个 token,外部用户更多。6 年半前最高用户仅10 万 token。AI 成本压力已成为“巨大问题”。

谷歌 Gemini 搜索 AI 概览月活达 25 亿,Gemini App 月活超 9 亿

Alphabet披露,Gemini App月活跃用户突破9 亿AI Overviews月活跃用户达25 亿(全球超 30%人口)。Gemini 3.5 Pro预计本月推出。

Meta 推出 Business Agent,企业可用 AI 客服智能体

Meta推出Meta Business Agent,企业可使用 AI 智能体回复客户消息、推荐商品、完成销售转化,并决定何时由真人接手。

𝕏 微软发布 MAI-Thinking-1 推理模型与强化学习系统

微软发布MAI-Thinking-1推理模型,采用1T 参数 MoE 架构35B 活跃参数),在 AIME 2025 达到97.0%,LiveCodeBench v6 达 87.7%,从零训练 30T token,未使用第三方模型蒸馏。同时发布基于SGLangRay的大规模强化学习推理系统,整合异步 RL 和容错推理基础设施。

𝕏 百度文心开源 6.3B 参数音视频生成模型 NAVA

百度文心团队开源NAVA模型(6.3B 参数),在音视频生成任务上实现 SOTA,图像质量胜率80%,音视频对齐胜率72.5%,超越daVinciOvi等更大模型。

𝕏 Anthropic 将 Claude Mythos 安全模型扩展至 200 家机构,发现超 1 万个严重漏洞

AnthropicClaude Mythos Preview从约 50 个合作伙伴扩展到约200 个经过审查的机构,涉及电力、医疗、水务等关键领域。合作伙伴已发现**1 万+**高危或严重漏洞。

𝕏 Claude AI 5 月流量首超 9 亿次,连续五个月增长

Similarweb初步数据显示,Claude AI 5 月总访问量超过9 亿次,月环比增长12%,实现连续第五个月增长。

𝕏 Gemini Thinking Levels 现已在 Web、iOS 和 Android 全平台上线

Google GeminiThinking Levels功能已覆盖 Web、iOS 和 Android 全平台

🐙 Datalab 发布 Surya OCR 2,650M 参数性能领先小模型

Datalab发布Surya OCR 2,650M 参数模型在olmOCR-bench上得分83.3%,支持 90+语言,速度达5 页/秒。支持布局分析、表格识别和阅读顺序。

🔶 Meta 一再推迟面向开发者的新 AI 模型发布

Meta多次推迟发布 Muse Spark AI 模型 API,尚未确定日期。


EVENT-DRIVEN INTELLIGENCE

免费先跟踪重点,再决定是否升级

每篇公开内容都对应三步:订阅每日情报、查看同主题历史上下文、升级 Pro 解锁搜索、研究和事件详情。

分享

NEXT STEP · 留下邮箱

获取下一次重大事件提醒

每天一封精选情报,先用邮件建立复访,再决定是否升级到更深的追踪能力。