天眼早报
🤖 AI 大模型
🔶 大模型安全攻防实测:GPT-5.5 成功率 70%夺冠,DeepSeek V4 Pro 性价比最佳
安全研究员 Kasra Rahjerdi 花费1500 美元,让十余款大模型对含漏洞的 APK 进行渗透测试。GPT-5.5以**70%**成功率排名第一,DeepSeek V4 Pro以30%成功率位居第二,每次成本仅0.19 美元。Qwen 3.7 Max未能复现预期,Gemini系列因安全策略多次拒绝任务。
𝕏 Google 发布 Gemma 4 12B:无编码器多模态开源模型,16GB 显存本地运行
Google正式发布Gemma 4 12B,采用无编码器架构,原生支持文本、图像、音频输入,256K上下文,Apache 2.0许可证。仅需16GB VRAM即可在笔记本上本地运行,性能接近26B MoE模型。AIME 2026 得分 77.5%,LiveCodeBench v6 得分 72.0%,支持 140+种语言。已获 llama.cpp、vLLM、Transformers 等框架首日支持,同时由 DeepMind CEO Demis Hassabis 宣布。
𝕏 Miso One 开源:8B 参数高情感语音模型,延迟仅 110 毫秒
Miso One发布,一个8B参数的文本转语音模型,支持高度情感化表达,延迟仅110 毫秒。专为短视频、播客、教育内容设计,模型权重已开源,API 即将开放,可自托管和微调。
𝕏 Ideogram 4.0 开放权重,成为最佳开源文生图模型
Ideogram 4.0正式开放模型权重,支持下载、微调并运行在自有硬件上。在 Text-to-Image Arena 中得分1204,成为第一开源模型,覆盖摄影、艺术、卡通、文字设计等多种视觉风格,文本渲染和商业设计提升显著。
🔶 阶跃 Step 3.7 Flash 位列输出速度榜主流第一
阶跃 Step 3.7 Flash以409 tokens/s速度位列 Artificial Analysis 输出速度榜第一。
xAI 暂停招聘用于训练 Grok 的“AI 导师”
知情人士透露,xAI已暂停招聘AI 导师,原因包括 HR 不堪重负。去年已裁减多名全能型导师,转向专门数据标注人员。
谷歌 AI Edge Gallery 登陆 macOS,支持本地运行 Gemma 模型
6 月 4 日,谷歌 AI Edge Gallery登陆macOS,提供Gemma-4-12B-it等 5 个模型。附带免费听写应用Google AI Edge Eloquent。
𝕏 MiniMax-M3 加入英伟达和微软本地 LLM 阵容
MiniMax-M3亮相GTC Taipei,支持1M 上下文、强编码能力和原生多模态,属于开源权重模型。
奥特曼:OpenAI 内部最高用户每月消耗约 1000 亿个 token
Sam Altman透露,OpenAI内部最高 token 用户每月消耗约1000 亿个 token,外部用户更多。6 年半前最高用户仅10 万 token。AI 成本压力已成为“巨大问题”。
谷歌 Gemini 搜索 AI 概览月活达 25 亿,Gemini App 月活超 9 亿
Alphabet披露,Gemini App月活跃用户突破9 亿,AI Overviews月活跃用户达25 亿(全球超 30%人口)。Gemini 3.5 Pro预计本月推出。
Meta 推出 Business Agent,企业可用 AI 客服智能体
Meta推出Meta Business Agent,企业可使用 AI 智能体回复客户消息、推荐商品、完成销售转化,并决定何时由真人接手。
𝕏 微软发布 MAI-Thinking-1 推理模型与强化学习系统
微软发布MAI-Thinking-1推理模型,采用1T 参数 MoE 架构(35B 活跃参数),在 AIME 2025 达到97.0%,LiveCodeBench v6 达 87.7%,从零训练 30T token,未使用第三方模型蒸馏。同时发布基于SGLang和Ray的大规模强化学习推理系统,整合异步 RL 和容错推理基础设施。
𝕏 百度文心开源 6.3B 参数音视频生成模型 NAVA
百度文心团队开源NAVA模型(6.3B 参数),在音视频生成任务上实现 SOTA,图像质量胜率80%,音视频对齐胜率72.5%,超越daVinci和Ovi等更大模型。
𝕏 Anthropic 将 Claude Mythos 安全模型扩展至 200 家机构,发现超 1 万个严重漏洞
Anthropic将Claude Mythos Preview从约 50 个合作伙伴扩展到约200 个经过审查的机构,涉及电力、医疗、水务等关键领域。合作伙伴已发现**1 万+**高危或严重漏洞。
𝕏 Claude AI 5 月流量首超 9 亿次,连续五个月增长
Similarweb初步数据显示,Claude AI 5 月总访问量超过9 亿次,月环比增长12%,实现连续第五个月增长。
𝕏 Gemini Thinking Levels 现已在 Web、iOS 和 Android 全平台上线
Google Gemini的Thinking Levels功能已覆盖 Web、iOS 和 Android 全平台。
🐙 Datalab 发布 Surya OCR 2,650M 参数性能领先小模型
Datalab发布Surya OCR 2,650M 参数模型在olmOCR-bench上得分83.3%,支持 90+语言,速度达5 页/秒。支持布局分析、表格识别和阅读顺序。
🔶 Meta 一再推迟面向开发者的新 AI 模型发布
Meta多次推迟发布 Muse Spark AI 模型 API,尚未确定日期。
EVENT-DRIVEN INTELLIGENCE
免费先跟踪重点,再决定是否升级
每篇公开内容都对应三步:订阅每日情报、查看同主题历史上下文、升级 Pro 解锁搜索、研究和事件详情。