天眼早报

科技|2026年06月24日|约 68 分钟阅读

来源：1307 条推文 + 277 篇 RSS 文章·Lanyun·BatchV2 生成·2026-06-23 — 2026-06-24

AI 速读18 条精选

🤖 AI 大模型

𝕏 DeepSeek-V4 在 GB300 上推理吞吐提升 5 倍

LMSYS Org与NVIDIA合作，通过 FP4 量化、FP8-einsum 修复、W4A4 量化、MTP 优化等技术，在GB300上将DeepSeek-V4的吞吐量从~~2,200 提升至~~11,200 tok/s/GPU（约 5 倍），Blackwell Ultra 聚合通道提升 2.91 倍。PyTorch官方博客联合LMSYS和NVIDIA发布了详细技术文章。

𝕏 MaineCoon-22B 发布：实时音视频模型

catnips.ai 发布 MaineCoon-22B，首个为实时 AI 角色设计的流式音视频模型。支持全双工、人机社交互动，首帧生成 <1 秒，单H100显卡可达47.5 FPS，成本低于 $0.001/秒。官方技术博客已开放申请。

𝕏 Ling and Ring 2.6 发布：万亿参数智能体

技术报告发布 Ling and Ring 2.6，实现高效、即时的代理智能，规模达万亿参数。该模型在推理效率和响应速度上取得关键突破。

𝕏 Hugging Face 机器人数据集暴增至 6 万

Hugging Face正成为机器人学和视频 AI 数据的主要存储平台。公共机器人数据集从 2025 年初的1000 个增至6 万个，私有数据集数量翻倍。单个机器人以140 MB/s持续记录数据，通过 Hub 流式传输可使 GPU 利用率达~1,326 MB/s。

𝕏 vLLM 支持 NVIDIA DFlash 投机解码，吞吐量最高提升 5.8 倍

vLLM新增对NVIDIA DFlash投机解码的支持，在Gemma-4 31B模型和单张Blackwell Ultra GPU上，相比自回归解码实现Math500 5.8 倍、GSM8K 5.3 倍、HumanEval 5.6 倍的吞吐量提升。

𝕏 Krea 2 开源图像模型发布，排名第一

Krea 2 开源图像模型在fal平台发布，包含 Turbo（快速生成/8 步蒸馏版）和 RAW（基础检查点/未蒸馏版）两种模型，支持 LoRA 训练，在Artificial Analysis独立实验室文本生成图像评测中排名第一，支持在 SGLang 中 Day-0 运行。

💹 谷歌投资独立电影公司 A24 探索 AI 电影制作

谷歌对独立电影制作公司A24投资约7500 万美元，双方开展 AI 研究合作，共同开发电影制作和发行新工具。这是谷歌首次投资影视工作室。

🔵 Anthropic 客户起诉美国政府限制 Fable AI 访问

一家人工智能初创公司因美国政府命令Anthropic限制其最先进Fable模型被外国公民访问，正式起诉美国。此案围绕 AI 出口管制与国家安全展开。

𝕏 Gemma 4 26B 在单个 DGX Spark 上并行运行 16 个实例

开发者演示在单个NVIDIA DGX Spark（128GB 统一内存）上同时运行16 个 Gemma 4 26B A4B 模型实例，总计 300 tok/s。该架构效率极高。

𝕏 GPT-5.6 延期至 7 月中旬，界面现泄露选项

据可靠消息，OpenAI 的 GPT-5.6 推迟至 7 月中旬 发布；同时有用户发现ChatGPT网站界面出现“gpt-5-6-auto”选项，暗示即将发布，但官方尚未确认。其他消息：DeepMind 的 Gemini 3.5 Pro 本月不会推出；OpenAI 新语音模型 Bidi 或最早本周上线；Claude Sonnet 5 已向部分企业开放早期访问。

🏠 美国监管机构向 Meta 施压，要求同意接受 AI 安全审查

据纽约时报，美国政府正施压Meta提交 AI 模型供审查。目前OpenAI、Anthropic、谷歌、xAI和微软均已同意，仅Meta未签署协议。Meta 表示正在敲定细节。

𝕏 AI 视频模型 Seedance 2.0 发布，原生 4K 生成

Higgsfield AI发布Seedance 2.0，支持原生4K视频生成，在皮肤真实感、任何题材和相机运动方面表现突出。官方称其为“商用级 AI 视频模型”。

𝕏 Mistral OCR 4 在 OlmOCRBench 排名第三

Mistral OCR 4 在 OlmOCRBench 排行榜上排名第三，落后于Chandra OCR 2等开源模型。Hugging Face 公开排行榜显示其并非最佳。

𝕏 Hugging Face 付费订阅用户半年翻倍

Hugging Face联合创始人 Clement Delangue 透露，截至 2026 年 6 月，其开源模型仓库的付费订阅用户数量较 1 月翻倍。该平台正加速商业化进程。

𝕏 Anthropic Claude Tag 开始学习企业 Slack 消息

Anthropic 推出 Claude Tag 功能，能够学习企业工作空间中的Slack消息模式，以提供更个性化的企业内部支持。

𝕏 百度发布 Unlimited-OCR：无限长度文字识别

百度发布Unlimited-OCR，支持任意长度文档的 OCR 识别，无需分页或截断。该模型在多个基准测试上达到领先水平。

𝕏 OpenAI API 近半年推出 30+ 模型与功能更新

OpenAI 总结 API 半年更新：新增 GPT-5.5、GPT-5.4 mini/nano、GPT-Realtime-2、GPT-Image-2 等模型，以及 Agents SDK、Skills、WebSocket 模式、托管 shell 等代理构建模块。

EVENT-DRIVEN INTELLIGENCE

免费先跟踪重点，再决定是否升级

每篇公开内容都对应三步：订阅每日情报、查看同主题历史上下文、升级 Pro 解锁搜索、研究和事件详情。

订阅每日情报查看同主题历史事件升级 Pro 解锁搜索 / 研究 / 事件详情

NEXT STEP · 留下邮箱

获取下一次重大事件提醒

每天一封精选情报，先用邮件建立复访，再决定是否升级到更深的追踪能力。

查看同主题历史事件升级 Pro 解锁事件详情