06月24日 · 科技早报

天眼早报

科技|2026年06月24日|68 分钟阅读
来源:1307 条推文 + 277 篇 RSS 文章·Lanyun·BatchV2 生成·2026-06-23 — 2026-06-24
分享
AI 速读18 条精选

🤖 AI 大模型

𝕏 DeepSeek-V4 在 GB300 上推理吞吐提升 5 倍

LMSYS OrgNVIDIA合作,通过 FP4 量化、FP8-einsum 修复、W4A4 量化、MTP 优化等技术,在GB300DeepSeek-V4的吞吐量从2,200 提升至11,200 tok/s/GPU(约 5 倍),Blackwell Ultra 聚合通道提升 2.91 倍。PyTorch官方博客联合LMSYSNVIDIA发布了详细技术文章。

𝕏 MaineCoon-22B 发布:实时音视频模型

catnips.ai 发布 MaineCoon-22B,首个为实时 AI 角色设计的流式音视频模型。支持全双工、人机社交互动,首帧生成 <1 秒,单H100显卡可达47.5 FPS,成本低于 $0.001/秒。官方技术博客已开放申请。

𝕏 Ling and Ring 2.6 发布:万亿参数智能体

技术报告发布 Ling and Ring 2.6,实现高效、即时的代理智能,规模达万亿参数。该模型在推理效率和响应速度上取得关键突破。

𝕏 Hugging Face 机器人数据集暴增至 6 万

Hugging Face正成为机器人学和视频 AI 数据的主要存储平台。公共机器人数据集从 2025 年初的1000 个增至6 万个,私有数据集数量翻倍。单个机器人以140 MB/s持续记录数据,通过 Hub 流式传输可使 GPU 利用率达~1,326 MB/s。

𝕏 vLLM 支持 NVIDIA DFlash 投机解码,吞吐量最高提升 5.8 倍

vLLM新增对NVIDIA DFlash投机解码的支持,在Gemma-4 31B模型和单张Blackwell Ultra GPU上,相比自回归解码实现Math500 5.8 倍、GSM8K 5.3 倍、HumanEval 5.6 倍的吞吐量提升。

𝕏 Krea 2 开源图像模型发布,排名第一

Krea 2 开源图像模型在fal平台发布,包含 Turbo(快速生成/8 步蒸馏版)和 RAW(基础检查点/未蒸馏版)两种模型,支持 LoRA 训练,在Artificial Analysis独立实验室文本生成图像评测中排名第一,支持在 SGLang 中 Day-0 运行。

💹 谷歌投资独立电影公司 A24 探索 AI 电影制作

谷歌对独立电影制作公司A24投资约7500 万美元,双方开展 AI 研究合作,共同开发电影制作和发行新工具。这是谷歌首次投资影视工作室。

🔵 Anthropic 客户起诉美国政府限制 Fable AI 访问

一家人工智能初创公司美国政府命令Anthropic限制其最先进Fable模型被外国公民访问,正式起诉美国。此案围绕 AI 出口管制与国家安全展开。

𝕏 Gemma 4 26B 在单个 DGX Spark 上并行运行 16 个实例

开发者演示在单个NVIDIA DGX Spark(128GB 统一内存)上同时运行16 个 Gemma 4 26B A4B 模型实例,总计 300 tok/s。该架构效率极高。

𝕏 GPT-5.6 延期至 7 月中旬,界面现泄露选项

据可靠消息,OpenAIGPT-5.6 推迟至 7 月中旬 发布;同时有用户发现ChatGPT网站界面出现“gpt-5-6-auto”选项,暗示即将发布,但官方尚未确认。其他消息:DeepMindGemini 3.5 Pro 本月不会推出;OpenAI 新语音模型 Bidi 或最早本周上线;Claude Sonnet 5 已向部分企业开放早期访问。

🏠 美国监管机构向 Meta 施压,要求同意接受 AI 安全审查

据纽约时报,美国政府正施压Meta提交 AI 模型供审查。目前OpenAIAnthropic谷歌xAI微软均已同意,仅Meta未签署协议。Meta 表示正在敲定细节。

𝕏 AI 视频模型 Seedance 2.0 发布,原生 4K 生成

Higgsfield AI发布Seedance 2.0,支持原生4K视频生成,在皮肤真实感、任何题材和相机运动方面表现突出。官方称其为“商用级 AI 视频模型”。

𝕏 Mistral OCR 4 在 OlmOCRBench 排名第三

Mistral OCR 4 在 OlmOCRBench 排行榜上排名第三,落后于Chandra OCR 2等开源模型。Hugging Face 公开排行榜显示其并非最佳。

𝕏 Hugging Face 付费订阅用户半年翻倍

Hugging Face联合创始人 Clement Delangue 透露,截至 2026 年 6 月,其开源模型仓库的付费订阅用户数量较 1 月翻倍。该平台正加速商业化进程。

𝕏 Anthropic Claude Tag 开始学习企业 Slack 消息

Anthropic 推出 Claude Tag 功能,能够学习企业工作空间中的Slack消息模式,以提供更个性化的企业内部支持。

𝕏 百度发布 Unlimited-OCR:无限长度文字识别

百度发布Unlimited-OCR,支持任意长度文档的 OCR 识别,无需分页或截断。该模型在多个基准测试上达到领先水平。

𝕏 OpenAI API 近半年推出 30+ 模型与功能更新

OpenAI 总结 API 半年更新:新增 GPT-5.5GPT-5.4 mini/nano、GPT-Realtime-2、GPT-Image-2 等模型,以及 Agents SDK、Skills、WebSocket 模式、托管 shell 等代理构建模块。


EVENT-DRIVEN INTELLIGENCE

免费先跟踪重点,再决定是否升级

每篇公开内容都对应三步:订阅每日情报、查看同主题历史上下文、升级 Pro 解锁搜索、研究和事件详情。

分享

NEXT STEP · 留下邮箱

获取下一次重大事件提醒

每天一封精选情报,先用邮件建立复访,再决定是否升级到更深的追踪能力。