天眼晚报
🤖 AI 大模型
Google I/O 2026 重磅发布:Gemini 3.5 系列与 Omni 视频模型
Google在 I/O 2026大会上正式发布 Gemini 3.5 系列,包括 Flash、Pro 和 Spark 版本。其中 Gemini Omni 是首个原生支持图文音视频混合输入的多模态模型,能通过自然语言指令进行多轮对话式视频编辑,保持角色、物理和场景的一致性。Gemini 3.5 Flash 在编码和智能体任务上超越前代,常规速度快4 倍,在 Antigravity 平台达800 tokens/s,Token 成本低于1000 美元。此外,Antigravity 2.0 框架支持并行编排子代理,Android CLI 正式稳定,标志着 AI 向消费级智能体的全面转型。
阿里巴巴发布真武 M890 芯片与 Qwen3.7-Max 模型升级
阿里巴巴旗下平头哥半导体发布专为 AI Agent设计的 真武 M890AI 处理器,配备144GBGPU 内存,性能较前代提升三倍,计划每年升级,已累计出货56 万片。同时推出大语言模型Qwen3.7-Max升级版,显著提升了语言理解、逻辑推理及指令遵循能力。该芯片针对长上下文记忆、实时多模型协调及复杂多步任务优化,标志着云计算从资源调度向任务调度的范式转变。
𝕏 Andrej Karpathy 加入 Anthropic 负责 Claude 预训练团队
Andrej Karpathy正式加入Anthropic,加入由Nick Joseph领导的pretraining团队。Nick Joseph 曾参与开发早期代码模型并创立 Anthropic,Karpathy 的加入将强化Claude大模型的训练能力,预计将在下一代模型架构与训练策略上带来重大突破。
𝕏 vLLM 发布 PegaFlow 外部 KV 缓存服务,提升多模型推理吞吐
vLLM与Novita Labs发布PegaFlow:500GiB 预热池启动快2.15 倍,8 个 Qwen3-8B 实例吞吐提升56%,跨节点远程读取达194GB/s。该技术有效解决了多模型并发推理中的显存瓶颈问题,显著提升了大规模部署的效率。
𝕏 Cerebras 运行 Kimi K2.6 万亿参数模型创速度纪录
Cerebras在 Enterprise trials 中运行Kimi K2.6万亿参数模型,实测速度约1000 tokens/s,创下 Frontier 模型性能新纪录。该模型基于Artificial Analysis评估标准,展示了极高的推理效率,证明了 Cerebras 硬件在处理超大参数模型时的卓越性能。
𝕏 Hugging Face 发布 DNA 大模型 Carbon,基因组分析提速 275 倍
Hugging Face推出 DNA 模型Carbon,通过 6 碱基分组 tokenizer 保持单碱基分辨率,比Evo2快275 倍,单 GPU 两天内可跑完整人类基因组。该模型在生物信息学领域具有突破性意义,大幅降低了基因组分析的算力门槛和时间成本。
𝕏 NVIDIA 开源 Nemotron-Labs-Diffusion 扩散语言模型
NVIDIA开源 Nemotron-Labs-Diffusion,这是一种支持自推测解码的三模式语言模型,利用扩散技术生成多个 token 并行输出,相比传统 AR 模型在 DGX Spark 上推理速度快 2.7 倍,在 GB200 上快 3.3 倍。该模型为文本生成领域提供了新的技术路径。
𝕏 商汤 SenseNova U1 开源,主打原生多模态图文生成
SenseNova U1上线HuggingFace,采用38B-Active 3B MoE与 MoT 架构,支持 ComfyUI,聚焦海报、漫画、信息图等高密度图文生成。该模型在商业视觉内容创作领域展现了强大的落地能力。
𝕏 Grok 接入 OpenClaw,X Premium 用户可直接使用
xAI宣布Grok与OpenClaw打通,支持聊天、图像视频生成和 X 帖子搜索。这一整合使得 X 平台上的高级用户能够更便捷地利用 Grok 的能力进行内容创作和信息检索。
EVENT-DRIVEN INTELLIGENCE
免费先跟踪重点,再决定是否升级
每篇公开内容都对应三步:订阅每日情报、查看同主题历史上下文、升级 Pro 解锁搜索、研究和事件详情。