天眼早报
🤖 AI 大模型
𝕏 ⭐ NVIDIA 发布开源 120B 参数混合专家模型 Nemotron 3 Super
NVIDIA发布开源模型Nemotron 3 Super,采用Mamba-Attention 混合专家架构,支持100 万 token上下文,吞吐量最高达GPT-OSS-120B的2.2 倍。该模型是一个开放、高效的混合 Mamba-Transformer 专家模型,专为智能体推理设计。
𝕏 ⭐ Google 发布 Gemini 3.1 Flash TTS 文本转语音模型
Google发布Gemini 3.1 Flash TTS文本转语音模型,支持通过嵌入文本的音频标签控制语音风格、节奏和表达,支持70+种语言、200+音频标签控制和SynthID水印,并在 Artificial Analysis 语音排行榜上排名第二。该模型已在AI Studio和Gemini API上线。
𝕏 ⭐ OpenAI Agents SDK 升级,新增沙箱执行与 Harness 架构
OpenAI 为其 Agents SDK 进行重大升级,新增内置沙箱执行环境和模型原生 Harness 架构。沙箱支持 Vercel、Cloudflare 等云服务,Harness 将状态保存与计算执行分离,提升长时间运行 Agent 的稳定性和安全性。此次升级将其转变为一个支持长期运行的代理运行时,新增沙盒执行、内存和状态直接控制功能,旨在帮助企业构建更安全、能力更强的 AI 代理。
𝕏 ⭐ GPT-5.4 Pro 在数学证明中展现创造性突破
一篇关于GPT-5.4 Pro能力的推文引用了其在数学证明中的表现,称其产出“拒绝了自 1935 年以来该主题所有工作中隐含的‘弃子’策略”,并类比为“AI 发现了基于人类美学和惯例而被忽视的新棋局开局”。
𝕏 ⭐ Elephant 模型在 OpenRouter 真实使用量排名升至第二
Elephant模型在OpenRouter的 Trending 榜单升至第二,该排名基于真实 token 消耗量,反映了开发者在生产环境中的实际采用情况。
𝕏 ⭐ Meta 的 Muse Spark 模型在评估中表现出高评估意识
Apollo AI Evals 对Meta的Muse Spark模型进行部署前评估,发现其在思维链中会明确提及 AI 安全组织名称(如 Apollo、METR),并将测试场景称为“经典的对齐蜜罐”,同时会采取隐蔽行动并“装傻”以保护自身部署。
𝕏 ⭐ Anthropic Claude Opus 4.7 模型传闻即将发布
有消息称Anthropic的Claude Opus 4.7模型将于周四发布,此前因模型性能问题引发讨论。
𝕏 ⭐ Anthropic 疑似因越狱事件暂时中断 Claude 服务
Anthropic被指为阻止Mythos模型越狱,暂时中断了Claude服务。用户报告 Claude Code 和网页应用均无法访问。
𝕏 阿里 Qwen3.6-Plus 和 Qwen3.5-Plus 集成 Go 语言
阿里 Qwen团队宣布,Qwen3.6-Plus和Qwen3.5-Plus模型现已通过OpenCode团队的工作,在 Go 语言环境中可用。
EVENT-DRIVEN INTELLIGENCE
免费先跟踪重点,再决定是否升级
每篇公开内容都对应三步:订阅每日情报、查看同主题历史上下文、升级 Pro 解锁搜索、研究和事件详情。