天眼晚报
🤖 AI 大模型
𝕏 xAI 推出语音克隆 API,支持自定义音色与实时流式传输
xAI开放语音克隆API,用户在控制台上传 120 秒音频即可生成专属 voice_id,并可通过/v1/tts 与实时流式接口调用。该功能目前仅限美国企业用户,提供 30 次免费调用,定位为高保真声音复刻,而非简单模仿音色。
𝕏 开源大模型与闭源模型差距缩小至 6 分
Artificial Analysis称,Kimi K2.6与MiMo V2.5 Pro智能指数同为 54 分,距离GPT-5.5的 60 分仅差 6 分;一年前开源模型最高仅 22 分,显示开源阵营在综合能力上快速追近闭源前沿模型。
DeepSeek 发布多模态论文后连夜删除,揭示视觉原语新范式
DeepSeek发布《用视觉原语思考》论文,提出视觉原语框架以缓解多模态空间推理中的指代歧义,并基于 2840 亿参数模型展示能力突破。官方随后连夜删除仓库与原文,引发外界对技术细节泄露及指代鸿沟解决路径的关注。
𝕏 xAI 发布 Grok 4.3,智能指数升至 53 并大幅降价
xAI上线Grok 4.3,在 Artificial Analysis 智能指数中达到 53 分;相比 Grok 4.20,输入价格下降约 40%、输出价格下降约 60%,代理任务 ELO 提升 321 点,显示其在能力与成本两端同步改善。
𝕏 GPT-5.5 Pro 完成 T 细胞基因表达深度分析
GPT-5.5 Pro分析62 个 T 细胞样本与 27906 个基因列,经过约 100 分钟思考生成 40 页生物医学报告。该案例展示了前沿模型在高维基因表达数据解释、长链路分析和专业报告生成方面的应用潜力。
𝕏 ModelScope 披露 GLM-5 Coding Agent 高并发缺陷修复
ModelScope修复GLM-5服务中的 KV Cache 竞态和 HiCache 排序问题,使异常率由约 0.1%降至 0.03%以下;同时通过LayerSplit优化长上下文吞吐,最高提升 132%,为高并发 Coding Agent 服务稳定性提供了可复用经验。
𝕏 DeepSeek-V4-Pro 被开发者实测接近 Claude 与 Codex 级代理编程体验
DeepSeek-V4-Pro在Pi coding agent中无需特殊配置即可运行,支持 1M 上下文,多步研究、代码脚手架和知识密集推理表现稳定。开发者 Omar Sar 称其在代理编程体验上已接近 Claude 与 Codex,并提到 KV 缓存与推理 FLOPs 成本显著下降。
𝕏 DeepInfra 接入 Hugging Face 推理服务,开放 100 多个模型
DeepInfra成为Hugging Face推理提供商,支持 DeepSeek V4、Kimi-K2.6、GLM-5.1 等 100 多个模型。用户可通过 OpenAI 兼容 API 调用,且官方称无额外加价,有助于降低开源模型部署与调用门槛。
OpenAI 将向关键网络防御者开放 GPT-5.5 Cyber
OpenAI将在数日内向“关键网络防御者”推出GPT-5.5 Cyber,采用申请制访问,能力覆盖渗透测试、漏洞识别和恶意软件逆向工程。该项目面向高风险网络安全场景,强调将先进模型能力优先提供给防御方。
𝕏 OpenAI Codex CLI 新增/goal 持续任务命令
OpenAI在Codex CLI 0.128.0加入/goal 命令,用户配置 goals = true 后,可让代理跨多轮持续执行目标。该功能面向长周期开发与自动化任务,有助于减少反复提示并保持任务上下文。
𝕏 文心 5.1 Preview 登上 LMArena 文本榜国产第一
文心 5.1 Preview在LMArena文本榜获得 1476 分,进入全球前十五并位列国产模型第一;千帆平台已开放 API 邀测,显示百度新一代文本模型在公开竞技榜单上的竞争力进一步提升。
𝕏 OpenAI Codex 应用内浏览器新增设备测试工具栏
Codex浏览器加入设备工具栏,开发者可直接测试不同屏幕尺寸下的页面表现;OpenAI 内部体验显示,浏览器使用速度提升约 30%,有助于前端代理在调试响应式页面时减少外部切换。
𝕏 Gemma 4 发布数周下载量超过 5000 万次
Gemma 4发布数周后下载量超过 5000 万次,社区基于它构建了近 1500 个模型。该数据反映出 Google 开源模型生态的快速扩散,以及开发者在微调、蒸馏和垂直场景适配上的活跃度。
𝕏 Bear 推出 CLI、Claude Connector 及 MCP Server
Bear笔记应用更新,正式推出Bear CLI、Claude Connector 及 MCP Server,深化 AI 能力集成。此举使开发者可通过命令行和标准协议调用笔记数据,推动笔记工具从内容管理走向 AI 原生工作流。
🔵 OpenAI CFO 称产品需求呈“垂直墙”式增长
OpenAI首席财务官Sarah Friar回应外界对内部目标的质疑,称公司正在达成目标,产品需求呈“垂直墙”式增长。该表态强调 OpenAI 在商业化和企业采用上的需求强度仍然高企。
𝕏 OpenAI 为 Codex 高风险操作加入第二代理审批层
OpenAI Codex在沙盒外执行高风险操作前,会引入第二个 Codex 代理进行审批或拒绝。该机制为代码代理增加独立复核层,旨在降低越权执行、破坏性命令和不安全系统操作的风险。
𝕏 小米 MiMo-V2.5-Pro 登上 Arena 开源模型榜首
MiMo-V2.5-Pro在Text Arena Expert中位列全球第 6、开源第 1。该成绩与其在 Artificial Analysis 中的高分相互印证,显示小米模型在文本竞技与专家评测场景中具备较强竞争力。
𝕏 GPT-5.5 通过 AISI 网络攻击能力评测
AISI完成GPT-5.5网络攻击能力评测,称其为第二个能通关该测试的模型。该结果说明前沿模型在复杂网络安全任务中的能力继续提升,也凸显相关能力评估与访问控制的重要性。
𝕏 Grok 4.3 上线 Vercel AI Gateway
xAI Grok 4.3已接入Vercel AI Gateway,并强化工具调用和指令遵循能力。该接入让使用 Vercel AI 生态的开发者能够更便捷地调用 Grok 4.3,用于构建前端、代理和多模型应用。
𝕏 Gemini 可在聊天中直接生成 PDF、Word 和表格文件
Gemini新增文件生成能力,支持 PDF、Word、Excel、Slides、CSV 等格式。用户可在对话中直接生成结构化文档和办公文件,减少从聊天内容到可交付材料之间的手动转换步骤。
𝕏 OpenRouter 上线匿名模型 Owl Alpha,支持 100 万上下文
OpenRouter新增匿名模型Owl Alpha,提供 1M 上下文和工具调用能力。尽管模型来源尚未公开,但其长上下文与工具使用特性为开发者提供了新的代理和长文档处理选项。
EVENT-DRIVEN INTELLIGENCE
免费先跟踪重点,再决定是否升级
每篇公开内容都对应三步:订阅每日情报、查看同主题历史上下文、升级 Pro 解锁搜索、研究和事件详情。