天眼晚报
🤖 AI 大模型
𝕏 字节跳动发布 Seedance 2.5、豆包 Seed 2.1 及 Seeddream 5.0
字节跳动在 2026 火山引擎大会上发布多款 AI 模型:Seedance 2.5视频生成模型支持单段30 秒原生 4K 输出、最多50 个全模态素材联合输入,同时推出 AI 版权商业化平台;豆包 Seed 2.1 系列(Pro/Turbo 版本)在编程、Agent评测中超越Claude Opus 4.6/4.7,日均 Token 调用达180 万亿,API 价格仅为 Opus 的 1/4(输入 6 元/百万 Token);以及Seeddream 5.0图像模型。
𝕏 百度开源 Unlimited OCR 模型,基于参考滑动窗口注意力
百度开源 Unlimited OCR 模型,仅3B参数(500M 激活),通过 R-SWA(参考滑动窗口注意力)实现单次前向推理完成数十页文档解析,KV 缓存恒定,支持32K上下文。灵感来自人类抄书注意力模式。ModelScope 上架 3.3B 参数多语言版(MIT 许可),可通过 Transformers 和 SGLang 推理。
𝕏 OpenAI 推出 Daybreak 安全计划,基于 GPT-5.5-Cyber 自动修复漏洞
OpenAI 发布网络安全计划 Daybreak,核心支撑为 Codex Security(已扫描超3000 万次提交、覆盖3 万多个代码库,自动修复超50 万个问题)及 GPT-5.5-Cyber(在 CyberGym 得分85.6%,超过Claude Mythos 5的 83.8%)。标志安全能力从漏洞发现转向自动交付补丁,启动“Patch the Planet”计划保护关键开源项目,Cisco、CrowdStrike 等厂商已签约。
𝕏 PrimeIntellect 发布 prime-rl v0.6.0,支持万亿参数 MoE 规模 RL 训练
PrimeIntellect 发布开源 RL 框架 prime-rl v0.6.0,支持万亿参数MoE模型规模的强化学习。在GLM-5上以 131k 上下文和 5 分钟内完成 agentic SWE 任务,基于 FSDP2+CP+EP 3D 并行架构。
𝕏 GLM-5.2 性能强劲但引发安全担忧
GLM 5.2 在 OpenRouter 本周排行进入前十,采用速度创开源模型纪录。配合Browser Use v2多模态 QA 子智能体以总成本0.41 美元(1.1m token)在 Cline 真实 Bug 测试中优于Opus 4.8(0.81 美元)。但因其无护栏可自由运行,安全专家指出其可能取代被关闭的Mythos,吸引黑暗经济围绕此模型成长。
𝕏 腾讯发布 WeLM 大模型,微信推出 AI 助手“小微”
腾讯自研大模型WeLM已达258B 参数MoE 规模,微信左上角新增原生AI 助手“小微”入口,支持语音操作、调用小程序、一句话生成小工具,主模型采用 WeLM,部分调用DeepSeek兜底。同时企业微信将推出 AI Agent“大圆”,可基于群聊、文档等数据自动理解诉求并回复。微信内部项目禁止提及“混元”,明确不点评竞品。
𝕏 Sakana AI 发布 Fugu Ultra 多模型编排层,性能强悍
Sakana AI 发布Fugu Ultra作为多模型编排层,通过 OpenAI 兼容端点路由子任务到不同模型,在大多数基准测试中性能媲美Fable和Mythos。具体测试中,成功解码 1610 年日本书信阅读顺序(准确率0.80,远超其他模型 0.24),并从零编写纯 Python 魔方求解器(平均19.72步,优于其他模型)。
𝕏 TIRx 编译器发布:在 B200 上性能超越 cuBLASLt
团队发布TIRx,一个基于 Apache TVM 的最小编译器栈和硬件原生 DSL。在 NVIDIA B200上密集 GEMM 性能约1.08× cuBLASLt,FP8 块状工作负载超 DeepGEMM 达1.09×,FlashAttention-4 与 CuTeDSL 差距约**±2%**,NVFP4 GEMM 也可与 cuBLASLt 竞争。
𝕏 京东开源 JoyAI-VL-Interaction,实时视频理解模型
京东开源JoyAI-VL-Interaction,支持持续观察视频流主动响应,在 58 个真人盲评中对豆包胜率77.6%,对 Gemini 胜率87.9%,监控预警场景**100%**胜率。
💹 网易有道发布 Confucius4-TTS:14 语种免文本语音克隆
网易有道发布业内首个支持14 种语言跨语种无口音、无需参考文本即可完成语音克隆的开源模型Confucius4-TTS,全面支持中、英、西等语言,已向全球开源。
𝕏 Anthropic 悄然移除 Claude Fable 5 订阅,引发用户不满
Anthropic已从订阅中移除Fable 5模型,未发公告或补偿,引发用户不满和猜测。
𝕏 NVIDIA Cosmos 3 Super 文生图模型在 Arena 排名第八
NVIDIA的Cosmos 3 Super在文本到图像 Arena 中排名第 8(开放模型),与Flux-2-Klein-9B等并列,为开源生态贡献了高质量模型。
𝕏 中国发布最新 AI 模型,成本仅为 Anthropic Fable 5 的十分之一
据经济学人报道,中国已发布其最强大的 AI 模型,运行成本仅为Anthropic Fable 5的十分之一,但模型效率并未同步提升。
𝕏 中国特斯拉将采用豆包端到端语音模型
中国版特斯拉宣布将集成字节跳动豆包的端到端语音模型,用于车载语音交互。这标志着中国 AI 模型在汽车领域的重大应用落地。
𝕏 Cartesia 实时语音推理在 Together 上保持 90ms 延迟
语音 AI 公司Cartesia在Together托管 GPU 上运行实时语音推理,每天处理数百万音频分钟,模型延迟保持在约90ms。Together 为其提供托管 GPU 基础设施和底层集群控制。
DeepSeek Harness 团队疯狂招人,负责人回应“不招外国人”误解
DeepSeek Harness 团队负责人崔添翼发布招聘海报,要求“良好的中文沟通能力”。崔回应并非不招外国人,而是需能用中文工作。岗位包括Harness 研究员/工程师/产品经理。
EVENT-DRIVEN INTELLIGENCE
免费先跟踪重点,再决定是否升级
每篇公开内容都对应三步:订阅每日情报、查看同主题历史上下文、升级 Pro 解锁搜索、研究和事件详情。