天眼日报

🤖 AI 大模型
阿里巴巴发布 Qwen3.5-397B-A17B,首款开源原生多模态代理 MoE 模型
阿里巴巴通义实验室推出 Qwen3.5 系列首款开源模型 Qwen3.5-397B-A17B,总参数 397B,每 token 仅激活 17B 参数的稀疏 MoE 模型,采用 Gated DeltaNet + 线性注意力混合架构。支持 201 种语言、262K 原生上下文(扩展至 1M)、图像视频理解、多模态推理、编码和代理任务。解码吞吐量比 Qwen3-Max 提升 8.6x(32K 上下文)和 19.0x(256K 上下文),FP8 量化降内存 50%。基准表现:MMMU-Pro 79.0、OmniDocBench 90.8、SWE-bench 76.4、IFBench 76.5。Apache 2.0 许可,即日 Hugging Face 开源,OpenRouter 上线权重版及 Plus 版。
Peter Steinberger(steipete)加入 OpenAI,推动下一代个人代理开发
Peter Steinberger(Twitter@steipete,ClawdBot/OpenClaw 创建者)宣布加入 OpenAI,负责下一代个人代理开发。OpenAI 讨论设立基金会维持开源项目。Meta 曾尝试招募,他每月自掏腰包 10-20K 美元支持项目。OpenClaw 项目转为独立基金会,继续开源支持多代理未来。
Qwen3.5 系列基准测试:LM/VLM 性能全面领先
Alibaba_Qwen 发布 Qwen3.5 基准图表,LM 性能对标 GPT-5.2/Gemini-3-Pro,VLM 性能在 GUI 理解/视频分析领先。397B-A17B 模型支持 201 种语言,推理成本降至 Gemini 3 Pro 的 1/18。
MiniMax 发布 M2.5 模型,SWE-bench Verified 80.2%登顶,高效推理上线 Together AI
MiniMax 推出 M2.5 模型,激活参数仅 10B,SWE-bench Verified 80.2%、BrowseComp 76.3%、BFCL 76.8%,击败 Claude Opus 4.6,推理速度 3 倍(100 tokens/s),定价 1 美元/小时。现已在 Together AI 平台上线,支持结构化规划和 SOTA 编码,适用于真实世界代理工作流。8xH200 基准测试:解码达 2500 tok/s/GPU,10-25s TTFT 支持 10K+上下文。
ByteDance 加强 Seedance 2.0 版权防护
ByteDance 宣布改进 Seedance 2.0 视频生成模型的安全措施,回应 Disney、Paramount 等好莱坞指控版权侵权。病毒视频包括 Tom Cruise 与 Brad Pitt 打斗场景及 Dragon Ball Z 角色。
Claude Code 作者分享每周 50-100 PR 工作流
Boris Cherny 分享 Claude Code 工作流:并行 10 个 Claude 会话,使用 Opus 4.5+思考模式,Claude.md 文件记录 2500 token 指令,计划-执行分离,专用子代理简化/验证代码。
Qwen 3.5 Plus 在 ZenMux 上线,吞吐量提升 8.6 倍
Alibaba Qwen 3.5 Plus 采用 Gated DeltaNet + Sparse MoE 架构,在 ZenMux 上线,支持 1M 上下文处理 2 小时 视频,201 种语言,代理任务大幅提升。
Qwen3.5 在 mlx-vlm v0.3.12 中支持本地运行
mlx-vlm v0.3.12 新增 Qwen3.5 系列和 dots-ocr 模型,支持 FP8 去量化及 QQLinear 激活量化。安装命令:uv pip install -U mlx-vlm。
awnihannun 测试 Qwen3.5 在 mlx-lm 上性能
Qwen3.5 在 M3 Ultra 上生成 4120 token,速度 37.6 tok/s,推理速度和内存使用几乎不变,支持 Space Invaders 游戏生成。
OpenAI 推出 ChatGPT Lockdown Mode 安全模式
OpenAI 发布 Lockdown Mode,针对高风险用户禁用提示注入等工具,转用缓存浏览,企业/商业版即刻可用,消费者版即将上线。
SGLang 支持 Qwen3.5 高效运行
SGLang 已上线 Qwen3.5 支持,结合 Mamba Radix Cache v2 和 MTP 实现高效推理;技术博客详述优化细节。
Kilo Code 重夺 OpenRouter 日榜首位
Kilo Code 处理 313B tokens,其中 222B 来自 GLM-5,在多项基准测试中超越 Opus 4.5/4.6。
LambdaAPI 发布 Qwen3.5-397B-A17B 部署指南
Alibaba_Qwen Qwen3.5-397B-A17B 部署需 8 个 NVIDIA HGX B200 GPU,无 FP8 量化,Zach Mueller 提供详细指南。
京东发布自研 LLM 大模型
京东推出自研 LLM,针对电商场景优化,支持复杂查询和推荐。
Claude Code 2.1.44 更新,自动记忆目录变更
Claude Code 2.1.44 发布,auto memory 目录路径变更至持久化文件夹,支持 CLI 和提示调整,避免会话记忆脱钩。
EVENT-DRIVEN INTELLIGENCE
免费先跟踪重点,再决定是否升级
每篇公开内容都对应三步:订阅每日情报、查看同主题历史上下文、升级 Pro 解锁搜索、研究和事件详情。