天眼日报

🤖 AI 大模型
【重磅】OpenClaw 创始人 Peter Steinberger 加入 OpenAI 推动下一代个人 agents
Peter Steinberger(OpenClaw 创始人)加入 OpenAI,负责下一代个人 agents 开发,预计迅速成为产品核心。Sam Altman 确认其天才想法将推动 agents 互作服务用户。Peter 博客详述:一周旧金山交流后选择 OpenAI,OpenClaw 转基金会保持开源独立,支持多模型多厂商。目标建连妈妈都能用 agent。OpenClaw 基金会开源,OpenAI 持续支持多 agents 未来。Steinberger 曾创办 PSPDFKit 以超 1 亿美元售出。
⭐ xAI Grok Build 新增 Parallel Agents 和 Arena Mode
xAI 测试 Grok Build 新功能:Parallel Agents 支持同时生成最多 8 个编码代理;Arena Mode 为锦标赛式评估。
【重磅】Moonshot AI 推出 Kimi Claw
Moonshot AI 官方发布 Kimi Claw,浏览器内原生集成 OpenClaw,提供 ClawHub 超 5000+社区技能、40GB 云存储、Yahoo Finance 实时数据搜索,支持连接第三方 Claw 并桥接到 Telegram 群组。Allegretto 会员及以上 Beta 开放。同时 Kimi 平台内置 OpenClaw 栈,支持 5000+社区技能、40GB 存储和云托管,无需 VPS 或 Docker,取代独立开源项目,解决安全问题如恶意技能和 API 密钥暴露。
Claude推出Cowork 插件,专为企业代理优化
Anthropic 的 Claude Cowork 插件提供专业知识,支持复杂任务,可扩展定制,企业级代理框架继任 GPTs。
MiniMax M2.5登排行榜第 2,逼近Kimi K2.5
MiniMax M2.5 在 OpenRouter 排行榜升至#2,输入 token 成本$0.58/百万,比 Claude 便宜 25 倍。
⭐ MiniMax-M2.5 NVFP4 在 2x RTX 6000 上实现 83 tokens/sec 单流,支持 32 并发用户
MiniMax-M2.5 NVFP4 模型在 2x RTX 6000 上运行,单流 83 tokens/sec,支持 32 并发用户,总吞吐 1000+ tokens/sec,成本约 2x 512GB Mac Studio,优于 Mac 单提示速度。
Sam Altman透露印度ChatGPT 周活跃用户达1 亿
OpenAI CEO Sam Altman 表示印度有 1 亿周活跃 ChatGPT 用户,创下全球最大市场纪录。
Bytedance Seed 2 Pro多模态基准全面领先,价格低于 Gemini Flash
Bytedance 推出 Seed 2 Pro,在图像视频理解基准碾压所有模型,同时通用智能接近前沿,定价 0.47 美元/百万输入 token、2.37 美元/百万输出 token,低于 Gemini Flash。搭配 Seedance 2 视频生成和 Seedream 5 图像。
MiniMax 发布 M2.5-HighSpeed 模型
MiniMax 推出 M2.5-HighSpeed,推理速度达 100 TPS,较同类模型快 3 倍。专为 Agent 应用设计,支持 API 集成和 Coding 工作流,适用于 Plus/Max/Ultra 计划。
⭐ TinyFish Web Agent 在 Mind2Web 基准达 90%
TinyFish Web Agent 在 Mind2Web 基准得分 90%,超 Gemini 21 分、OpenAI 29 分、Anthropic 34 分。提供 5 个真实用例,支持并行运行真实 Web 任务。
⭐ ByteDance 发布Seed 2.0(Doubao 2.0),多模态/数学/STEM/代理基准超越 SOTA
ByteDance 推出 Seed 2.0(Doubao 2.0),在多模态、数学、STEM 和代理推理基准上优于现有 SOTA 模型;Seedance 2.0 视频生成成为最佳 AI 视频模型。中国 AI 追平美国水平。
Kimi K2.5每周燃烧万亿 token,通过OpenRouter增长261%
Kimi K2.5 每周消耗万亿 token,经 OpenRouter 增长 261%;焦点转向代理 24/7 存活的最低成本行动。
DeepSeek完美解决双重 base64,仅用577 秒/31278 token
DeepSeek 无推理完美解双重 base64,耗时 577 秒/31278 token;GPT-5.2 仅 90 秒,v4-lite 需 34k token/635 秒。
⭐ SWE-rebench 新基准测试真实 GitHub PR 任务
SWE-rebench 基准选择最近一个月 GitHub 真实 PR 任务测试大模型性能。前 10 名均为美国模型,国产模型得分与 Opus 4.5 相当,价格最低仅为榜首 3%。
Novel Studio Copilot CLI 多代理小说创作系统
Novel Studio 使用 Copilot CLI 原生功能构建 13 代理小说创作系统,支持规划、写作、质量控制 3 阶段。30 秒生成首部小说,支持英文韩文,仓库含完整示例小说。
Claude Opus 4.6 明显优于 ChatGPT 5.2
Claude Opus 4.6 思考更深入、表达直接、无冗余,数据准确度更高。用户两周未使用 ChatGPT。
⭐ Kani-TTS-2:400M 参数开源 TTS 模型,仅需 3GB VRAM 支持零样本语音克隆
nineninesix.ai 发布 Kani-TTS-2,基于 LFM2 (350M)架构和 NVIDIA NanoCodec,训练 10,000 小时语音数据仅用 8 张 H100 GPU 耗时 6 小时。RTF 0.2 实时生成,支持英文/葡萄牙语,Apache 2.0 许可。
EVENT-DRIVEN INTELLIGENCE
免费先跟踪重点,再决定是否升级
每篇公开内容都对应三步:订阅每日情报、查看同主题历史上下文、升级 Pro 解锁搜索、研究和事件详情。