天眼日报

🤖 AI 大模型
Seedance 2.0 角色一致性和物理特性大幅提升
Seedance 2.0 昨晚正式发布,Atlas Cloud 第一批中奖用户人均获 192 次用量。实测角色一致性和物理特性上台阶,目前圈内争论其是否最强视频模型,Sora 3 尚未发布。
Pony Alpha 疑似智谱 GLM-5,编码能力逼近 Claude Opus 4.6
OpenRouter 发布 Pony Alpha 新基础模型,优化编码、推理、角色扮演和智能体工作流,支持 200K 上下文、131K 输出,免费使用但记录提示以改进。疑似智谱 AI 的 GLM-5(GitHub 上被发现,系统提示自曝‘I’m GLM’,分词器相同,时间对上智谱官宣),下两周将有重大进展。实测单提示词输出 2200 行代码,生成 35 个电台广播应用、时尚音乐播放器、3D 游戏等,one-shot 逼近 Claude Opus 4.6。智谱 AI 股价一度涨 36%创纪录高点。影响国产春节档大模型格局。
Kimi K2.5 登顶 OpenRouter,支持 SWE-bench 76.8%
Moonshot AI 的 Kimi K2.5 在 Qoder 上线,SWE-bench Verified 76.8%,适合编码实现。用户建议用高端模型规划,用 Kimi K2.5 构建。
X-Coder-8B 代码模型发布,合成数据集 37.6 万条
IIGroup 推出 X-Coder-SFT-376k 合成数据集和 X-Coder-RL-40k 对齐数据,基于 Qwen3 的 8B 模型在推理上 SOTA。
智谱 AI 股价飙涨 30.02%,因接待习近平总书记考察亦庄科技创新
智谱 AI 接待习近平总书记考察亦庄科技创新工作后,股价当日飙涨 30.02%。
汉化版 OpenClaw:CLI+Dashboard 全中文,每小时同步官方更新
汉化版 OpenClawChinese 每小时自动同步官方更新,提供 CLI+Dashboard 全中文界面、中文安装指南和常见问题解答。
Claude 5.3 Codex 模型减少犹豫,直接执行任务
Claude 5.3 Codex 相比 5.2 模型更主动执行任务,如直接运行测试而非询问确认,提升工程效率。
Kling 3.0 视频生成支持 15 秒时长和电影级结构
Kling 3.0 支持 15 秒视频生成,一次提示实现导演意图,包括方向、覆盖、节奏和镜头逻辑。文本在视频中稳定无抖动,支持商业应用如广告和 UI。
Verdent 在 SWE-bench Verified 达 76.1%分数
Verdent 通过多模型编排、长上下文和自动审核,在 SWE-bench Verified 测试集达 76.1%分数,实现一句话需求转 AI 编码,支持手势控制等应用。
Mistral 发布开源语音实时转写模型
Mistral 推出开源语音转写模型,速度极快、准确率高、模型体积小。支持官方和 Hugging Face 测试(需申请 API),适用于实时应用。
Kimi 成 OpenClaw 最常用模型
Kimi 根据 OpenRouterAI 指标,成为 OpenClaw 最常用模型。Moonshot AI、opencode 和 fanjiewang 团队功劳卓著。
xAI 推出 Grok-Imagine-API 生成带声效视频
xAI 的 Grok-Imagine-API 支持生成带声效视频,质量高、编辑能力强、自然语言编辑、生成速度快。
DeepSeek V4 将于二月中旬发布,代码能力超西方模型
DeepSeek 宣布 V4 将于 2026 年 2 月中旬发布,内部评估显示代码能力压过 Claude 和 GPT 系列,支持超长代码上下文和大项目重构。
Claude Agent Team 工作原理详解视频
视频详细讲解 Claude Agent Team 原理,支持长上下文推理、自动文件读写和 API 调用。
MemSkill 论文:AI 自进化技能系统
MemSkill 从基础 CRUD 技能进化出 Track Object Location 等,适用于机器人和长对话场景,通过试错分析失败案例自动生成。
Anthropic 发布 Claude 新宪法:结构化框架提升一致性、安全性
Anthropic 发布 Claude 新宪法,结合原则与情境指南,用于训练数据生成。覆盖有用性、伦理、安全、指南合规性。Creative Commons CC0 许可,透明度高。引发 AI 社区响应,用户称其为 Claude 训练监督里程碑。
Claude Opus 4.6 vs GPT-5.3 CodeX:编程模型巅峰对决
Claude Opus 4.6 支持 100 万 token 上下文,Claude Code 新增 Adaptive Thinking、Context Compaction、Multi-Agent 架构。GPT-5.3 CodeX 在 SWE-Bench Pro 提升 15%,强化复杂任务意图理解。Claude 胜长上下文,CodeX 胜响应速度。
EVENT-DRIVEN INTELLIGENCE
免费先跟踪重点,再决定是否升级
每篇公开内容都对应三步:订阅每日情报、查看同主题历史上下文、升级 Pro 解锁搜索、研究和事件详情。