天眼日报
🤖 AI 大模型
Anthropic 发布长时编程 Agent 的 Harness 设计框架
Anthropic 文章介绍 Harness 框架,包括任务分解(Sprint 结构)、Agent 通信(文件交接)、上下文重置和评估标准。由 3 个 Agent 组成:Planner 完善提示、Generator 生成方案、Evaluator 评估。
Cloudflare 推出 Dynamic Workers:Agent 沙箱方案
Cloudflare 基于 V8 隔离推出 Dynamic Workers,毫秒级启动、MB 级内存,支持动态代码执行,比容器快 100 倍。付费用户每天 0.002 美元,Beta 免费。
NVIDIA 发布 Nemotron-Cascade-2-30B-A3B MoE 模型
NVIDIA 推出 30B MoE 模型 Nemotron-Cascade-2-30B-A3B,仅 3B 活跃参数,在 IMO 2025 获 35 分金牌、IOI 2025 获 439.3 分金牌,AIME 2025 达 92.4(TIR 后 98.6),支持 262K 上下文,vLLM 兼容。
daVinci-MagiHuman 开源视频模型支持多语言音频生成
daVinci-MagiHuman 开源 5B 参数 40 层 Transformer 模型,支持文本/视频/音频,H100 GPU 上 2 秒生成 5 秒 256p 视频,38 秒生成 1080p,胜率对 Ovi 1.1 达 80%,支持中文/粤语/英语/日语等。
Google 推出 Lyria 3 Pro 音乐生成模型
Google 发布 Lyria 3 Pro,支持生成长达 3 分钟的音乐轨道,用户可指定 intro、chorus、bridge 等结构元素,已集成至 Gemini 和企业产品。
hf-mount 工具将 Hugging Face 存储挂载为本地文件系统
hf-mount 支持将 Hugging Face 的 Storage Bucket、模型或数据集挂载为本地文件系统,支持 NFS 和 FUSE 后端,可处理 5TB 如 FineWeb-edu 数据集。
Claude Code 新增自动模式和完整计算机使用功能
Anthropic 推出 Claude Code 自动模式,分类器预审工具调用,安全操作自动执行;Claude Cowork 支持鼠标键盘控制,支持 Dispatch 远程操作。适用于 Team 计划,企业/API 即将上线。用户可用 claude --enable-auto-mode 启用 Auto Mode,再用 Shift+Tab 切换,执行前仍保留安全检查,减少逐文件与逐命令审批。
Claude Code 技能和命令支持努力级别指定
Claude Code 新增技能和斜杠命令努力级别选项,支持 1M 上下文窗口,循环运行最长 7 天。
知识图谱与 LLM 实战应用教程:构建临床医生 KG
Human Phenotype Ontology 数据集导入 Neo4j,使用 LPG 模型构建 KG,包含 Cypher 查询代码和 Neosemantics 插件推理,支持罕见疾病诊断,HPO 本体加载 899558 条陈述。
从零开始理解 Agent Skills 教程
Agent Skills 规范为 Claude Code 等 AI Agent 扩展能力,包含 SKILL.md 格式、渐进式披露机制和 Python 参考库,支持 Claude、Copilot 跨平台。
OpenAI 突然停止 Sora 视频生成服务,与迪士尼 10 亿美元合作终止
OpenAI 宣布关闭 Sora 服务,迪士尼团队会议结束 30 分钟后获知,深感震惊。原计划 10 亿美元三年合作授权 200+角色终止,视频生成算力消耗极大挤占资源。Sora 团队确认将告别 Sora 应用,并承诺后续公布应用/API 时间线与作品保存方案,显示 OpenAI 正把算力和资源转向其他业务。
快手可灵 AI 四季度营收 3.4 亿元,CEO 立下年内收入翻倍军令状
快手旗下可灵 AI2025 年四季度营收 3.4 亿元,全年 10.4 亿元。截至 2026 年 1 月 ARR 超 3 亿美元,CEO 程一笑承诺年内收入翻倍以上增长。
快手预计 2026 年 Capex 达 260 亿元,继续加码 AI 算力投入
快手 CFO 金秉表示,2026 年 Capex 约 260 亿元,新增 110 亿元用于可灵大模型及其他基础模型算力支撑、数据存储及数据中心建设,仍保持全年自由现金流健康。
Anthropic 发布 Claude 多代理系统,提升前端设计和长期工程能力
Anthropic 工程博客介绍多代理系统,推动 Claude 在前端设计和自主软件工程能力。使用 Claude Code 和 Claude Cowork,支持 Mac 桌面任务执行,如打开应用、点击按钮。
字节跳动豆包模型每日调用超 100 万亿 token
字节跳动的 Doubao AI 模型每日调用量超过 100 万亿 token,据内部消息来源证实,此数据反映其在中国市场的高使用率。
Anthropic 发布 Claude 经济指数:资深用户任务成功率达 73.1%
Anthropic 分析 Claude 用户行为,资深用户(6 个月+)任务成功率 73.1%(新用户 66.7%),工作使用占比升至 48.9%,编码任务占 35%。
Claude Code 2.1.81 逆向分析:四层决策流水线 + 两阶段分类器
Claude Code 工具调用通过四层决策:权限规则、模拟模式、只读白名单、Sonnet 分类器(25+ BLOCK 规则)。分类器分 Stage1(256 tokens)快速判断、Stage2(4096 tokens)深度分析,连续拒 3 次降级手动确认。
EVENT-DRIVEN INTELLIGENCE
免费先跟踪重点,再决定是否升级
每篇公开内容都对应三步:订阅每日情报、查看同主题历史上下文、升级 Pro 解锁搜索、研究和事件详情。