天眼日报

🤖 AI 大模型
Claude Code 新增 Auto Mode 自动处理权限提示
Anthropic 宣布 Claude Code 研究预览功能 Auto Mode,将于 2026 年 3 月 12 日 推出。自动处理编码权限提示,避免开发者手动批准,支持隔离环境运行,命令 claude --enable-auto-mode 启用。
GPT-5.4 在文档对齐任务中优于 Opus 4.6
youyuxi 测试 GPT-5.4 与 Opus 4.6 在 repo 文档与源码对齐,GPT-5.4 更好地捕捉意图,非编码任务。
【重磅】OpenClaw 发布 2026.3.7 版本,支持 GPT-5.4 和 Gemini 3.1 Flash-Lite
OpenClaw 官方发布 2026.3.7 版本,新增 GPT-5.4 和 Gemini 3.1 Flash-Lite 支持、ACP 绑定重启存活、Slim Docker 构建、插件化上下文引擎、HEIF 图像支持和 Zalo 通道修复。贡献者达 196 人,移动端 iOS 准备中。
Meta 强制 LLM 逐步推理,代码补丁错误率降 50%
Meta 研究发现强制 LLM 逐步推理并提供证据,代码补丁错误率降 50%,准确率达 93%。使用检查清单模板,避免跳读文件,仅需结构化提示无需额外训练。
Anthropic 收入 5 年从 0 到 20 亿美元
Anthropic 收入增长:2021 年 0 美元、2022 年 10M、2023 年 100M、2024 年 1B、2025 年 9.5B、2026 年约 20B 美元。
Ark Invest 用 Claude Code 自动化 6 个月财务积压
Ark Invest 用 Claude Code 自动化 6 个月财务积压,现集成到 Palantir 平台。Cathie Wood 称处于 1980 PC 时刻。
Claude Code 工程师价值定位:定义验收标准而非写代码
Yonah_x 实测项目中告知 AI 本地启动命令、测试脚本、日志路径后,AI 自主跑服务、查日志、修复问题,形成闭环。强调工程师在 AI 时代定义代码标准和环境搭建的价值。
Karpathy 开源 autoresearch:AI 自主循环训练 LLM 框架
Karpathy 深夜发布 autoresearch 项目,630 行单文件代码可在单 GPU 运行。AI 根据 Prompt 自动修改训练代码、调参、跑 5 分钟训练循环,若验证集提升则保留修改,实现 AI 训练 AI。nanochat 训练核心精简版。
Cursor 内部分析:Claude Code 单月订阅耗资 5000 美元计算资源
Cursor 内部数据显示,每月 200 美元的 Claude Code 订阅可能消耗 5000 美元计算资源。OpenAI 同样疯狂补贴,未来大模型涨价确定。
OpenClaw 32 模型排名:成功率、速度、费用三维度评估
OpenClaw 创始人 Peter Steinberger 发布 32 模型排名,成功率前五:gemini-3-flash-preview(第一)、minimax-m2.1(第二)、kimi-k2.5(第四)、claude-sonnet-4.5(第五)。gpt-5-nano 排第九,qwen3-coder-next 第十。2026-03-08 更新,基于 Coding Plan 测试。
Sarvam AI 发布印度首款开源 MoE 模型 Sarvam 105B
Sarvam AI 推出 Sarvam 105B(MoE,总 105B 参数,激活 9B),支持 22 种印度语言+英语,预训练 12 万亿 token。性能媲美 DeepSeek R1,Apache 2.0 许可,优化推理/代理/STEM 任务。
Claude Code 新增/loop 循环任务功能,支持最长 3 天调度
Anthropic 的 Claude Code 之父 Boris Cherny 宣布新增/loop 功能,支持调度 PR 监控、自动修复构建问题和 Slack 每日总结,最长运行 3 天。
OpenClaw 支持 QQ 接入,可收发 Markdown、图片、语音和文件
腾讯开放 QQ 接入 OpenClaw,支持 Markdown 消息、图片、语音、文件等多媒体,一个 QQ 号最多创建 5 个机器人。
美国五角大楼任命 DOGE 官员为首席数据官统筹 AI 军事应用
美国国防部任命 Gavin Kliger 为首席数据官,统筹 AI 核心项目,对接顶级 AI 实验室支持作战任务。五角大楼弃用 Anthropic 转投 OpenAI,并对前者发布供应链风险警告。
OpenClaw 实战宝典:100 个优秀案例让你快速上手
OpenClaw 实战案例集收录 70+优秀案例,涵盖日常生活、内容创作、安全监控等。提供 Skills 安装和提示词模板,支持 RSS 订阅、社交媒体监控、购物比价等场景。
VTJ.PRO 2.0:AI 智能体重构低代码开发工作流
VTJ.PRO 2.0 采用 Agent+Skills 架构,支持自然语言生成组件、设计稿转代码、智能代码修复。增量更新提升效率 200%,布局还原精度达 99.1%。
OpenAI Codex-Spark 在 Cerebras 硬件上实现超快编码速度
OpenAI 推出 GPT-5.3-Codex-Spark 模型,部署在 Cerebras 晶圆级芯片上,每秒 1000 Token,比早期版本快 15 倍。支持 128k 上下文,优化 SWE-Bench Pro 和 Terminal-Bench 2.0 基准测试,向 ChatGPT Pro 用户开放研究预览。
OpenClaw 实战|多 Agent 打通小红书:数据收集 + 笔记编写 + 自动发布一步到位
OpenClaw 多 Agent 系统实现小红书全自动化:采集员获取热榜/竞品笔记,创作者基于数据创作合规笔记,总监调度全流程。集成 xhs-collector 和 Auto-Redbook-Skills,支持飞书多维表格沉淀数据,提供完整配置和代码步骤。
EVENT-DRIVEN INTELLIGENCE
免费先跟踪重点,再决定是否升级
每篇公开内容都对应三步:订阅每日情报、查看同主题历史上下文、升级 Pro 解锁搜索、研究和事件详情。