天眼日报

🤖 AI 大模型
字节跳动飞书推出 OpenClaw 官方插件,免费 API 限额升至 100 万次/月
字节跳动飞书团队发布 OpenClaw AI 机器人官方插件,将免费 API 调用限额从 1 万次/月提升至 100 万次/月,支持小型团队使用。配置指南已提供。
OpenClaw Agent Dashboard 开源监控面板,支持实时 API 用量追踪
OpenClaw Agent Dashboard 提供可视化界面,包括会话管理、API 用量追踪、成本分析、实时消息流和系统健康监控。支持 macOS/Linux 部署,内置安全机制。
OpenClaw 高内存 Mac 订单延迟至 6 周,需求引发库存短缺
OpenClaw 使用潮导致 Mac mini 高内存配置(如 128GB/512GB)订单延迟 6 周以上,用户抢购用于本地 AI 代理运行。
Anthropic Claude Skill Creator 重大更新:内置测试用例生成和触发率优化
Anthropic 为 Claude Skill Creator 新增自动化评估、多 Agent 并行测试、A/B 对比、测试用例验证(通过率、时间、Token 消耗)、提示词样本分析等功能,提升技能触发率。系统自动跑测试、出报告,支持定义测试提示词和预期结果,官方测试中 6 个文档类技能触发准确率显著提升。GitHub 仓库:https://github.com/anthropic/skills。
Claude Code 新增 Youtube 搜索下载 Skill
Claude Code Skill:npx skills add joeseesun/yt-search-download,支持搜索 Lex Fridman 等视频,显示播放量并自动下载字幕或视频,可组合其他 Skill 处理。
【重磅】OpenAI 发布 GPT-5.4,支持 100 万 token 上下文与原生电脑操控
OpenAI 于 3 月 6 日发布 GPT-5.4,核心升级包括 100 万 token 上下文窗口、原生电脑操控能力大幅提升,在 OSWorld-Verified 基准测试中成功率达 75.0%(超越人类平均 72.4%),44 种工作胜率 83%,AGI-2 基准得分 83%,GDPval 得分 83%,表格建模任务得分 87.3%(GPT-5.2 仅 68.4%),演示文稿人类评审 68%偏好其输出;幻觉率降 33%(单条)和 18%(整条),搜索更优、速度更快、Tool Search 降 47% Token 消耗。现已在 API、Codex 实验性开放,Plus 用户可立即体验,影响 AI Agent 格局。
Anthropic 从 OpenAI 挖走后训练研究团队负责人
Anthropic 从 OpenAI 挖走后训练研究团队负责人,该负责人将加入 Anthropic 重新专注强化学习(RL)研究。
OpenAI 年化收入突破 250 亿美元,Anthropic 迅速缩小差距
OpenAI 年化收入已达 250 亿美元,Anthropic 正快速追赶,AI 模型竞争转为人才竞争。
Cursor 推出 Automations 智能体编程工具
Cursor 于 3 月 5 日发布 Automations 系统,支持代码库变更、Slack 消息或定时器/MCP 服务器事件触发智能体运行,支持 Python 代码执行与可视化输出,团队已部署数十个 24/7 代理监控代码,每日自动生成 GitHub/Slack 活动审查报告,简化多智能体管理。
GitHub 开源 The Agency,55+ AI 专家角色合集
The Agency 提供 55+预设 AI 角色,覆盖工程/设计/营销等领域,每个包含人格/工作流/代码示例。支持 Claude Code 直接激活,多角色协同。
OpenAI 发布 GPT-5.3 Instant,幻觉率降 20%+
OpenAI 近日发布 GPT-5.3 Instant,核心优化减少免责声明、说教和无效开场白,幻觉率降低 20%以上,使用网络搜索时提供更清晰语境和一致回复语气。
Codex 5.4 情绪价值提升,编程体验领先
Codex 5.4 在长任务中连续性强,任务接近完成时提示“别着急,马上就好”,结合 CLI 技巧如 /fast 模式速度更快,优于 Claude Code。
OpenAI 开发 BiDi 音频模型,支持实时对话调整
OpenAI 正开发 BiDi(双向)音频模型,能持续处理语音、中途打断实时调整,更擅长外部工具使用(如查邮件);过去两月统一三团队优先攻克音频,为 2027 硬件项目铺路。
网易有道 LobsterAI 推出技能商店并支持 MCP 协议
网易有道 LobsterAI 上线技能商店,首批新增 find-skills、agent-browser 等技能,支持 MCP 协议,内置 15+MCP 服务如 Tavily 搜索、GitHub、Notion。用户一键安装扩展能力,3 月 6 日开源首周 GitHub Star 超 3K。
Claude Code 记忆体系:CLAUDE.md 和 MEMORY.md
Claude Code 支持 CLAUDE.md(用户指令)和 MEMORY.md(自动记忆),CLAUDE.md 分级作用域(用户/项目),MEMORY.md 跨会话积累构建命令、调试见解。200 行索引加载,按需读取主题文件。
LongCat 为 OpenClaw 装上效率引擎
LongCat-Flash-Thinking-2601 在 OpenClaw 上平均单任务 2.35 分钟,快 30%。支持 21 任务场景,亚秒级对话,60+集成如 Deepgram、OpenAI。
【重磅】Transformer 作者重构 OpenClaw:Rust 版 IronClaw 开源,支持 WASM 沙箱与 TEE
Illia Polosukhin 开源 IronClaw,用 Rust 重写 OpenClaw,解决凭证暴露与代码执行漏洞。核心升级:AES-256 加密凭证、WASM 沙箱隔离、TEE 硬件保护,支持 macOS/Linux/Windows 本地部署。
周浩加入阿里通义实验室,补齐千问后训练短板
周浩从 DeepMind 加入阿里通义实验室,负责 Gemini 强化学习与事实性保障。Qwen 3.5 后训练不足,多步骤 RL 与 VideoPrism 技术有望补齐推理短板。
阿里辟谣千问团队集体离职
阿里巴巴 3 月 5 日晚辟谣千问核心团队集体离职传闻,称团队稳定,开源策略不变,产品服务正常运行。
EVENT-DRIVEN INTELLIGENCE
免费先跟踪重点,再决定是否升级
每篇公开内容都对应三步:订阅每日情报、查看同主题历史上下文、升级 Pro 解锁搜索、研究和事件详情。