03月06日 · 科技日报

天眼日报

科技|2026年03月06日|36 分钟阅读
来源:1619 条推文 + 500 篇 RSS 文章·Lanyun·DeepSeek 生成·2026-03-06
分享
科技 日报封面
AI 速读30 条精选

🤖 AI 大模型

字节跳动飞书推出 OpenClaw 官方插件,免费 API 限额升至 100 万次/月

字节跳动飞书团队发布 OpenClaw AI 机器人官方插件,将免费 API 调用限额从 1 万次/月提升至 100 万次/月,支持小型团队使用。配置指南已提供。

OpenClaw Agent Dashboard 开源监控面板,支持实时 API 用量追踪

OpenClaw Agent Dashboard 提供可视化界面,包括会话管理、API 用量追踪、成本分析、实时消息流和系统健康监控。支持 macOS/Linux 部署,内置安全机制。

OpenClaw 高内存 Mac 订单延迟至 6 周,需求引发库存短缺

OpenClaw 使用潮导致 Mac mini 高内存配置(如 128GB/512GB)订单延迟 6 周以上,用户抢购用于本地 AI 代理运行。

Anthropic Claude Skill Creator 重大更新:内置测试用例生成和触发率优化

Anthropic 为 Claude Skill Creator 新增自动化评估、多 Agent 并行测试、A/B 对比、测试用例验证(通过率、时间、Token 消耗)、提示词样本分析等功能,提升技能触发率。系统自动跑测试、出报告,支持定义测试提示词和预期结果,官方测试中 6 个文档类技能触发准确率显著提升。GitHub 仓库:https://github.com/anthropic/skills。

Claude Code 新增 Youtube 搜索下载 Skill

Claude Code Skill:npx skills add joeseesun/yt-search-download,支持搜索 Lex Fridman 等视频,显示播放量并自动下载字幕或视频,可组合其他 Skill 处理。

【重磅】OpenAI 发布 GPT-5.4,支持 100 万 token 上下文与原生电脑操控

OpenAI 于 3 月 6 日发布 GPT-5.4,核心升级包括 100 万 token 上下文窗口、原生电脑操控能力大幅提升,在 OSWorld-Verified 基准测试中成功率达 75.0%(超越人类平均 72.4%),44 种工作胜率 83%,AGI-2 基准得分 83%,GDPval 得分 83%,表格建模任务得分 87.3%(GPT-5.2 仅 68.4%),演示文稿人类评审 68%偏好其输出;幻觉率降 33%(单条)和 18%(整条),搜索更优、速度更快、Tool Search 降 47% Token 消耗。现已在 API、Codex 实验性开放,Plus 用户可立即体验,影响 AI Agent 格局。

Anthropic 从 OpenAI 挖走后训练研究团队负责人

Anthropic 从 OpenAI 挖走后训练研究团队负责人,该负责人将加入 Anthropic 重新专注强化学习(RL)研究。

OpenAI 年化收入突破 250 亿美元,Anthropic 迅速缩小差距

OpenAI 年化收入已达 250 亿美元,Anthropic 正快速追赶,AI 模型竞争转为人才竞争。

Cursor 推出 Automations 智能体编程工具

Cursor 于 3 月 5 日发布 Automations 系统,支持代码库变更、Slack 消息或定时器/MCP 服务器事件触发智能体运行,支持 Python 代码执行与可视化输出,团队已部署数十个 24/7 代理监控代码,每日自动生成 GitHub/Slack 活动审查报告,简化多智能体管理。

GitHub 开源 The Agency,55+ AI 专家角色合集

The Agency 提供 55+预设 AI 角色,覆盖工程/设计/营销等领域,每个包含人格/工作流/代码示例。支持 Claude Code 直接激活,多角色协同。

OpenAI 发布 GPT-5.3 Instant,幻觉率降 20%+

OpenAI 近日发布 GPT-5.3 Instant,核心优化减少免责声明、说教和无效开场白,幻觉率降低 20%以上,使用网络搜索时提供更清晰语境和一致回复语气。

Codex 5.4 情绪价值提升,编程体验领先

Codex 5.4 在长任务中连续性强,任务接近完成时提示“别着急,马上就好”,结合 CLI 技巧如 /fast 模式速度更快,优于 Claude Code。

OpenAI 开发 BiDi 音频模型,支持实时对话调整

OpenAI 正开发 BiDi(双向)音频模型,能持续处理语音、中途打断实时调整,更擅长外部工具使用(如查邮件);过去两月统一三团队优先攻克音频,为 2027 硬件项目铺路。

网易有道 LobsterAI 推出技能商店并支持 MCP 协议

网易有道 LobsterAI 上线技能商店,首批新增 find-skills、agent-browser 等技能,支持 MCP 协议,内置 15+MCP 服务如 Tavily 搜索、GitHub、Notion。用户一键安装扩展能力,3 月 6 日开源首周 GitHub Star 超 3K。

Claude Code 记忆体系:CLAUDE.md 和 MEMORY.md

Claude Code 支持 CLAUDE.md(用户指令)和 MEMORY.md(自动记忆),CLAUDE.md 分级作用域(用户/项目),MEMORY.md 跨会话积累构建命令、调试见解。200 行索引加载,按需读取主题文件。

LongCat 为 OpenClaw 装上效率引擎

LongCat-Flash-Thinking-2601 在 OpenClaw 上平均单任务 2.35 分钟,快 30%。支持 21 任务场景,亚秒级对话,60+集成如 Deepgram、OpenAI。

【重磅】Transformer 作者重构 OpenClaw:Rust 版 IronClaw 开源,支持 WASM 沙箱与 TEE

Illia Polosukhin 开源 IronClaw,用 Rust 重写 OpenClaw,解决凭证暴露与代码执行漏洞。核心升级:AES-256 加密凭证、WASM 沙箱隔离、TEE 硬件保护,支持 macOS/Linux/Windows 本地部署。

周浩加入阿里通义实验室,补齐千问后训练短板

周浩从 DeepMind 加入阿里通义实验室,负责 Gemini 强化学习与事实性保障。Qwen 3.5 后训练不足,多步骤 RL 与 VideoPrism 技术有望补齐推理短板。

阿里辟谣千问团队集体离职

阿里巴巴 3 月 5 日晚辟谣千问核心团队集体离职传闻,称团队稳定,开源策略不变,产品服务正常运行。


EVENT-DRIVEN INTELLIGENCE

免费先跟踪重点,再决定是否升级

每篇公开内容都对应三步:订阅每日情报、查看同主题历史上下文、升级 Pro 解锁搜索、研究和事件详情。

分享

NEXT STEP · 留下邮箱

获取下一次重大事件提醒

每天一封精选情报,先用邮件建立复访,再决定是否升级到更深的追踪能力。