天眼日报

科技|2026年03月03日|约 49 分钟阅读

来源：1849 条推文 + 157 篇 RSS 文章·Lanyun·DeepSeek 生成·2026-03-02 — 2026-03-03

AI 速读24 条精选

🤖 AI 大模型

⭐ Claude Code 支持语音模式

Anthropic 为 Claude Code 添加 Voice Mode，用户可通过语音交互代码。该功能今日上线，支持实时对话，提升开发效率。

Claude Code 最佳实践：15 条生产经验

Claude Code 实战经验总结：项目初始化用 CLAUDE.md 注入上下文、.claude/rules/ 模块规则、/new-feature 自定义命令；提示策略大任务拆分计划-评审-执行；工作流 git 检查点、/compact 压缩历史、Post-ToolUse Hooks 自动 lint。

ClawWork：AI 经济生存模拟基准

ClawWork 项目模拟 AI Agent 从 $10 起步完成 GDPVal 44 职业/220 任务，支付真实 Token 费用。Gemini 3.1 Pro Preview 赚 $15,661（11 小时，时薪 $1,390），Qwen3.5-Plus 成本最低 $6.78。开源地址 https://t.co/dR1OZQuBoH。

⭐ Anthropic 本周 Claude Code、claude.ai 和 Cowork 多项新功能上线

Anthropic 本周发布 Claude Code 自动记忆功能、claude.ai 多项改进及 Cowork 工具，支持 Python 代码执行和可视化输出，用户反馈最佳功能包括代码沙盒和 Telegram 集成。

Runway Gen-4.5 视频模型在 Arena 排名并列第 15，得分 1218

Runway Gen-4.5 模型在 Video Arena 文本到视频排名第 15，得分 1218，与 KlingAI Kling-2.6-Pro 持平，基于社区盲评实时更新。

⭐ 阿里发布 Qwen 3.5 小模型系列，支持 262k token 上下文

阿里推出 Qwen3.5-0.8B、2B、4B、9B 小模型，采用 Gated DeltaNet 混合注意力架构，每 3 层线性注意力配 1 层全注意力。9B 模型在多模态理解超 GPT-5-Nano 13 分、视觉数学 17 分、文档解析 30 分。全 Apache 2.0 开源，支持文本图像视频。支持 262k 上下文可扩展至 1M，9B 模型在数学至长视频理解多数任务超越 Qwen3 大模型。基础版开源便于微调，专为本地部署优化，4B 模型性能超前代 30B-A3B。Hugging Face/ModelScope 已开放下载。Elon Musk 评论 Alibaba Qwen 模型情报密度出色。

Claude 记忆功能免费开放，支持导入其他 AI 记忆

Anthropic 宣布 Claude 记忆功能向免费用户开放，用户可在设置中导出记忆并导入，支持随时导出和手动编辑，可关闭功能。免费用户增长 60%，付费订阅翻倍。支持导入 OpenAI 等记忆文件，记忆自动生成。

Anthropic 开源 Claude Skills 仓库，81.2K GitHub 星

Anthropic 开源 Claude Skills 仓库超 81.2K 星，每个技能仅耗 100 token 元数据，按需动态加载指令，支持文档创建、Web 测试等。单命令安装，跨 Web/API 使用。

研究者逆向 Apple Neural Engine 实现模型训练

研究者逆向 Apple ANE 私有 API，在 M 系列芯片上实现 Transformer 训练，前向/后向传播直接跑 ANE 硬件。单步 9.3ms、1.78 TFLOPS，绕过 CoreML，权重梯度 CPU 计算，支持本地小模型训练。

⭐ LlamaParse 支持文档布局数据解析并保存图像

llama_index 的 LlamaParse 解析文档时提供图表布局数据，指定保存布局图像后响应中获取每个元素的裁剪截图。

Google 推出 Nano Banana 2 自定义图像生成，提升细节与分辨率

GeminiApp 支持教师和学生快速创建专业级自定义图像，包含无缝文本和更准确结果，提升工作表、演示和创意项目。支持多种宽高比输出，从 521px 上采样至 2K/4K，优化照明、纹理与锐度，适用于 AI 视觉创作。

LangChain 完成品牌进化发布最终形态

LangChain 推出新品牌，支持 AI 代理完整工作流，从构建到部署。

⭐ Ollama 发布 Qwen 3.5 小模型系列

Ollama 上线 Qwen 3.5 系列小模型，包括 9B、4B、2B 和 0.8B 参数，支持原生工具调用、思考和多模态能力。

⭐ SoulX-FlashHead 开源数字人模型

SoulX-FlashHead 开源，支持 5090 显卡生成 30 秒视频仅需 1.5 分钟，速度比 InfiniteTalk 快 4 倍，适合动漫角色拟人化。

FireRed-OCR-2B 端到端文档解析 OmniDocBench v1.5 第一，92.94%准确率

RED 团队 FireRed-OCR-2B 击败 Gemini-3.0 Pro/DeepSeek-OCR 2/Qwen3-VL-235B，三阶段训练+格式约束 RL，OCRBench TextRec 93.5%/FireRedBench 74.62%。单 RTX 3090 运行，Apache 2.0 开源。

Inception Labs 推出 Mercury 2 扩散 LLM，推理速度比 Claude 快 10 倍

Inception Labs 发布 Mercury 2 扩散 LLM，每秒超 1000 token，端到端延迟比 Claude Haiku/Google Flash 快 5-10 倍。匹配速度优化模型质量，支持 OpenAI 兼容 API。

Anthropic Claude 聊天机器人大规模宕机

Anthropic Claude 及 Claude Code 服务中断，错误率高，已于伦敦时间 11:49 开始调查。影响用户及编码服务。

⭐ NullClaw：678KB Zig AI 代理框架，1MB RAM 下 2ms 启动

NullClaw 是纯 Zig 实现的 AI 代理框架，二进制大小 678KB，RAM 占用~1MB，启动时间<2ms。支持 22+ AI 提供商、13 通信通道和 18+工具，适用于 Arduino、Raspberry Pi 等边缘设备，通过 vtable 接口实现模块化。

⭐ CLI 完胜 MCP：Anthropic 标准下的 Agent 开发新思路

CLI 优于 MCP：上下文窗口效率高、组合灵活、工具成熟。10x 开发者直接暴露终端让 Agent 执行 bash 命令，工程量低。适用于 99%临时任务，企业级仅限审计需求。

Tabbit：美团光年之外 AI 浏览器，支持 Agent 和 Skill

Tabbit 是美团光年之外团队的 AI 浏览器，国内版用国内模型，国际版支持海外模型。支持 Agent 和 Skill，官网提供介绍和下载。

EVENT-DRIVEN INTELLIGENCE

免费先跟踪重点，再决定是否升级

每篇公开内容都对应三步：订阅每日情报、查看同主题历史上下文、升级 Pro 解锁搜索、研究和事件详情。

订阅每日情报查看同主题历史事件升级 Pro 解锁搜索 / 研究 / 事件详情

NEXT STEP · 留下邮箱

获取下一次重大事件提醒

每天一封精选情报，先用邮件建立复访，再决定是否升级到更深的追踪能力。

查看同主题历史事件升级 Pro 解锁事件详情