03月03日 · 科技日报

天眼日报

科技|2026年03月03日|49 分钟阅读
来源:1849 条推文 + 157 篇 RSS 文章·Lanyun·DeepSeek 生成·2026-03-02 — 2026-03-03
分享
科技 日报封面
AI 速读24 条精选

🤖 AI 大模型

⭐ Claude Code 支持语音模式

Anthropic 为 Claude Code 添加 Voice Mode,用户可通过语音交互代码。该功能今日上线,支持实时对话,提升开发效率。

Claude Code 最佳实践:15 条生产经验

Claude Code 实战经验总结:项目初始化用 CLAUDE.md 注入上下文、.claude/rules/ 模块规则、/new-feature 自定义命令;提示策略大任务拆分计划-评审-执行;工作流 git 检查点、/compact 压缩历史、Post-ToolUse Hooks 自动 lint。

ClawWork:AI 经济生存模拟基准

ClawWork 项目模拟 AI Agent 从 $10 起步完成 GDPVal 44 职业/220 任务,支付真实 Token 费用。Gemini 3.1 Pro Preview 赚 $15,661(11 小时,时薪 $1,390),Qwen3.5-Plus 成本最低 $6.78。开源地址 https://t.co/dR1OZQuBoH。

⭐ Anthropic 本周 Claude Code、claude.ai 和 Cowork 多项新功能上线

Anthropic 本周发布 Claude Code 自动记忆功能、claude.ai 多项改进及 Cowork 工具,支持 Python 代码执行和可视化输出,用户反馈最佳功能包括代码沙盒和 Telegram 集成。

Runway Gen-4.5 视频模型在 Arena 排名并列第 15,得分 1218

Runway Gen-4.5 模型在 Video Arena 文本到视频排名第 15,得分 1218,与 KlingAI Kling-2.6-Pro 持平,基于社区盲评实时更新。

⭐ 阿里发布 Qwen 3.5 小模型系列,支持 262k token 上下文

阿里推出 Qwen3.5-0.8B、2B、4B、9B 小模型,采用 Gated DeltaNet 混合注意力架构,每 3 层线性注意力配 1 层全注意力。9B 模型在多模态理解超 GPT-5-Nano 13 分、视觉数学 17 分、文档解析 30 分。全 Apache 2.0 开源,支持文本图像视频。支持 262k 上下文可扩展至 1M,9B 模型在数学至长视频理解多数任务超越 Qwen3 大模型。基础版开源便于微调,专为本地部署优化,4B 模型性能超前代 30B-A3B。Hugging Face/ModelScope 已开放下载。Elon Musk 评论 Alibaba Qwen 模型情报密度出色。

Claude 记忆功能免费开放,支持导入其他 AI 记忆

Anthropic 宣布 Claude 记忆功能向免费用户开放,用户可在设置中导出记忆并导入,支持随时导出和手动编辑,可关闭功能。免费用户增长 60%,付费订阅翻倍。支持导入 OpenAI 等记忆文件,记忆自动生成。

Anthropic 开源 Claude Skills 仓库,81.2K GitHub 星

Anthropic 开源 Claude Skills 仓库超 81.2K 星,每个技能仅耗 100 token 元数据,按需动态加载指令,支持文档创建、Web 测试等。单命令安装,跨 Web/API 使用。

研究者逆向 Apple Neural Engine 实现模型训练

研究者逆向 Apple ANE 私有 API,在 M 系列芯片上实现 Transformer 训练,前向/后向传播直接跑 ANE 硬件。单步 9.3ms、1.78 TFLOPS,绕过 CoreML,权重梯度 CPU 计算,支持本地小模型训练。

⭐ LlamaParse 支持文档布局数据解析并保存图像

llama_index 的 LlamaParse 解析文档时提供图表布局数据,指定保存布局图像后响应中获取每个元素的裁剪截图。

Google 推出 Nano Banana 2 自定义图像生成,提升细节与分辨率

GeminiApp 支持教师和学生快速创建专业级自定义图像,包含无缝文本和更准确结果,提升工作表、演示和创意项目。支持多种宽高比输出,从 521px 上采样至 2K/4K,优化照明、纹理与锐度,适用于 AI 视觉创作。

LangChain 完成品牌进化发布最终形态

LangChain 推出新品牌,支持 AI 代理完整工作流,从构建到部署。

⭐ Ollama 发布 Qwen 3.5 小模型系列

Ollama 上线 Qwen 3.5 系列小模型,包括 9B、4B、2B 和 0.8B 参数,支持原生工具调用、思考和多模态能力。

⭐ SoulX-FlashHead 开源数字人模型

SoulX-FlashHead 开源,支持 5090 显卡生成 30 秒视频仅需 1.5 分钟,速度比 InfiniteTalk 快 4 倍,适合动漫角色拟人化。

FireRed-OCR-2B 端到端文档解析 OmniDocBench v1.5 第一,92.94%准确率

RED 团队 FireRed-OCR-2B 击败 Gemini-3.0 Pro/DeepSeek-OCR 2/Qwen3-VL-235B,三阶段训练+格式约束 RL,OCRBench TextRec 93.5%/FireRedBench 74.62%。单 RTX 3090 运行,Apache 2.0 开源。

Inception Labs 推出 Mercury 2 扩散 LLM,推理速度比 Claude 快 10 倍

Inception Labs 发布 Mercury 2 扩散 LLM,每秒超 1000 token,端到端延迟比 Claude Haiku/Google Flash 快 5-10 倍。匹配速度优化模型质量,支持 OpenAI 兼容 API。

Anthropic Claude 聊天机器人大规模宕机

Anthropic Claude 及 Claude Code 服务中断,错误率高,已于伦敦时间 11:49 开始调查。影响用户及编码服务。

⭐ NullClaw:678KB Zig AI 代理框架,1MB RAM 下 2ms 启动

NullClaw 是纯 Zig 实现的 AI 代理框架,二进制大小 678KB,RAM 占用~1MB,启动时间<2ms。支持 22+ AI 提供商、13 通信通道和 18+工具,适用于 Arduino、Raspberry Pi 等边缘设备,通过 vtable 接口实现模块化。

⭐ CLI 完胜 MCP:Anthropic 标准下的 Agent 开发新思路

CLI 优于 MCP:上下文窗口效率高、组合灵活、工具成熟。10x 开发者直接暴露终端让 Agent 执行 bash 命令,工程量低。适用于 99%临时任务,企业级仅限审计需求。

Tabbit:美团光年之外 AI 浏览器,支持 Agent 和 Skill

Tabbit 是美团光年之外团队的 AI 浏览器,国内版用国内模型,国际版支持海外模型。支持 Agent 和 Skill,官网提供介绍和下载。


EVENT-DRIVEN INTELLIGENCE

免费先跟踪重点,再决定是否升级

每篇公开内容都对应三步:订阅每日情报、查看同主题历史上下文、升级 Pro 解锁搜索、研究和事件详情。

分享

NEXT STEP · 留下邮箱

获取下一次重大事件提醒

每天一封精选情报,先用邮件建立复访,再决定是否升级到更深的追踪能力。