03月13日 · 科技日报

天眼日报

科技|2026年03月13日|53 分钟阅读
来源:2362 条推文 + 500 篇 RSS 文章·Lanyun·DeepSeek 生成·2026-03-12 — 2026-03-13
分享
科技 日报封面
AI 速读25 条精选

🤖 AI 大模型

Claude 新增交互式图表和示意图生成功能

Anthropic 的 Claude 现支持在聊天中直接构建交互式图表、示意图和应用生成功能,支持 Slider、下拉框等交互元素实时变化更新结果和图表。Beta 版今日向所有计划用户开放,包括免费版,无需代码或 Artifacts,所有套餐均可测试。

xAI 发布 Grok 4.20 Beta API,支持 2M token 上下文

xAI 推出 Grok 4.20 Beta API(0309 推理版),包括推理、非推理和多代理三种变体,Artificial Analysis Intelligence Index 得分 48(较 Grok 4 提升 6 分),2M token 上下文窗口(Grok 4 为 256K),定价$2/$6 每百万输入/输出 token。在 AA-Omniscience 评估中幻觉率 22%(最低,优于 Claude Haiku 4.5 的 25%),IFBench 得分 82.9%(+29.2 分领跑),推理速度 267 token/s,输出速度 265 token/s(2 倍于 Grok 4.1 Fast)。

xAI 更新 Grok Imagine 内容政策

xAI 将 Grok Imagine 图像生成内容限制调整为 R 级电影标准,建立更清晰的安全护栏,此前因无过滤输出受审查。

Elon Musk 宣布 Grok 4.20 Heavy Beta 2

Elon Musk 表示 Grok 4.20 Heavy (Beta 2)在深度分析中极快,Beta 3 将有大量修复和功能提升。

Grok Imagine 新增最多 7 张参考图像转视频功能

Grok Imagine 支持上传最多 7 张参考图像,通过@引用生成一致风格视频,确保角色或物体外观一致。xAI 今日更新 App 即可使用。

Arena 揭秘 Nano Banana 图像模型起源

Nano Banana 于 2025 年 8 月 12 日在 Arena 匿名亮相,成为历史最高投票模型,后确认基于 Google Gemini,2025 年 8 月 26 日公开发布。

Grok 4.2 在 OpenRouter 上线

Grok 4.2 模型现已在 OpenRouter 平台可用,支持用户立即测试和集成。

OpenClaw-RL:通过对话训练任意 Agent

OpenClaw-RL 开源项目,用户消息即 Agent 学习反馈,简化 RL 训练,支持/memory 和/skills 审计。

Codex 自动化功能正式发布,支持模板复用

Codex 自动化 GA,可设模型/推理级别,在 worktree 或分支运行,支持每日 repo 简报、issue 分类等模板。

Cursor 发布代理编码任务新评分方法

Cursor 分享评估代理编码模型智能与效率的新方法,对比各模型表现。2026-03-13 发布图表显示排名。

Claude Opus 4.6 破坏风险报告 METR 审查

METR 审查 Anthropic Claude Opus 4.6 未删减破坏风险报告,同意灾难性风险很低但非零。基于证据评估,与此前 Opus 4/4.1 类似。

Google Gemini Embedding 2 支持多模态统一向量空间

Google 推出 Gemini Embedding 2,将文本、图像、音频、视频和文档置于单一向量空间,支持跨媒体语义搜索,提供多模态搜索 Demo。

Gemini API 推出支出上限功能

Google 的 Gemini API 新增支出上限,开发者可设置上限控制成本,延迟最长 10 分钟生效,很快支持邮件通知。

FLUX.2 Klein 9B 开源权重模型发布

Black Forest Labs 推出 FLUX.2 Klein 9B,优化 KV 缓存,实现高质量编辑加速,支持 Diffusers 和 Spaces。图像编辑速度提升 2 倍,尤其多参考图像场景,API 免费升级,速度与 4B 模型接近,文档和权重已开源。

NVIDIA Nemotron-3 Super 开源,120B 参数 MoE 模型

NVIDIA 开源 Nemotron-3 Super,Mamba+Transformer 混合 MoE,总 120B 参数激活 12B,原生 1M 上下文。基准测试与 Qwen3.5 122B 和 GPT-OSS 120B 相当,throughput 表现突出,但整体评分低于 Qwen 3.5 122B-A10B。

Hermes Agent v0.2.0 发布,1200+提交更新

Hermes Agent v0.2.0 版本发布,包含 1200+提交、新功能、改进和 bug 修复,提升开源代理能力。

Anthropic 斥资 1 亿美元启动 Claude 合作伙伴网络

Anthropic 投入 1 亿美元初始资金推出 Claude 合作伙伴网络,提供培训、销售支持和技术援助,团队规模扩至原 5 倍,免费开放申请。

Claude Code 新增代理和工作流开发支持

Anthropic 为 Claude Code 添加代理和安全护栏,支持 Python 运行、可视化输出和工作流开发,现已集成到仪表板。

PLTR 与 NVDA 发布主权 AI OS

Palantir 和 NVIDIA 推出 Sovereign AI OS,结合 Blackwell GPU 基础设施和 Palantir 软件,支持安全本地、边缘或主权云部署,用户完全控制数据和模型。

BitNet:微软 1 位 LLM 可在 CPU


EVENT-DRIVEN INTELLIGENCE

免费先跟踪重点,再决定是否升级

每篇公开内容都对应三步:订阅每日情报、查看同主题历史上下文、升级 Pro 解锁搜索、研究和事件详情。

分享

NEXT STEP · 留下邮箱

获取下一次重大事件提醒

每天一封精选情报,先用邮件建立复访,再决定是否升级到更深的追踪能力。