03月17日 · 科技日报

天眼日报

科技|2026年03月17日|48 分钟阅读
来源:1663 条推文 + 500 篇 RSS 文章·Lanyun·DeepSeek 生成·2026-03-16 — 2026-03-17
分享
科技 日报封面
AI 速读24 条精选

🤖 AI 大模型

⭐ OpenAI Codex 新增子 Agent 功能

OpenAI 为 Codex 添加子代理功能,支持并行处理任务不同部分、保持主上下文清洁,并在工作过程中指导各 Agent。同时处理任务不同部分、保持主上下文简洁。可在 Codex 应用和 CLI 中使用。

⭐ xAI Grok 文本转语音 API 开放

xAI 发布 Grok 文本转语音 API,支持自然语音和表达控制,开发者可立即集成到应用中。马斯克旗下 xAI 表示,Grok 的文本生成 Speech API 上线。

⭐ NVIDIA 发布 Nemotron 3 VoiceChat 语音对话模型

NVIDIA 发布 12B 参数的 Nemotron 3 VoiceChat,在开源语音对话模型中平衡对话动态性和语音推理能力,对话动态性得分 77.8%,语音推理得分 29.2%。

⭐ Google 发布 Gemini Embedding 2 多模态嵌入模型

Google 发布 Gemini Embedding 2,首个完全多模态嵌入模型,可在统一空间处理文本、图像、视频、音频,支持 100+语言,通过 Gemini API 和 Vertex AI 提供。

将 WASM 解释器嵌入 Transformer 权重实现精确计算

研究者将 WebAssembly 解释器无损嵌入 Transformer 模型权重,使 LLM 内部可执行实际计算而非推理,通过混合架构解决数值计算精度问题。

OpenAI 推出 100 亿美元企业 AI 合资项目

OpenAI 与 TPG、Bain Capital 等私募股权公司合作,投资 40 亿美元将 AI 工程师嵌入企业,企业工具年收入已达 100 亿美元,Codex 周活跃用户达 200 万。投前估值约 100 亿美元,私募将投入约 40 亿美元。

马斯克 xAI 大规模招募银行家,拟将 Grok 训练为"顶级投行分析师"

马斯克旗下 xAI 正招募华尔街银行家、交易员及信贷分析师担任"AI 导师",向 Grok 传授金融建模思维,涵盖杠杆贷款银团、困境投资等复杂金融产品。招聘银行家和私募信贷人员,以提升 Grok 聊天机器人在金融策略方面的能力。目前 xAI 的 AI 导师团队由刚高中毕业的年轻人领导,训练数据瓶颈明显。

ResNet 与 LSTM 的 90 度旋转关系解析

技术解析 ResNet 和 LSTM 在时间维度与深度维度的对偶性,以及 Kimi 通过 Residual Attention 实现 attention 机制的旋转创新。

⭐ OpenAI 视频 API 基于 Sora 2,客户应用展示

OpenAI 视频 API 由 Sora 2 驱动,客户已用于灯光、摄影和提示生成,支持复杂视频创建。

⭐ Kimi AI 发布 Attention Residuals 架构创新

Moonshot AI 推出 Attention Residuals 机制,让模型层间可选择性聚合信息而非盲目累加。在 48B 参数模型上测试,推理开销低于 2%,计算效率提升 25%,多项基准测试显著提升。Kimi 团队发布论文,提出 Attention Residuals 架构,在 Kimi Linear(总参数 48B,激活 3B MoE)上计算效率提升 1.25 倍,推理延迟增加<2%。训练更稳定,支持 Scaling Law。取代固定残差连接,使用 softmax 注意力选择先前层输出。GPQA-Diamond 得分+7.5,HumanEval+3.1,马斯克点赞称印象深刻。

⭐ Google 发布 A2UI 规范,Oracle 采纳为 Agent 标准

Google 推出 A2UI 声明式规范,允许 AI 代理以 JSON 格式提议 UI 界面。Oracle 已将其纳入 Open Agent Specification,与 CopilotKit 的 AG-UI 共同构建标准化 Agent UI 栈。

⭐ Perplexity Computer 集成本地浏览器控制

Perplexity 的 Computer 功能现可完全控制 Comet 浏览器,无需连接器或 MCP 即可访问任何网站和登录应用,向所有 Computer 用户开放。

OpenAI Codex 使用量快速增长

Sam Altman 表示 Codex 使用量增长迅速,团队每几个月就重新思考如何实现数量级提升,已部署 Cerebras 推理和 WebSockets。

Google Research 测试 LLM 科学推理能力

Google Research 与专家合作测试 6 个 LLM 在高温超导领域的表现,发现精选封闭系统模型优先使用高质量验证数据,表现最佳。

Gemini API 简化扩展流程

Google 优化 Gemini API 升级机制,Tier 1 到 Tier 2 升级时间从 30 天缩短至 3 天,消费门槛从 250 美元降至 100 美元,新增账户消费上限。

OpenAI 发布健康 AI 播客

OpenAI 健康负责人 Dr. Nate Gross 和研究负责人 Karan Singhal 讨论如何构建新模型和产品满足医疗健康需求。

Andrew Ng 发布 Context Hub CLI 工具,支持 AI 编码代理共享文档反馈

Andrew Ng 推出 Context Hub(chub)开源 CLI 工具,提供 1000+ API 文档,支持 AI 代理反馈机制。GitHub 星数超 6K,新增代理文档编写器。

⭐英伟达 GTC 大会:黄仁勋称 OpenClaw 如 Windows 般必备,推出 NemoClaw 安全版

英伟达 CEO 黄仁勋在 2026 GTC 首日演讲中称 OpenClaw 开源 AI 智能体项目如 Windows 操作系统般将成为企业必备,推动 AI 智能体战略。发布基于 OpenClaw 的安全版 NemoClaw,集成隐私路由器和网络护栏;宣布与 Groq 200 亿美元交易,预测 2027 年 Blackwell 和 Rubin 芯片需求达 1 万亿美元(从 5000 亿上调);推出 Vera Rubin 架构,整合 Groq 技术实现 350 倍推理加速,宣布进军太空计算并披露 Feynman 架构;NemoClaw 专为 OpenClaw 优


EVENT-DRIVEN INTELLIGENCE

免费先跟踪重点,再决定是否升级

每篇公开内容都对应三步:订阅每日情报、查看同主题历史上下文、升级 Pro 解锁搜索、研究和事件详情。

分享

NEXT STEP · 留下邮箱

获取下一次重大事件提醒

每天一封精选情报,先用邮件建立复访,再决定是否升级到更深的追踪能力。