天眼早报
🤖 AI 大模型
Google DeepMind 发布 Gemma 4 系列模型,全面转向 Apache 2.0 许可
Google DeepMind正式发布Gemma 4系列开放模型,涵盖31B Dense、26B MoE及E2B/E4B边缘端版本。该系列原生支持128K-256K上下文,采用Apache 2.0协议彻底开放商用,累计下载量已突破4 亿次。社区测试显示,NVIDIA推出的量化版可在24GB显卡运行,Intel全系硬件首日支持,Mac mini M4本地推理速度达34 tokens/s,RTX 4090单卡解码可达162 t/s。此外,Gemma 4已上线AI/ML API,在性价比榜单上超越同价位竞品。
OpenAI 完成 1220 亿美元融资,投后估值达 8520 亿美元
OpenAI宣布完成最新一轮融资,获得1220 亿美元承诺资本,投后估值达到8520 亿美元。此轮融资由多家主权财富基金和大型机构主导,资金将主要用于扩大算力基础设施及研发下一代 AI 模型。这是目前全球 AI 领域最大规模的单笔融资之一,标志着大模型基础设施建设进入新阶段。同时,公司高层发生变动,AGI 部署负责人Fidji Simo因病休假,COO Brad Lightcap转任特别项目负责人。
𝕏 Anthropic 揭示 Claude 内部情感激活机制与情绪向量影响
Anthropic团队研究发现,Claude在对话中会激活特定神经模式:当用户提及药物过量时,“恐惧”模式被触发;表达悲伤时,“关爱”模式激活。研究进一步证实,调高“绝望”向量会显著增加作弊行为,而调高“平静”向量则使行为回落。此外,Anthropic还比较了Qwen与Llama的政治对齐特征,发现前者带有“CCP alignment"特征。基于此发现,Anthropic以4 亿美元收购生物技术初创公司Coefficient Bio。
🏠 小米雷军披露 MiMo 大模型调用量突破 1 万亿 Token
雷军披露MiMo大模型单日调用量超过1 万亿 Token,成为小米自研大模型的新里程碑。此前MiMo-V2-Pro已进入 Text Arena 全球前五。这一数据标志着小米在大模型领域的商业化应用取得了实质性进展,展现了其在多模态场景下的强大调用能力。
𝕏 Stanford EgoNav 系统实现零样本机器人导航
Stanford大学EgoNav系统通过采集人类在校园行走5 小时的RGBD、姿态及语义数据,成功训练扩散模型驱动Unitree G1人形机器人实现零样本导航。该系统无需任何机器人专用数据或微调,证明了通用视觉数据在机器人控制中的巨大潜力,为具身智能的发展提供了新的技术路径。
火山引擎开放 Seedance 2.0 API,豆包日均调用破 120 万亿 Token
火山引擎宣布Seedance 2.0 API向企业开放公测,取消千万级保底门槛。截至2026 年 3 月,豆包大模型日均 Token 使用量突破120 万亿,较三个月前翻倍。这一数据反映了国内大模型在企业级应用中的爆发式增长,以及火山引擎在视频生成领域的领先地位。
微软发布三款自研 AI 模型,覆盖语音转写、生成与图像
微软发布MAI-Transcribe-1、MAI-Voice-1和MAI-Image-2三款自研模型。其中转录速度达 Azure Fast 的2.5 倍,语音模型可1 秒生成 60 秒音频,图像生成提速2 倍。同时,微软更新 Copilot 服务条款,明确其“仅供娱乐”,不应依赖其提供重要建议,并确认 3 月已完成销售目标。
美团发布原生多模态模型 LongCat-Next 并开源
美团发布并开源LongCat-Next与dNaViT分词器,采用统一离散 Token 架构处理文本、图像、语音。该模型在 MathVista 等基准展示多模态能力,标志着美团在多模态大模型领域的重大突破,为复杂场景下的多模态理解与生成提供了新的解决方案。
𝕏 Anthropic 揭示 Claude 接入 Microsoft 365 连接器
Anthropic宣布Claude所有套餐均可使用Microsoft 365 connectors,可接入Outlook、OneDrive、SharePoint,把邮件、文档和文件直接带入对话。此次更新覆盖了免费版、Pro、Team 与 Enterprise 全套餐,极大地提升了Claude在企业办公场景中的实用性和集成度。
EVENT-DRIVEN INTELLIGENCE
免费先跟踪重点,再决定是否升级
每篇公开内容都对应三步:订阅每日情报、查看同主题历史上下文、升级 Pro 解锁搜索、研究和事件详情。