天眼晚报
🤖 AI 大模型
𝕏 ⭐ 美团开源龙猫 2.0:1.6T 参数 MoE 模型,全程国产芯片
美团AI 团队开源龙猫 2.0(LongCat-2.0)模型,总参数1.6T,激活参数48B,原生支持1M 上下文,采用5-6 万张国产加速卡训练,训推全链路国产化,零英伟达依赖。Agent + Coding 定位,采用 MIT 协议,API 促销价百万 tokens 输入 2 元、输出 8 元。此前有报道称美团基于 50K 块国产芯片训练出 1.6 万亿参数模型(LLM Owl Alpha),应为同一模型系列。
𝕏 ⭐ 中国 AI 模型在 OpenRouter 上 token 份额飙升至 48%,美国份额暴跌至 20%
OpenRouter数据显示,中国 AI 模型 token 份额从20%飙升至48%,美国从74%暴跌至20%。Anthropic仅占12% token 量却拿走**46%**收入,市场分裂为量价两极化。
𝕏 ⭐ 中国模型价格仅 18 美分/百万 tokens,美国模型面临成本压力
CitiBank研究显示中国模型收费低至18 美分/百万 tokens,远低于美国平均4 美元。OpenRouter上开源模型份额从34%升至65%,企业因成本压力转向便宜 AI。
𝕏 ⭐ SGLang DSpark 实测数据公布
SGLang DSpark PR 放出实测数据:1K prompt 下加速比1.81 倍,8 卡 B200 速度达297 token/s,数学类 prompt 预测3.37个 token,TPOT 仅2.9-5.2ms。
𝕏 ⭐ 剑桥大学与 NVIDIA 提出 AI 智能体和评估者共同进化框架
剑桥大学与NVIDIA提出“Red Queen Gödel Machine”,让 AI 智能体和评估者共同进化。在编程任务上比基线节省1.35-1.72 倍token,论文写作接受率提升1.86 倍。
𝕏 ⭐ 彼得·戴曼迪斯汇总:阿里被指窃取 Claude 模型,白宫限制 GPT-5.6
彼得·戴曼迪斯汇总:阿里巴巴被指通过2.88 万次欺诈 API 调用窃取 Claude 模型;另据爆料,Anthropic封禁杭州 IP,阿里通过25000 多个账号从 4 月 22 日至 6 月 5 日交互2880 万次蒸馏数据,封禁邮件含追踪器。此外白宫将GPT-5.6限制给20 家公司;Neuralink计划今年尝试脑脑通信。
𝕏 ⭐ Anthropic 在美国企业 AI 订阅份额首次超越 OpenAI
Ramp AI Index显示,Anthropic在美国企业付费 AI 订阅中占41%,首次超越OpenAI的39.5%,环比上升 2.5 个百分点。
𝕏 Coinbase 测试将中国开源模型作为默认 LLM 网关
Coinbase CEO Brian Armstrong 表示,公司正在通过 LLM 网关测试默认使用中国开源模型(如GLM 5.2和Kimi 2.7),并根据难度路由提示,认为前沿模型对执行任务可能“过度设计”。
𝕏 DeepSeek V4 将引入峰谷定价,高峰时段价格翻倍
DeepSeek V4宣布 7 月中旬引入峰谷定价,高峰(9-12 点、14-18 点)价格翻倍,其他时段不变;PRO 版高峰输入缓存命中 0.05 元/百万 tokens。
𝕏 Google AI Studio 开放每分钟 100 万 token 免费额度
Google AI Studio 正式开放每分钟 100 万 token免费额度,开发者可零成本调用顶级算力,大幅降低大模型应用开发门槛。
𝕏 Google 即将发布 Nano banana 2 Lite 和 Gemini Omni Flash
据消息,Google 即将发布 Nano banana 2 Lite 和 Gemini Omni Flash,不会有 Gemini 3.5 Pro。
𝕏 Claude 正式进驻 Microsoft Foundry,支持 Azure 账号
Claude(Opus 4.8 和 Haiku 4.5)正式在Microsoft Foundry上线,支持 Azure 账号、提示缓存和扩展思考,满足美国数据驻留要求。
𝕏 Databricks 和 Microsoft 拥抱中国开源模型降低 token 成本
Databricks和Microsoft分别拥抱中国开源模型GLM-5.2和DeepSeek,以降低 token 成本,推动企业自建小模型。
𝕏 Vibe coding 平台 Base44 发布自家 AI 模型
Vibe 编码平台Base44 发布自研模型,寻求在 AI 创业中的可持续竞争力,被 TechCrunch 报道。
𝕏 ⭐ 传 Anthropic 封禁杭州 IP,因阿里大规模蒸馏 Claude 数据
据推主xiaohu爆料,Anthropic封禁杭州 IP,理由为阿里通过25000 多个账号从 4 月 22 日至 6 月 5 日交互2880 万次蒸馏数据。封禁邮件含追踪器。
𝕏 ⭐ Anthropic Claude Fable 5 将要求实名认证并单独付费
从i18n本地化字符串中发现,Claude Fable 5将要求用户提交身份证件和自拍照进行实名认证,需单独购买积分,不包含在 Claude 订阅套餐中。
𝕏 Anthropic 创始人称 AI 开源是伪命题
Anthropic 创始人表示,AI 模型虽公开权重但无法看到内部运作,不应称“开源”而应叫“开放权重”,且用户无法提交修改参与开发。
𝕏 Qwen 发表强化学习编码智能体新论文
Qwen发表强化学习编码智能体研究,分析奖励信号(测试通过率、LLM 评判、执行轨迹)的失效边界,指出每种信号都有其有效范围。
𝕏 谷歌因算力短缺限制 Meta 对 Gemini 的调用
谷歌因算力短缺已正式限制Meta对其Gemini模型的调用,称即使科技巨头也遭遇限量供应。
𝕏 EpochAI 数据显示三大 AI 公司仅用全球 21%AI 算力
EpochAI数据显示,2025 年末OpenAI、Anthropic和xAI只用约**21%**全球运行 AI 算力,全球部署约 1600 万 H100 等效单元。
EVENT-DRIVEN INTELLIGENCE
免费先跟踪重点,再决定是否升级
每篇公开内容都对应三步:订阅每日情报、查看同主题历史上下文、升级 Pro 解锁搜索、研究和事件详情。