天眼晚报
🤖 AI 大模型
𝕏 MiniCPM5-1B 发布:登顶 2B 以下开源小模型 AA 榜
OpenBMB发布MiniCPM5-1B,在 AA 小模型指数中得分17.9,超过 Qwen3.5-2B 并登顶 2B 以下开源小模型榜。其 INT4 权重约0.5GB,主打手机、浏览器和笔记本等端侧设备离线运行。
Gemma 4 引入多词元预测,推理速度最高提升约 3 倍
Google Gemma 4支持多词元预测草稿模型,通过投机解码并行生成候选词元,推理速度最高提升约3 倍。相关模型已上线 Hugging Face、Kaggle 和 Ollama,便于开发者测试部署。
🔶 马斯克透露 Grok V9-Medium 完成训练,1.5T 参数模型预计两三周内发布
马斯克称Grok V9-Medium已完成训练,参数量约1.5T,约为 v8-small 的三倍。该模型接下来将进入强化学习阶段,预计2-3 周后公开发布。
阿里云面向海外发布 Qwen Cloud,押注 Agent 成为云消费主力
阿里云在新加坡发布Qwen Cloud,提供网站、Skills和 CLI 三类入口,并推出 MuleRun、Qoder、QoderWork 更新。该平台面向海外 Agent 云工作负载,意在把智能体应用转化为新的云消费场景。
𝕏 DeepSeek 将 V4-Pro API 降价永久化,价格降至原 25%
DeepSeek将V4-Pro此前临时降价永久化,API 价格降至原来的25%。路透社称,DeepSeek 未确认此次降价是否与华为 Ascend 950 供应改善有关。
𝕏 腾讯混元 Hy-MT2 翻译模型登上 Hugging Face 趋势榜
腾讯混元称Hy-MT2-1.8B位列 Hugging Face 开源模型趋势榜第 1,Hy-MT2-30B-A3B位列第 4,下载量超过 7000。该系列主打机器翻译能力,显示中文厂商开源翻译模型在社区热度上升。
𝕏 Kling AI 称《House of David》前两季使用 AI 生成镜头
Kling AI获制片人Jon Erwin确认用于《House of David》第 1、2 季,包含剧集成片中的AI 生成镜头和原生 4K 模型相关能力,显示生成式视频模型正在进入影视制作流程。
𝕏 Anthropic 联合创始人 Chris Olah 与教宗同台讨论 AI 安全
Chris Olah出席教宗良十四世 AI 通谕活动,称前沿 AI 实验室存在激励冲突,并披露Anthropic模型可解释性团队发现类似情绪的内部状态。该发言聚焦 AI 安全、可解释性与行业治理。
🔶 字节跳动向 Seed 员工开放“豆包股”认购权
字节跳动首次为特定业务单元发行股权,向Seed 人工智能部门员工提供低价股票期权,收益挂钩部门成长。该安排被视为对豆包及 Seed 团队长期增长预期的激励。
𝕏 Anthropic Mythos 级模型或将公开发布,并已出现相关代码标识
Anthropic在Project Glasswing更新中透露,未来将公开发布Mythos-class模型,此前该级别模型仅限政府和关键合作伙伴使用。同时,claude-mythos-1-preview代码标识已更新,但普通用户目前暂不可用。
𝕏 Grok Build 命令行工具开放付费用户内测并公布使用门槛
Grok Build内测版面向SuperGrok或**X Premium+**用户开放,可用于写代码、做应用和自动化工作流。使用条件包括18 岁以上、30 天活跃账号、验证手机号及订阅资格,其中 X Premium+美区价格为40 美元/月。
𝕏 马斯克称 Grok 4.2 基座模型年底开源
马斯克表示Grok 4.2将在年底开源,模型规模约5000 亿参数。该消息指向 xAI 后续基座模型开放计划,但目前尚未披露许可证、权重发布时间和具体能力评测。
𝕏 Gemini 生成头像视频疑似异常消耗额度
Gemini在生成简单头像视频时疑似出现额度异常,用户称4 分钟耗尽5 小时额度且未成功生成,当周额度还被扣除5%。该案例反映生成式视频产品在额度计费和失败任务处理上的体验问题。
Altman 称 AI 不太可能造成“就业末日”
Sam Altman在悉尼表示,AI对初级白领岗位的替代低于预期,但特定岗位替代仍在推进。他的判断强调 AI 对就业的影响更可能是结构性变化,而非短期内全面引发“就业末日”。
EVENT-DRIVEN INTELLIGENCE
免费先跟踪重点,再决定是否升级
每篇公开内容都对应三步:订阅每日情报、查看同主题历史上下文、升级 Pro 解锁搜索、研究和事件详情。