天眼早报
🤖 AI 大模型
🔶 Anthropic 发布安全专用模型 Mythos,30 天挖掘超万级高危漏洞
Anthropic推出代号Mythos的安全专用模型,联合全球 50 家大型机构在30 天内挖掘出超10,000 个高危漏洞。该模型可自动构建攻击链,成功拦截 150 万美元电诈,并在 OpenBSD 代码库中发现隐藏 27 年的 Bug,显示出 AI 模型在攻防测试与代码安全审计中的专用化趋势。
𝕏 ModelBest 发布全球首个 Ascend 910B 端到端训练的 1.58-bit 三值大模型
ModelBest联合清华大学与 OpenBMB 社区发布BitCPM-CANN,号称全球首个在Ascend 910B上端到端训练的 1.58-bit 三值大模型。项目开源 0.5B 至 8B 多尺寸权重、完整训练脚本与复现管线,相比 BF16 显存占用减少 6 倍,面向边缘 AI、量化和低比特模型研究,补齐国产算力生态中的低比特训练资源。
🔶 DeepSeek V4-Pro API 永久降价 75%,并推进高估值融资
DeepSeek官宣将V4-Pro API 价格永久下调75%,API 成本降至原价 25%。报道还称其正推进 700 亿元融资,投前估值或达 450 亿美元;降价时间点与华为 Ascend 供给改善相关,也被视为通过开源和价格策略重塑 AI 推理成本曲线的重要动作。
花旗称 AI 需求垂直爆发,OpenAI 与 Anthropic 收入高速增长
花旗报告称,AI 需求正快速扩张,Anthropic二季度收入预计达109 亿美元、环比增长 130%;OpenAI一季度收入达 57 亿美元。报告认为算力和推理能力进入卖方市场,头部模型公司的商业化收入增长正在明显加速。
阶跃星辰发布端到端实时语音模型 StepAudio 2.5 Realtime
阶跃星辰发布端到端实时语音模型StepAudio 2.5 Realtime,支持中英双语、角色扮演与副语言理解。该模型采用百万级角色数据增强和特定 RLHF 对齐技术,并通过 WebSocket API 提供低延迟交互能力,面向实时语音助手、陪伴和角色化对话场景。
𝕏 llama.cpp 加入 MTP 后,本地 Qwen3.6 推理速度提升 78%
llama.cpp支持MTP后,Qwen3.6-27B在 A10G 上从 25 tok/s 提升至 45 tok/s,生成速度提升约 78%。这一改进显著降低了本地大模型日常使用门槛,对依赖消费级或云端单卡运行开源模型的开发者具有直接价值。
𝕏 Marin 团队 129B MoE 训练结果优于预注册 loss
Marin团队公布 129B 参数、16B 激活的MoE训练结果:预注册 loss 为2.252,最终达到2.234,优于预期目标。该结果为大规模 MoE 训练的可复现评估与训练过程预测提供了一个明确样本。
𝕏 LongCat 开源 MIT 许可证说话头像模型
LongCat发布开源说话头像模型,采用MIT 许可证,并已上线Hugging Face Space演示。该项目为口型驱动头像、虚拟人和轻量级多模态交互提供了可直接体验和二次开发的开源基础。
EVENT-DRIVEN INTELLIGENCE
免费先跟踪重点,再决定是否升级
每篇公开内容都对应三步:订阅每日情报、查看同主题历史上下文、升级 Pro 解锁搜索、研究和事件详情。