天眼日报

🤖 AI 大模型
fal.ai 推出 Kling Video 3.0 Motion Control
fal.ai 发布 Kling Video 3.0 Motion Control,升级运动捕捉实现电影级性能合成、一致面部身份(任意角度高清晰)、复杂情绪再现(面部遮挡下)。标准版链接:https://fal.ai/models/fal-ai/kling-motion-control,Pro 版:https://fal.ai/models/fal-ai/kling-motion-control-pro。
ModelScope 发布 Qwen-Image-Layered-Control-V2
Qwen-Image-Layered-Control-V2 基于 V1,支持刷子控制层提取(红刷目标层、绿刷移除层、重叠变黄),结合文本提示/负提示。推荐 10 步推理,刷子控制 cfg_scale=1 加速。训练于 artplus/PrismLayersPro 数据集,LoRA 加载。
谷歌 DeepMind 公开挖角阿里 Qwen 团队
谷歌 DeepMind VP Omar 公开邀请 Qwen 团队加入,称有多个期待项目规划中。阿里刚批准林俊旸辞职后,此举或引发人才流动。
Anthropic 与五角大楼重启 AI 合作谈判
Anthropic CEO Dario Amodei 与国防高官会面,讨论避免被列为供应链风险并限制军用 AI 模型。FT 报道称,此为最后努力防止政府禁令。
Nanbeige 4.1-3B 模型超 Qwen3.5-9B
Nanbeige4.1-3B 在 LeetCode 周赛 489-491 及 HMMT 2026 中显著超 Qwen3.5-4B 和 Qwen3.5-9B 性能。
谷歌 NotebookLM 推出 Cinematic Video Overviews 电影级视频概览功能
谷歌 NotebookLM 新增 Cinematic Video Overviews 功能,使用顶级/高级模型从来源生成豪华科幻大片风格的沉浸式视频概览,仅限 Ultra 用户使用,英文版可用,效果出色。
OpenAI Codex 推出 Windows 客户端
OpenAI 的 Codex 代理编码应用现已 Windows 可用,支持 500,000 开发者等待列表,默认使用 GPT-5.3-Codex 模型,提供 PowerShell 沙箱和 WinUI 技能,ChatGPT Free 用户起即可使用。作为 Claude Code 平替,支持代码相关任务。
微软开源 Phi-4-reasoning-vision-15B 多模态推理模型
微软开源 Phi-4-reasoning-vision-15B 模型,15B 参数,支持视觉推理,基准测试优于 Qwen3-8B-VL。模型链接:https://huggingface.co/microsoft/Phi-4-reasoning-vision-15B-instruct。
vLLM vs SGLang vs LMDeploy:2026 年最快 LLM 推理引擎对比
SGLang 和 LMDeploy 在 H100 GPU 上达到 16,200 tokens/s 吞吐量,vLLM 为 12,500 tokens/s,差距 29%。SGLang 擅长多轮对话,LMDeploy 量化模型最佳,vLLM 生态最成熟。
Condensation 理论与 Natural Latents 关系总结
Sam Eisenstat 的 Condensation 理论论文总结,提供 LVM 客观概念条件和 Bayes 网结构。证明 Condensation 可构造 Natural Latent,并在 LessWrong 上讨论数学关系。
EVENT-DRIVEN INTELLIGENCE
免费先跟踪重点,再决定是否升级
每篇公开内容都对应三步:订阅每日情报、查看同主题历史上下文、升级 Pro 解锁搜索、研究和事件详情。