天眼早报
🤖 AI 大模型
𝕏 Sakana AI 成立递归自我改进实验室,专注样本高效 AI
Sakana AI在东京正式成立RSI Lab(Recursive Self-Improvement Lab),旨在利用 AI 重新设计 AI 开发流程。该实验室基于LLM²、Darwin Gödel Machine等两年研发成果,致力于构建样本高效的自进化系统,而非依赖算力堆叠,探索了 AI 自主进化的新路径。
𝕏 Google 发布 Gemini Omni,支持视频生成与动态文字渲染
Google推出全新模型Gemini Omni,核心突破在于能将文本、图像、音频和视频融合,并生成高质量视频。该模型支持在视频中精准渲染文字,如让文字随物体运动而变形且保持清晰,解决了以往视频生成中文字扭曲的问题,标志着多模态生成的重大进步。
𝕏 Arena 发布 Agent Arena 排行榜,GPT-5.5 登顶实时任务评估
Arena推出Agent Arena实时代理评估平台,基于30 万+任务和200 万+工具调用数据。榜单显示OpenAI GPT-5.5排名第一,Anthropic Claude-Opus-4.7和Zai GLM-5.1分列二三位,涵盖代码编写、文档分析等复杂工作流,提供了透明成本与性能对比。
𝕏 Reve 2.0 与 MAI Image 2.5 跻身 Text-to-Image 榜单前十
Arena更新图像生成模型榜单,Reve 2.0以1,273分升至第 2 名,仅次于 GPT Image 2;Microsoft MAI-Image-2.5位列第 4;Ideogram 4.0 Quality作为唯一开源模型排名第 9。新模型在文本渲染和 3D 成像上表现突出,反映了文生图领域的激烈竞争。
𝕏 Ideogram 4.0 技术详解:93 亿参数扩散 Transformer 架构解析
Ideogram发布技术博客,介绍其最新模型Ideogram 4.0。该模型采用93 亿参数的扩散 Transformer 架构,配合冻结的8B VLM作为文本编码器,可在24GB消费级显卡上运行 nf4 量化版本,显著降低了部署门槛,使高质量文生图模型更易普及。
𝕏 Google Gemma 4 12B 模型发布,支持本地运行与 QAT 量化
Google发布Gemma 4 12B统一编码器模型,可在笔记本电脑本地运行并支持强大的多步推理和Agent 工作流。同时发布Quantization-Aware Training (QAT)检查点,通过定制混合精度方案将模型压缩至1GB以下,显著降低内存需求并提升端侧性能,vLLM和SGLang已提供首日支持。
𝕏 LangChain Deep Agents v0.6 上线流式处理功能
LangChain发布 Deep Agents v0.6,新增Streaming功能,支持高度并行化系统及工具/子代理进度的订阅模式。同时发布Streaming Cookbook提供可运行的示例代码,帮助开发者更高效地构建实时响应型智能体应用。
𝕏 OpenAI Codex 新增 iOS 应用构建插件,支持热重载与预览
OpenAI在Codex中推出Build iOS Apps插件,允许开发者直接在应用内浏览器查看和测试iOS 应用。该功能支持SwiftUI预览及无需离开Codex的热重载编辑功能,极大提升了移动应用开发的迭代效率。
𝕏 Replit Canvas 新功能:AI 生成 UI 与资产并转为应用
Replit推出新版 Canvas,支持使用 AI 创建精美 UI 设计,利用GPT-Image 2和Seedance生成资产,并在几分钟内将设计转化为可发布的应用程序。这一功能大幅降低了前端设计与原型开发的门槛。
🐙 Claude Code 插件 Supermemory 实现跨会话持久记忆
Supermemory推出Claude-Supermemory插件,赋予Claude Code跨会话的持久记忆能力。该工具支持团队知识库共享、自动捕获对话及项目级配置管理,有效解决了大模型上下文窗口限制问题,提升了复杂项目的开发连贯性。
𝕏 Grok Build 集成项目文件读写能力
xAI的Grok Build现已支持在项目文件内直接操作,具备完整读写权限,新文件自动存入项目目录。用户可通过终端命令直接在指定文件夹中工作,大幅提升企业工作流效率,实现了更紧密的代码与环境交互。
EVENT-DRIVEN INTELLIGENCE
免费先跟踪重点,再决定是否升级
每篇公开内容都对应三步:订阅每日情报、查看同主题历史上下文、升级 Pro 解锁搜索、研究和事件详情。