天眼晚报
🤖 AI 大模型
𝕏 OpenAI GPT Image 2 登顶文生图榜首,Arena 盲测胜率高达 93%
OpenAI正式发布GPT Image 2,在Artificial Analysis榜单中超越Nano Banana 2和FLUX.2,成为Text-to-Image领域第一。模型在Image Arena盲测中以93%的胜率击败所有对手,排名跃升242分,创下历史新高。该模型支持复杂指令遵循、高保真度及文本渲染,API 定价为**$211/千张**。此外,创始团队成员确认gpt-image-2在API层提供2K/4K高清选项,标志着文生图领域的重大技术突破。
🔶 OpenAI 发布 Workspace Agents 与共享智能体,重塑企业工作流
OpenAI正式推出Workspace Agents,取代传统的GPTs成为新一代智能体。该功能面向Business/Enterprise/Edu套餐开放,支持在ChatGPT、Slack及Google Sheets插件中跨文档、邮件、代码和业务系统执行多步任务。新增共享 Agent功能允许团队协作处理长流程任务,支持后台定时运行、审批节点和合规审计。基于Codex驱动并拥有独立云端沙盒环境,可自动完成销售线索跟进等复杂工作流,标志着 AI 从聊天窗口全面转向办公工具生态。
腾讯混元 Hy3 Preview 发布并开源,295B 参数重构底层架构
腾讯正式发布混元 Hy3 Preview语言模型并开源。该模型由首席 AI 科学家姚顺雨主导,采用295B总参数、21B激活参数的MoE架构,支持256K上下文长度。作为混元重建后首个模型,其在Coding和Agent任务上表现优异,已上线元宝、WorkBuddy等内部产品。API 输入价格低至1.2 元/百万 tokens,在编程与智能体场景实现大幅提升。
𝕏 Kimi K2.6 接入 Perplexity Pro 并推出 Agent Swarm 并行架构
月之暗面推出的Kimi K2.6开源权重模型现已接入PerplexityPro 和 Max 订阅服务,在LongText-Bench上以0.9733分位居全球开源模型榜首。同时,Kimi发布K2.6 Agent Swarm,支持300 个并行子代理与4000 步执行,可一次性生成10 万字综述或2 万行数据集,涵盖搜索、编程及图像生成等异构技能,直接输出真实文件而非聊天内容。
𝕏 Qwen3.6-27B 模型全线适配主流框架,本地部署效率显著提升
阿里巴巴通义千问发布Qwen3.6-27B模型,现已支持Ollama、vLLM、Unsloth及SGLang框架。该版本提供 Day 0 级别的vLLM支持,可在SGLang平台上线并在多项代码基准测试中击败Qwen3.5-397B-A17B,展现更高效的Agentic coding能力与多模态推理性能,显著降低本地部署门槛。
Anthropic 推出未公开模型 Mythos,可自主挖掘零日漏洞
Anthropic推出未公开的Claude Mythos模型,具备识别银行、电网等关键基础设施中零日漏洞的能力。该模型仅向谷歌、微软、英伟达等 11 家机构开放,引发全球对AI 网络安全风险的担忧。
𝕏 字节跳动发布 Seed3D 2.0,3D 生成精度大幅提升
字节跳动正式发布Seed3D 2.0,采用MoE 架构与稀疏专家路由技术,显著提升纹理细节与金属粗糙度边界精度。技术报告已公开,API 现可通过火山引擎调用。
𝕏 微软将 Copilot Agent Mode 设为 Word、Excel、PowerPoint 默认体验
微软宣布Agent Mode在Word/Excel/PowerPoint全面可用并成为默认体验;内测数据显示,Excel参与度提升67%、满意度提升65%,Word 参与度提升 52%。
𝕏 Google Jules 升级为端到端产品开发平台,可自主规划 PR
Google宣布Jules从异步编码 Agent 升级为端到端产品开发平台。新版本能读取整个产品上下文,主动判断构建方向并提交PR,不再仅执行指定任务,标志着 AI 从执行者向决策者的转变。
𝕏 Hugging Face CTO 披露代码代理使用对比:Claude Code 为 Codex 的 4 倍
Hugging FaceCTO 引述团队统计称,Claude Code使用量约为Codex的4 倍,Codex 又约为 Cursor 的 2 倍。
EVENT-DRIVEN INTELLIGENCE
免费先跟踪重点,再决定是否升级
每篇公开内容都对应三步:订阅每日情报、查看同主题历史上下文、升级 Pro 解锁搜索、研究和事件详情。