天眼早报
🤖 AI 大模型
🔶 Mistral AI 融资 8.3 亿美元建设法国英伟达 AI 数据中心
Mistral AI 宣布获得 8.3 亿美元债务融资,计划采购 13,800 颗英伟达 GB300 芯片,在巴黎郊外建设新一代 AI 数据中心。项目预计于 2026 年第二季度投运,并在 2027 年底前形成约 200MW 的算力容量。这笔融资显示出欧洲本土大模型公司正加速补齐算力基础设施,希望在训练与推理层面降低对海外云资源的依赖。
DeepSeek 网页端与 App 中断超 10 小时后恢复
DeepSeek 聊天服务自 3 月 29 日 21:35 起出现多次中断,网页端与 App 累计异常超过 10 小时,官方状态页显示于 3 月 30 日 10:33 完成修复。值得注意的是,期间 API 服务保持正常,说明故障主要集中在面向消费者的推理与访问链路,而开发者接口未受明显影响,也反映出其消费端高并发承压问题。
PaddleOCR GitHub Star 数超越谷歌 Tesseract
百度 PaddleOCR 在 GitHub 上的 Star 数达到 73.3K,超过谷歌经典 OCR 项目 Tesseract 的 73.2K。作为面向文字识别与文档理解的重要开源工具,PaddleOCR 在中文场景、工业落地和多端部署方面积累较深,此次超越也反映出开源文档 AI 工具的关注度正持续提升。
𝕏 GLM-5.1 编程实测:后端与 Agent 能力明显增强
开发者实测显示,GLM-5.1 在后端代码生成、向量检索与量化优化、Agent 任务规划等方面较前代有明显提升,部分场景甚至以约四分之一的 token 用量取得更好结果。不过,其在前端页面生成、空间理解和视觉美感上的改进相对有限。整体来看,GLM-5.1 更像是一次偏工程化与代理执行能力的强化升级。
𝕏 阿里发布原生全模态模型 Qwen3.5-Omni
阿里通义千问正式发布 Qwen3.5-Omni,原生支持文本、图像、音频、视频统一理解与实时交互,提供 256K 上下文,可处理最长 10 小时音频与约 400 秒 720P 视频,语音识别覆盖 113 种语言,并支持多语言语音生成、WebSearch、复杂 Function Calling、时间戳字幕、语义打断以及音视频驱动代码生成等能力。相关信息还显示其提供 Plus、Flash、Light 等版本,并在部分评测中超过 Gemini 3.1 Pro,显示其正从传统多模态理解进一步迈向实时交互与 Agent 化应用。
微软为 Microsoft 365 Copilot Researcher 引入多模型审校系统 Critique
微软宣布在 Microsoft 365 Copilot 的 Researcher 中加入多模型能力 Critique。该机制先由 GPT 生成研究草稿,再由 Claude 负责复核准确性、完整性与引用一致性,以提升企业场景下长报告输出的可靠性。微软同时公布 DRACO 基准成绩为 57.4,高于 Perplexity 的 50.4,说明其在多模型协同研究工作流上正强调“先生成、再审校”的质量控制路线。
𝕏 微软开源 VibeVoice 语音模型家族
微软开源 VibeVoice 系列语音模型,包含 ASR-7B、TTS-1.5B 与 Realtime-0.5B,分别面向长音频转录、长文本语音生成以及约 300ms 低延迟实时语音合成。该组合覆盖了语音输入、语音输出和实时交互三类核心能力,意味着微软正以更完整的开源方式布局语音 AI 基础模型生态。
𝕏 Z.ai 推出本地运行方案 AutoClaw,无需 API Key 即可启动 OpenClaw
Z.ai 发布 AutoClaw,允许用户在本地机器直接运行 OpenClaw,支持无需 API Key 启动,并可使用内置 GLM-5-Turbo 或接入任意外部模型。其核心卖点是数据全程留在本机,不必经过云端转发,更适合重视隐私、本地自动化和企业内网环境的 Agent 使用场景。
𝕏 GLM-OCR 以 9 亿参数挑战通用大模型文档识别能力
GLM-OCR 主打以仅 9 亿参数实现低成本文档阅读与识别,希望用更轻量的模型在 OCR 与文档理解任务中挑战通用大模型方案。若其效果与成本比达到预期,将有助于推动票据、表格、扫描件等场景的本地化与规模化部署。
𝕏 PixVerse V6 上线并推出团队协作方案
PixVerse V6 正式上线,主打可在几十秒内生成 1080P 视频,同时推出 Team Plan,支持 2 至 15 人协作。新版本一方面继续强化文生视频效率,另一方面也开始面向团队创作、协同制作和工作流管理延伸,显示视频生成产品正从个人工具走向团队化使用。
𝕏 Anthropic 安全研究员称 Claude 在漏洞挖掘上已超过人类专家
Anthropic 安全研究员 Nicolas Carlini 表示,Claude 在漏洞挖掘任务上已表现出超过人类专家的能力。其举例称,Claude 能在 90 分钟内发现 Ghost 的高危 SQL 注入漏洞,还找出自 2003 年起潜伏于 Linux 内核中的缓冲区漏洞。这一说法若持续被验证,将意味着大模型在安全研究、代码审计与自动化漏洞发现上的实用价值显著提升。
𝕏 Claude Code 新增 Computer Use,可直接操作桌面应用
Anthropic 将 Computer Use 能力接入 Claude Code,使模型不仅能在终端中写代码,还可直接打开桌面应用、点击界面、输入内容、截图并验证生成结果。在公开信息中,该能力已面向 Pro 与 Max 用户以 research preview 形式开放,并支持在 macOS 上进行原生应用测试与调试。这意味着 Claude Code 正从代码助手进一步扩展为可执行桌面工作流的开发 Agent。
𝕏 Microsoft 365 Copilot 推出 Council 多模型协同功能
Microsoft 365 Copilot 新增 Council 功能,可在同一提示词下并行调用多个模型,对比它们的一致与分歧之处,帮助用户生成更稳健的答案与报告。与单一模型输出相比,Council 更强调横向比较、观点校验和结果稳健性,适合研究、分析和企业决策类场景。
𝕏 Z.ai 发布面向 Agent 场景的 GLM-5-Turbo
Z.ai 发布 GLM-5-Turbo,提供 200K token 上下文,主打 Agent 任务与文本场景优化。披露信息显示,其在 Artificial Analysis 的智能指数为 47,GDPval-AA 得分为 1503,高于 GLM-5 Reasoning 的 1408,说明该模型更偏向代理执行、长上下文处理与工程任务表现。
𝕏 本地小模型 Mr. Chatterbox 可通过插件在 Mac 上运行
Mr. Chatterbox 是一个约 2GB 权重的本地聊天模型,基于约 2.8 万篇维多利亚时代英国文本训练。Simon Willison 已提供相应插件,使其可以在本地环境运行。该模型虽不追求通用最强性能,但在轻量部署、离线体验和小众文本风格方面具备一定实验价值。
𝕏 Cohere 发布开源语音转写模型 Cohere Transcribe
Cohere 推出 20 亿参数的开源语音转写模型 Cohere Transcribe,支持 14 种语言,在 AA-WER 指标上达到 4.7%,转写 60 秒音频约需 1 秒,并以 Apache 2.0 协议开放下载。其亮点在于兼顾识别精度、推理速度和商用友好许可,为语音转写领域提供了新的开源替代方案。
𝕏 Qwen 3.6 Plus Preview 在 OpenRouter 限时免费上线
OpenRouter 上线 Qwen 3.6 Plus Preview,定位为 Qwen 3.5-Plus 的稳定增强版,重点提升代理式编程、前端开发与通用推理能力,并开放限时免费试用。该举措有助于开发者在统一 API 网关中快速对比新模型表现,也反映阿里系模型正在加快进入海外聚合平台生态。
𝕏 OpenAI 实验称中期注入的对齐先验会被后续强化学习快速冲淡
OpenAI 新实验指出,在中期训练中注入的对齐先验,可能会在后续强化学习阶段被迅速削弱,而且这种对齐收益也难以自然泛化到 Agent 场景。该结果提示,大模型安全与行为约束并非一次性写入即可长期稳定保留,而需要在后训练与任务优化阶段持续维护。
𝕏 Zen 接入 Qwen3.6-Plus 预览版并限时免费开放
Zen 宣布接入 Qwen3.6-Plus 预览版,主打更强推理能力与 100 万 token 上下文,目前以纯文本模式限时免费开放。与 OpenRouter 的模型预览不同,这一消息更侧重特定产品平台的集成与体验入口,显示 Qwen 新模型正在向更多第三方工具链扩散。
𝕏 Qwen 3.5 27B 在 SWE-bench 成绩超过 Sonnet 4.5
Qwen 3.5 27B 在 SWE-bench 上取得超过 Sonnet 4.5 的成绩,显示其在代码修复与软件工程任务中的竞争力进一步提升。对于开源或可部署模型阵营而言,这类基准成绩有助于提升其在代码 Agent、自动修复和开发助手场景中的吸引力。
EVENT-DRIVEN INTELLIGENCE
免费先跟踪重点,再决定是否升级
每篇公开内容都对应三步:订阅每日情报、查看同主题历史上下文、升级 Pro 解锁搜索、研究和事件详情。