天眼日报
🤖 AI 大模型
OpenAI 为 Codex 推出插件,支持 Slack、Figma、Notion 等工具无缝集成
OpenAI 宣布 Codex 新增插件,支持 SlackHQ、Figma、NotionHQ、Gmail 等工具的即插即用认证和工作流。插件捆绑应用和技能,现已在 Codex 应用、CLI 和 IDE 扩展中可用。
Meta 开源 TRIBE v2 人脑活动基础模型,支持全脑 70000 体素预测
Meta 发布 TRIBE v2 开源模型,利用预训练音频、视频、文本嵌入预测人类脑活动。无需重训,在听觉视觉数据集提升 2-3 倍,预测全脑 70000 体素,更接近群体平均神经活动。融合 LLaMA 3.2、V-JEPA2 和 Wav2Vec-BERT,支持零样本预测新主体、语言和任务,基于 500+ 小时 fMRI 数据训练,支持 700+ 人脑活动数字孪生。论文、代码和模型已在 Hugging Face 可用。
Google Gemini 支持从其他聊天机器人直接转移聊天记录和个人信息
Google Gemini 新功能允许用户从其他聊天机器人直接导入聊天和个人信息,提升切换便利性。推出 Import Memory 和 Import Chat History 功能,用户可复制提示词从其他 AI 导入偏好,或上传聊天历史快速迁移。
Google 发布 Gemini 3.1 Flash Live 实时语音视觉代理模型
Google DeepMind 推出 Gemini 3.1 Flash Live,支持 70 种语言、128k 上下文、视频流处理和音频转录,TTFA 低至 0.96s(最小思考模式),95.9% 准确率(高思考模式),延迟降低、精度提升,支持 2 倍长对话,动态调整回答长度和语气。一年优化模型+基础设施,实现质量、可靠性和延迟阶跃提升,支持语音和视觉代理构建,已在 Gemini App 和 Google AI Studio 可用。DeepMind CEO Demis Hassabis 宣布,支持 Gemini Live 更快响应、更自然互动。
Anthropic 调整 Claude 高峰期会话限额
Anthropic 为应对 Claude 需求增长,调整免费/Pro/Max 订阅高峰期(平日 5am-11am PT)5 小时会话限额,周限不变,云端效率优化减少 7% 用户受影响。
Chroma Context-1 20B 参数搜索代理开源
Chroma 发布 Context-1,20B 参数搜索代理,比前代快 10 倍、便宜 10 倍,Apache 2.0 开源,推动代理搜索前沿。
MiniMax M2.7 驱动首款轨道 AI 代理
MiniMax 与 OrbitAI 合作,M2.7 模型赋能首款太空 AI 代理,从地球扩展至太空应用。
Anthropic Opus 4.6 破坏风险报告附录详述代理监控系统
METR 与 Anthropic 合作,三周红队测试内部代理监控和安全系统,详见 Opus 4.6 报告附录 8.4.8,揭示漏洞并制定最佳实践。
Google DeepMind 发布 AI 操纵工具包,研究 10,000 人实验
Google DeepMind 推出首款实证验证的 AI 操纵测量工具包,研究 10,000 人显示 AI 在金融领域高影响力,在健康领域受限。识别恐惧等红旗策略,帮助构建防护。
OpenAI 搁置色情“成人模式”聊天机器人开发
OpenAI 因投资者反对而搁置成人模式聊天机器人,担忧性化 AI 内容对社会影响,据 FT 报道。
Google DeepMind 发布 Lyria 3 Pro 音乐生成模型
Google DeepMind 推出 Lyria 3 Pro,生成长达 3 分钟专业音频轨道,支持 intro/verse/chorus 结构,集成 Vertex AI 和 Gemini app。
Cohere 开源 Transcribe 2B ASR 模型登顶排行榜
Cohere 推出 cohere-transcribe-03-2026,2B 参数开源 ASR 模型,Apache 2.0 许可,支持 14 种语言(英语、法语、西班牙语等),在 Hugging Face Open ASR Leaderboard 平均 WER 5.42% 位居第一,超越 Whisper Large v3(7.44%)。支持长音频处理、vLLM 部署提供 2x 吞吐优化,专用于转录,支持实时处理,提升 AI 语音应用效率。
Mistral AI 发布 Voxtral 开源 TTS 模型
Mistral AI 推出 Voxtral 30 亿参数 TTS 模型,开源权重,支持 9 种语言和多种方言,24kHz 低延迟流式输出(WAV/MP3 等),20 种预设语音,情感表达自然。在人类偏好测试中标准声音胜出 ElevenLabs Flash v2.5 约 63%,自定义声音近 70%;需 3GB RAM,90ms 首音频延迟,5 秒参考音频克隆声音。vLLM Omni 即日支持,企业级语音代理专用,已在 Mistral Studio playground 可用。
WhatsApp 新增 AI 生成回复功能
WhatsApp 推出基于对话的 AI 生成回复功能,支持实时响应生成,提升用户交互效率。
OpenAI 广告业务扩展至 600 家,年化收入破 1 亿美元
OpenAI 广告试点扩展至超过 600 家广告商,4 月推出自助访问功能,年化收入突破 1 亿美元。
Claude Code Auto Mode 设计详解
Anthropic 推出 Claude Code Auto Mode,采用双层防御和三层决策,阻断率 17%,误报 0.4%,解决
EVENT-DRIVEN INTELLIGENCE
免费先跟踪重点,再决定是否升级
每篇公开内容都对应三步:订阅每日情报、查看同主题历史上下文、升级 Pro 解锁搜索、研究和事件详情。