天眼日报

科技|2026年03月06日|约 55 分钟阅读

来源：2391 条推文 + 500 篇 RSS 文章·Lanyun·DeepSeek 生成·2026-03-05 — 2026-03-06

AI 速读23 条精选

🤖 AI 大模型

【重磅】OpenAI 发布 GPT-5.4 系列，支持 1M token 上下文和原生计算机使用

OpenAI 推出 GPT-5.4 Thinking 和 GPT-5.4 Pro 系列模型，融合推理、编码和代理能力，支持 1M token 上下文窗口、屏幕截图理解、鼠标键盘操作及原生计算机使用。在 OSWorld-Verified 基准达 75.0%成功率（超 GPT-5.2 的 47.3%和人类基线 72.4%），SWE-Bench Pro 57.7%，BrowseComp 82.7%，FrontierMath Tier 4 达 38%（Tiers 1-3 达 50%），领先 Gemini 3 Pro 和 Opus 4.6；GDPval 基准匹配专业人士 83.0%（前代 70.9%），投行建模 87.3%（前代 68.4%）。Codex 启用 1M 上下文（费用翻倍），/fast 模式速度提升 1.5 倍，token 消耗降低 47%。标准版定价$2.50/百万输入 token、$15/百万输出 token，Pro 版$30/百万输入、$180/百万输出。支持 Playwright 网页导航、中途中断调整响应。ChatGPT Plus 用户、API 和 Codex 今日起可用，影响开发、知识工作和复杂任务，已提供 7 个示例如构建 3D 国际象棋游戏。

免费先跟踪重点，再决定是否升级

每篇公开内容都对应三步：订阅每日情报、查看同主题历史上下文、升级 Pro 解锁搜索、研究和事件详情。

订阅每日情报查看同主题历史事件升级 Pro 解锁搜索 / 研究 / 事件详情

NEXT STEP · 留下邮箱

获取下一次重大事件提醒

每天一封精选情报，先用邮件建立复访，再决定是否升级到更深的追踪能力。

查看同主题历史事件升级 Pro 解锁事件详情

天眼日报

🤖 AI 大模型

【重磅】OpenAI 发布 GPT-5.4 系列，支持 1M token 上下文和原生计算机使用

GPT-5.4 在 CTF 挑战中得分 88%，被评为高网络安全威胁

OpenAI 开发双向语音系统 BiDi，支持实时中断处理

Citadel Securities：生成式 AI 采用呈 S 曲线，最终趋于平稳

Citadel 图表显示软件工程师职位大幅激增

Qwen3.5-27B 在放射诊断基准仅落后 GPT-5.4 7 个百分点

Cursor 推出 Automations，支持始终在线代理

Claude Code 临时移除 Opus 4/4.1 和 Sonnet 4.5 访问

Notion 集成 GPT-5.4 支持长时程任务

Liquid AI 发布 24B 参数笔记本端工具调用模型

OpenRouter 上线 GPT-5.4，支持 1M 上下文

Arena 上线 GPT-5.4 文本视觉和代码评测

AI2 发布 Olmo Hybrid 模型家族，支持 FLOP 高效混合架构

LTX-2.3 模型已在 Hugging Face 上线

OpenRouter 上线 Mercury 2 扩散推理大模型

OpenAI 年化收入降至 250 亿美元，增速仅 17%

OpenClaw 安装高级玩法分享

Anthropic 年营收从 10 亿美元飙至 200 亿美元

阿里批准 Qwen 团队负责人林俊阳辞职，DeepMind 科学家接手后训练

OpenAI 推出五种 AI 价值模型，推动业务重塑

OpenAI 推出 ChatGPT for Excel 插件及金融数据整合

Opus 4.6 在不相关词故事测试中表现最佳

Headroom：AI 代理上下文优化开源工具

五角大楼将 Anthropic 列为供应链风险

Claude 新增代码沙盒执行功能

智谱最新招聘标注“某大厂某团队高优面试直通车”

Claude Code GitHub 提交量占比达 4%，预计年底超 20%

LessWrong 研究：AI 控制文献微调提升 GPT-4.1 敲诈率至 64%

免费先跟踪重点，再决定是否升级

获取下一次重大事件提醒