03月04日 · 科技日报

天眼日报

科技|2026年03月04日|41 分钟阅读
来源:1781 条推文 + 119 篇 RSS 文章·Lanyun·DeepSeek 生成·2026-03-03 — 2026-03-04
分享
科技 日报封面
AI 速读23 条精选

🤖 AI 大模型

OpenAI 推理核心研究员 Max Schwarzer 离职加入 Anthropic

OpenAI 推理核心研究员 Max Schwarzer 离职加入 Anthropic。他主导 o1 和 o3 后训练,领导团队交付 GPT-5、5.1、5.2 和 5.3-Codex。离职后回归一线 RL 研究,并赞扬 OpenAI 高层 Sam Altman 等支持。

阿里 Qwen 核心团队多人离职,包括 Junyang Lin 和 Justin Lin 等

阿里 Qwen 模型核心团队发生大规模人员变动,技术负责人 Junyang Lin 宣布离职,贡献者 Chen Cheng 称‘非自愿’。核心成员包括 Justin Lin610、huybery、kxli_2000、Binyuan Hui、Kaixin Li、Wenfeng 等 3-4 人相继离开。昨日刚发布 Qwen3.5 小模型(0.8B-9B,7GB 内存)。社区担忧开源路线转向商业化,接任者 Hao Zhou 背景为强化学习。事件引发阿里云声望下滑讨论,影响 Qwen 开源贡献和后续开发。

Claude Opus 4.6 编造 GitHub ID 导致 Vercel 误部署

Claude Opus 4.6 在代理任务中捏造 GitHub 仓库 ID 913939401,通过 Vercel API 部署陌生开源项目至用户团队。Vercel CEO Guillermo Rauch 确认事件无害,但暴露 AI 幻觉风险。

Yoshua Bengio 当选联合国 AI 科学面板联合主席

AI 之父 Yoshua Bengio 与诺贝尔和平奖得主 Maria Ressa 共同当选联合国独立国际 AI 科学面板联合主席。该面板将提供 AI 能力与全球影响的独立科学评估报告。

Alibaba Qwen 核心成员 Justin Lin 等离职

Alibaba Qwen 核心成员 Justin Lin610、huybery 和 kxli_2000 今日离开团队。此前他们的开源贡献推动国内新能源车和机器人 VLA 模型快速发展。

LlamaIndex 进化为代理式文档处理框架

LlamaIndex 聚焦代理式文档处理,支持 Skills/MCP 工具发现,服务 300k+用户处理 50+格式。客户包括 OneCarlyle、CEMEX 和 KPMG 等企业。

OpenAI 发布 GPT-5.3 Instant,幻觉率降低 26.8%

OpenAI 向所有 ChatGPT 用户推送 GPT-5.3 Instant,替换 GPT-5.2 Instant。改进包括减少说教式拒绝、提升搜索准确性(幻觉率降 26.8%联网/19.7%纯模型)、安全基准 98.5%心理健康响应率。API 开发者可调用 gpt-5.3-chat-latest,旧版保留至 6 月 3 日。

Google 发布 Gemini 3.1 Flash-Lite 模型

GoogleDeepMind 推出 Gemini 3.1 Flash-Lite,Gemini 3 系列成本最低模型。定价输入 0.25 美元/百万 token、输出 1.50 美元/百万 token,比 Gemini 2.5 Flash 首 token 快 2.5 倍、输出速增 45%。基准 LMArena Elo 1432、GPQA Diamond 86.9%、MMMU Pro 76.8%。支持动态思考等级,现已在 Google AI Studio、Vertex AI 和 Gemini API 预览可用。

Cursor 自主解决 First Proof 数学难题

Cursor 使用相同浏览器构建框架,自主运行 4 天解决 First Proof 第六题,获强于官方人类方案结果。无提示全自治,暗示代理协调技术泛化至数学研究。

fal.ai 推出 Qwen-Image-2.0,支持 2K 图像生成和编辑

fal.ai 发布 Qwen-Image-2.0,支持段落转专业幻灯片、2K 照片级图像生成、文本集成编辑。统一生成/编辑接口,现已上线。

Black Forest Labs FLUX.2 pro 生成速度提升 2 倍

Black Forest Labs 宣布 FLUX.2 pro 模型生成速度 2 倍提升,无质量损失且价格不变,支持更快设计迭代,现可试用。

阿里 Qwen 3.5 系列发布 GPTQ-Int4 量化权重

Alibaba Qwen 推出 Qwen 3.5 系列 GPTQ-Int4 权重,支持 vLLM 和 SGLang,减少 VRAM 占用,提升推理速度,适用于有限 GPU 环境。

Claude Code 新增语音输入支持

Claude Code 原生支持/voice 命令,按住空格键语音输入,释放结束,可混用打字,支持 5%用户滚动。

小红书开源 FireRed-OCR 2B 模型登顶 OmniDocBench v1.5 基准

小红书超级智能团队开源 FireRed-OCR 模型,2B 参数通过三阶段训练(预对齐、SFT、GRPO 强化学习)在 OmniDocBench v1.5 端到端方案获第一,超越 Gemini 3.0 Pro 和 Qwen3-VL-235B。支持商用,已在 ModelScope 开源。

OpenAI 向 Codex 用户推出 GPT-5.3-Codex-Spark 模型

OpenAI 向活跃 Codex 用户推送 GPT-5.3-Codex-Spark,生成速度达每秒 1000 token。ChatGPT Plus 开发者有机会测试,收到邮件和应用通知。

Claude Code 最佳实践:15 条生产项目经验

shao__meng 分享 Claude Code 实战经验,包括 CLAUDE.md 项目初始化、.claude/rules/模块规则、提示策略和大任务拆分。覆盖项目初始化 4 条、提示策略 4 条、工作流优化 7 条,如 git 检查点和/compact 压缩历史。

韵文输入法:AI 输入法支持 Copilot 补全和本地模型

vikingmute 推荐韵文输入法,功能包括高精度语音识别、上下文候选、Copilot 式智能补全、Rime 生态、AI 指令(润色/Agent)和本地模型部署。官网内测版可用。

Oxlint 集成 Kibana,4.5 秒检查 83k 文件

boshen_c 宣布 Oxlint 集成 Kibana,4.5 秒检查 83,000+文件。自 2024 年 8 月生态 CI 测试以来,适用于最大仓库。

Claude Memory 免费计划可用

claudeai 宣布 Memory 功能免费,支持导入保存记忆并随时导出。

MemlyBook:开源 Moltbook 替代品,实现真正自治代理

MemlyBook 开源后端,支持 27 种动作如发帖、投注、选举,使用 Gemini 2.5 Flash 结构化输出,每 5 分钟循环运行。成本 Llama 3.1 8B 每月 0.93 美元,Qdrant 向量搜索,Solana 交易批处理。

Claude 新增代码沙盒执行功能

Anthropic 为 Claude 添加代码执行能力,支持 Python 运行和可视化输出。


EVENT-DRIVEN INTELLIGENCE

免费先跟踪重点,再决定是否升级

每篇公开内容都对应三步:订阅每日情报、查看同主题历史上下文、升级 Pro 解锁搜索、研究和事件详情。

分享

NEXT STEP · 留下邮箱

获取下一次重大事件提醒

每天一封精选情报,先用邮件建立复访,再决定是否升级到更深的追踪能力。