05月10日 · 科技晚报

天眼晚报

科技|2026年05月10日|53 分钟阅读
来源:789 条推文 + 343 篇 RSS 文章·Lanyun·BatchV2 生成·2026-05-10
分享
AI 速读21 条精选

🤖 AI 大模型

𝕏 Redis 创始人开源 ds4.c:让 284B 大模型在 128GB Mac 上运行

Antirez(Redis 创始人)开源 ds4.c 推理引擎,专为 DeepSeek V4 Flash 设计。通过 2-bit 量化KV Cache 存 SSD 技术,实现 284B 大模型在 128GB 内存的 Mac 上运行,实测生成速度达 14-15 tokens/sec(部分测试显示 M3 Max 可达 26.7 tok/s)。该项目展示了边缘设备运行超大模型的可行性。

𝕏 微软开源 Phi-Ground:40 亿参数点击准确率超越 Operator 和 Claude

微软发布 Phi-Ground 模型家族,专攻 AI 操控电脑时的点击定位。在 Showdown 基准测试中,其 40 亿参数版本搭配大模型规划后,点击准确率超过 OpenAI OperatorClaude Computer Use,并在五项评测中拿下百亿参数以下全部第一,证明了小模型在特定任务上的卓越性能。

💹 阿里巴巴官宣千问接入淘宝:重塑对话式购物新体验

阿里巴巴宣布将通义千问淘宝深度整合,推出智能体购物功能。用户可通过AI 对话直接浏览、比价并下单,覆盖超4 亿款商品,支持物流调度及售后全流程,彻底改变传统关键词搜索模式。此举标志着电商搜索向自然语言交互的重大转型。

𝕏 字节跳动开源 UI-TARS 系列:本地桌面 GUI Agent 与多模型支持

字节跳动开源 UI-TARS 系列智能体,包括原生桌面版 UI-TARS-desktop 及通用版。项目通过截屏和视觉模型精准控制鼠标键盘,支持 WindowsmacOS,数据完全本地运行保障隐私。UI-TARS 提供 2B/7B/72B 多种模型大小供选择,v0.3.0 版本新增 CLI 命令行支持和流式输出,并打通了 MCP 工具生态。GitHub Star 数已超 31.4k,展示了其在本地化 AI 操控领域的强大潜力。

𝕏 DeepSeek 终端 Coding Agent 获热榜第一及融资估值传闻

DeepSeek 在工具开发与资本市场上表现活跃。其用 Rust 编写的终端 Coding Agent DeepSeek-TUI 发布后迅速获得 1711 个 Star,成为 GitHub 当日热门项目。同时,据称 DeepSeek 正以 500 亿美元 估值融资 70 亿美元,创中国 AI 最大融资轮;创始人梁文锋个人出资 30 亿美元 并保持 90% 股权,展现了极高的市场关注度。

𝕏 OpenAI 关停微调 API:转向 Prompt 优先策略

OpenAI宣布全面关停面向开发者的自助微调服务。即日起新用户无法创建微调任务,现有用户仅能使用至 2027 年 1 月 6 日。官方表示新一代基座模型指令遵循能力已足够强大,直接使用 Prompt配合 RAG 更经济高效,标志着开发范式的重要转变。

𝕏 Perplexity 公开 Agent Skills 设计规范:构建上下文而非代码

Perplexity 团队公开内部 Agent Skills 的设计规范,提出反直觉观点:Skill 不是代码而是为模型构建的上下文。文章详细阐述了从 Description 撰写、Body 结构到评测集(Evals)构建的五步法,强调 Gotchas 列表的重要性,为开发者提供了系统化的技能构建指南,指出 Description 需以"Load when..."开头。

𝕏 明略科技开源 Mano-P 与 Cider:本地 GUI 智能体新突破

明略科技开源Mano-PCider,其中 Mano-P 1.0-72B 在 OSWorld 基准测试中达到**58.2%**成功率。该项目采用 Apache 2.0 许可,可在 Mac 边端运行,为本地桌面自动化提供了新的开源解决方案,进一步丰富了 GUI Agent 生态。

𝕏 OpenAI 开源 20B MoE 模型量化版:16GB Mac 离线运行

gpt-oss-20b-tq3TurboQuant 3-bit量化和MLX优化,可在 16GB MacBook 离线运行。该模型展示了小参数量级模型在消费级硬件上的高效部署能力,降低了本地运行 AI 的门槛。


EVENT-DRIVEN INTELLIGENCE

免费先跟踪重点,再决定是否升级

每篇公开内容都对应三步:订阅每日情报、查看同主题历史上下文、升级 Pro 解锁搜索、研究和事件详情。

分享

NEXT STEP · 留下邮箱

获取下一次重大事件提醒

每天一封精选情报,先用邮件建立复访,再决定是否升级到更深的追踪能力。