天眼早报
🤖 AI 大模型
𝕏 ⭐ Browser Harness:让 LLM 获得浏览器完全控制权的开源工具
Browser Use团队开源Browser Harness,仅592 行 Python代码,通过Chrome DevTools Protocol让 LLM 直接操作浏览器,具备自修复和技能自生成能力。
𝕏 ⭐ ML-Master 2.0 实现 24 小时不间断科研 Agent,获 56.44%奖牌率
研究团队在MLE-Bench上运行ML-Master 2.0达24 小时,采用分层认知缓存架构,获得**56.44%**奖牌率,证明长时程 Agent 是状态管理问题。
𝕏 ⭐ Apple 论文提出“Attention to Mamba”两阶段蒸馏法
Apple新论文提出一种将Transformer蒸馏到Mamba状态空间模型的两阶段方法,在1B参数模型上几乎匹配教师模型质量,实现线性时间推理成本。
𝕏 Claude Design 能够从文本生成 UI、设计和动画
Anthropic 的 Claude Design 功能展示出强大能力,能够仅根据文本描述生成复杂的用户界面、设计稿和动画效果。
𝕏 ⭐ LangChain 案例:通过缓存和路由将 RAG 聊天机器人成本降低 90%
LangChain社区工程师展示如何通过缓存、智能路由和LangGraph上下文管理,将生产环境RAG聊天机器人成本降低90%,延迟改善82%。
𝕏 ⭐ Grok 4.3 完成复杂研究任务:13 分钟思考,生成 8365 字报告
用户测试Grok 4.3,给予复杂研究提示后,模型思考 13 分 17 秒,自主创建项目文件夹,生成8365 字多文件报告并交叉验证信源。
𝕏 ⭐ Elon Musk 透露 Grok 模型更新路线图
Elon Musk 透露 Grok 模型更新计划:Grok 4.4(1 万亿参数)将于5 月初发布,Grok 4.5(1.5 万亿参数)将于5 月底发布,随后将推出 Grok 5,并称其将达到 AGI 水平。
𝕏 ⭐ 13+种你应该了解的 Attention 机制完整列表
整理了Self-attention、FlashAttention、MQA、GQA、MLA等13 种以上注意力机制,包含最新Slim Attention、KArAt、MoDA等变体。
𝕏 ⭐ DeepSeek 团队与华为在昇腾集群上密切合作
据内部人士透露,DeepSeek团队近期正与华为在其新集群上密切合作,推测合作重点可能在推理优化领域。
𝕏 Anthropic 更新系统提示,要求模型更主动
Anthropic 更新了 Claude 的系统提示,要求模型在用户问题只缺少量细节时不要反复追问,能自己查就自己查,优先使用工具,并尽量做完整。
𝕏 Grok 4.3 发布,支持生成多种文件格式
xAI 发布 Grok 4.3 (beta) 模型,新增创建幻灯片、表格、PDF、文档等多种文件格式的能力。
EVENT-DRIVEN INTELLIGENCE
免费先跟踪重点,再决定是否升级
每篇公开内容都对应三步:订阅每日情报、查看同主题历史上下文、升级 Pro 解锁搜索、研究和事件详情。