The Lede
今天最大的信号是 Agent 技术的工业化与分层。如果说 2025 年是 Agent 的“实验年”,那么 2026 年初,我们正在见证巨头与开源社区在“如何使用 Agent”上的根本分歧。
一方面,Meta 拟以 20-30 亿美元收购 Manus AI,意图将 Agent 能力直接整合进其社交与广告帝国,将“行动模型”变成新的增长引擎。与此同时,Anthropic 通过 Claude CoWork 和最新的 Claude 宪法,毫不掩饰地推进“白领工作自动化”的进程——从代码审计到文档处理,它不再只是辅助,而是意图替代。
另一方面,本地化与主权 AI 正在猛烈反击。Clawd.bot 的爆火、AgentCPM-Report (本地 DeepResearch) 的开源、以及 Flux.2 Klein 的本地部署热潮,都指向同一个趋势:用户渴望掌控自己的 Agent,既为了隐私(数据不出域),也为了不想被锁死在巨头的订阅制里。
我们正处在一个十字路口:是拥抱巨头提供的“高效替代方案”,还是构建属于自己的“数字员工”?
🦄 Unicorns & Giants (巨头动向)
DeepMind CEO 访谈:谷歌是唯一全栈巨头
Summary: Demis Hassabis 在达沃斯接受采访,称谷歌处于“红色警报”状态(每周工作 100 小时),但强调谷歌是唯一拥有从芯片、数据中心到模型、产品全栈能力的 AI 公司。他认为字节跳动是主要竞争对手(仅落后 6 个月),并预测 2030 年有 50% 概率实现 AGI。 Insight: Hassabis 的“全栈论”点出了 AI 竞争的终局——不仅仅是模型之争,更是系统集成之争。他对字节跳动的高度评价(“只落后 6 个月”)值得警惕,这表明中国在工程化落地上的速度可能被低估。
Meta 拟收购 Manus AI:补齐 Agent 短板
Summary: 据报道,Meta 计划以 20-30 亿美元收购 Manus AI。Manus 以其“通用 Agent”能力著称(能写代码、做研究、订机票)。收购将把 Manus 团队并入 Meta,意在为其社交平台引入“能行动的 AI”。 Insight: 这是一个防御性与进攻性并存的举措。Meta 拥有最强的开源模型 (Llama),但在 Agent 应用层(尤其是复杂任务执行)一直缺乏杀手级产品。收购 Manus 可以快速填补这一空白,防止 OpenAI (Operator) 和 Anthropic (Computer Use) 形成垄断。
Anthropic 的“阳谋”:Claude CoWork 与新宪法
Summary: 硅星人 Pro 犀利指出,Anthropic 通过 Claude Code (替代初级程序员) 和 Claude CoWork (替代初级白领),正在系统性地推进“废除人类工作”。同时,Anthropic 发布了 2.3 万字的新宪法,试图为这种强大的能力设定“道德边界”。 Insight: Dario Amodei 并没有掩饰他的预测(“50% 白领工作消失”),他正在通过产品去兑现这个预测。新宪法是这种强大能力的“紧箍咒”,也是一种免责声明——“我们已经尽力让它安全了,至于它抢了谁的饭碗,这是社会问题”。
🛠️ Builders & Tools (构建者与工具)
Clawd.bot: 本地 Agent 的高光时刻
Summary: 一个开源的、本地优先的个人 AI 助理。支持 WhatsApp/Telegram 接入,拥有持久记忆,能控制浏览器、系统,且数据完全私有。 Insight: 用户对 Clawd.bot 的狂热(“感觉像早期的 Linux”、“这是真正的个人 OS”)反映了对 SaaS Agent 的疲劳。人们想要一个真正属于自己、不会因为网络断连或 API 涨价就罢工的数字管家。
AgentCPM-Report: 本地 DeepResearch
Summary: OpenBMB 开源了 AgentCPM-Report,一个 8B 参数的端侧模型,能在本地完成类似 DeepResearch 的深度调研任务(40 轮检索、万字长文)。 Insight: 这是一个里程碑。如果 8B 模型配合精心设计的 Agent 流程(CoT、反思、规划)就能达到“可用”的深度研究水平,那么企业内部的“数据孤岛”将被激活,大量敏感数据可以在本地转化为决策情报,而无需上传云端。
Flux.2 Klein 本地部署
Summary: Flux.2 推出了 Klein 版本,速度极快(5090 显卡上 1.2 秒出图),显存要求低(8G 即可),支持复杂的图像编辑和重绘。 Insight: 图像生成的“摩尔定律”仍在生效。从 Flux.1 的庞大到现在 Klein 的轻量高效,本地生图的门槛进一步降低,这将加速 AI 在设计、游戏资产制作等领域的渗透。
Vercel 上线 Agent Skills 排行榜
Summary: Vercel 推出了 skills.sh,一个精选的 Agent Skills 注册表,支持 Claude Code, Cursor, Windsurf 等多种环境,一键安装。 Insight: Skills is the new npm. 当 Agent 成为新的运行时,Skill 就成了新的库。Vercel 此举意在成为 Agent 生态的“包管理器”,这是一个非常聪明的生态卡位。
🧠 Research & Deep Dives (研究与深度)
Google 论文:复制粘贴 Prompt 大法
Summary: Google 研究发现,对于非推理模型(Non-Reasoning LLMs),简单地将 Prompt 重复输入一遍(Q -> QQ),能显著提升准确率(从 21% 提升到 97%)。原理可能是让模型有一次“回头看”的机会(类似 Attention 注意力机制的二次聚焦)。 Insight: “大道至简”。在我们将 Prompt 工程复杂化(CoT, ToT, GoT)的同时,有时这种极其朴素的技巧反而揭示了 Transformer 的本质特性。这也提醒我们,模型的能力往往隐藏在极其简单的交互模式之下。
检索的硬性上限 (Hard Limits of Retrieval)
Summary: 研究表明,单嵌入(Single-Embedding)检索器在文档数量超过一定阈值(取决于嵌入维度)后,无法理论上区分所有可能的文档组合。当维度为 768 时,上限约为 170 万文档。 Insight: 这对 RAG 系统是一个重要提醒。盲目增加向量库规模而不增加维度或采用多向量策略(如 ColBERT),会导致检索性能的数学性崩塌。未来的 RAG 必须是 Agentic 的——由 Agent 动态决定检索策略,而非依赖单一的向量相似度。
2025 AI 治理报告:回归现实主义
Summary: 腾讯研究院报告指出,全球 AI 治理风向已从“末日恐惧”转向“产业发展”。美国去监管化,欧盟修法减负,中国强调务实应用。 Insight: “发展即安全”。在激烈的国际竞争面前,没有任何国家愿意因为过度的安全焦虑而掉队。2026 年的主旋律将是释放生产力,而非束缚手脚。
🧘 Zen & Future (未来与思考)
Dan Koe: 未来的工作
Summary: 当 AI 接管了生产力,人类剩下的价值是什么?Dan Koe 认为是 Agency (主观能动性)、Taste (品味/判断力) 和 Perspective (独特的视角)。如果不构建自己的意义,社会将赋予你一个(可能是无意义的)目标。 Insight: 这与 Hassabis 的“后稀缺时代”构想不谋而合。当“干活”不再稀缺,“决定干什么”和“定义什么是好的”将成为人类最后的高地。
马斯克:瓦特将是通用货币
Summary: 马斯克认为文明等级的唯一标准是“能量控制能力”。未来的硬通货是“功率” (Watt)。文章还讨论了戴森球的搜寻现状。 Insight: AI 的尽头是能源。算力就是能量的转化形式。谁掌握了廉价、无限的能源(核聚变、戴森球),谁就拥有了无限的智能。