技术社区 来源:OsChina 2025-04-28 13:07:38 阅读:7
日前,Transformers 合著者 Illia Polosukhin 接受了 a16z 的专题采访,并在交流中分享了自己对于 AI、Agent 等方面的观点。
开篇,Illia 就分享了自己对现有 AI Agent 的看法。他表示,据团队观察,大量用户对需要复杂规划的场景特别感兴趣。但这种局面在未来将会反过来:AI 助理将会主动提出方案给用户,用户也仅需要做出方向性选择即可。对于这种 AI 何时面世,Illia 预测在未来一年内,就会出现首批成熟应用的场景。
对于「死亡互联网理论」,Illia 则坦言:虽然开放网络正在消亡,但并非网络上的机器人数量过多,而是因为平台容易被垃圾信息攻陷。对此他认为智能 Agent 能够为人类进行信息把关,未来 AI 助手也会成为互联网「垃圾分拣员」:能够为用户提供上下文链接,如实指出错误信息并揭露事实真相。
另外,主持人问及「未来将会有多少 AI Agent?与人类的数量比例又是如何?」时,Illia 则表示,未来每个人都会拥有属于自己的 AI 助手,而 AI 助手的背后可能运行着数十个子 Agent 项目,因此这会构建起一个庞大的 Agent 网络,并且每个人都将如同获得一套「按需助理系统」。
主持人还特别向 Transformers 作者问起了对 DeepSeek 的看法:
Robert:
您如何看待DeepSeek最新发布的高性能开源模型?相比其他选项,它不仅表现优异且成本更低,更特别的是由中国对冲基金以开源方式推出。
Illia:
首先这确实是激动人心的突破。他们在有限硬件上实现大规模高性能模型训练的工程能力令人惊艳,证明优秀工程实践能大幅降低成本。中国模型训练成本正在快速下降,但最关键的创新在于:他们提出了一种极其简单的强化学习方法——这个方法具有普适性,无论是10亿还是70亿参数模型都能快速获得优异效果。
这种“阶跃式创新”让我想起Transformer的诞生——原理简单、开箱即用、人人可复现。
坦白讲,这类基础方法论本应自由传播(毕竟只是公式或原理),但必须承认DeepSeek团队极其专业,他们凭借后发优势规避了许多早期问题。现在更重要的机遇在于:借助可验证计算技术,我们可以训练用户或社区拥有的模型——确切知道训练数据来源。
当前所有开源模型都只公开参数,无人知晓训练数据构成,即便公布也无法验证真伪。
区块链领域现在有机会联合训练一个“加密透明”的开源模型:所有人都能验证数据输入、训练过程及潜在偏差,确保没有隐藏后门或恶意代码。这样的模型才能真正成为AI时代可信赖的基础设施。
原文:https://mp.weixin.qq.com/s/hDgE_7fIb-ps4xSOuced_A