吴恩达:AI是时候从大数据转向「小数据」了

浏览:1953
【导读】AI大牛吴恩达不久前刚被检测出新冠阳性,许多网友都向他表达了早日康复的祝愿。令人振奋的是近日吴恩达发推文称:我现在几乎没有症状了,看起来病毒正在从我体中清除。新冠结果已由阳性转为阴性。
如今,他的工作重心放在了Landing 上。这是一家专门面向制造业厂商数字化转型的初创公司,创立目标就是帮助制造业公司更快速、轻松地构建和部署人工智能系统。
采访原文整理(节选)
畸形的深度学习
抱怨深度学习这畸形的研究发展路线,大公司才能玩得起sota,普通人连买张显卡都要承受几倍的溢价!
2018年,谷歌提出3亿参数BERT模型惊艳四座,将自然语言处理推向了一个前所未有的新高度
OpenAI在2019年初推出GPT-2,15亿参数
英伟达威震天(Megatron-LM)83亿参数
谷歌T5模型110亿参数
微软图灵Turing-NLG模型170亿参数
2020年GPT-3,1750亿参数,参数规模达到千亿级别,直逼人类神经元的数量
2021浪潮「源1.0」,2457亿参数
微软和英伟达联合发布MT-NLG,5300亿个参数
谷歌推出了1.6万亿参数的Switch Transformer
智源「悟道2.0」1.75万亿参数再次刷新万亿参数规模的记录
OpenAI寄予厚望的GPT-4预计将有大约100万亿个参数
.........
-
即使是最强大的GPU,也不再可能将模型参数拟合到单卡的显存中 -
如果不特别注意优化算法、软件和硬件堆栈,那么超大计算会让训练时长变得不切实际
巨头们为何热衷于大模型?
自从2018年谷歌推出BERT模型以来,语言模型做的越来越大,仿佛没有终点。短短几年,模型参数已经从最初的3亿,扩张到万亿规模。那么,这些AI巨头到底在争什么,大模型背后是怎样的畸形逻辑?
专门研究人工智能和语言的斯坦福大学教授克里斯·曼宁说:在十年前,他的实验室有足够的计算资源来探索任何项目,一个努力工作的博士生就可能会做出最先进的工作,而现在,这个窗口已经关闭了。
大模型路线,吃力不讨好
笔者身处科技圈,有一个明显的感受:2021年大模型的会议与讨论越来越多。预训练大模型本身的优势我们在很多新闻中都感受到了。然而打造大模型并不是一件轻松容易的事情,需要耗费大量的数据、算力资源等,大模型的意义是为了让算法模型集中化,但是市场中有条件的企业和机构都开始耗费大量资源自研大模型。大模型算法模型的集中化优势,经过这些机构对集中资源的分化,又有种烟囱式的割裂。
一些机构和产业界对大模型的参与到角逐,使得其呈现出一种宣传炫技般的画面感受。这样的发展模式很可能会给行业带来一些不好的影响:
大模型成为一些机构和企业秀肌肉的军备竞赛,开始比拼各自参数集数量级。你百亿级,我就千亿级。数据集本身就有限,标榜自己的数据集越大,水分可能就比较多,而在真实落地使用的情况方面,也并不不一定理想
算力资源和训练时间消耗过大,且也只限于部分行业的部分问题,普适性差
国内预训练模型的玩家们可用的中文数据集有限,就是我们知道的几种主流常用数据来源。在有限的数据集里,大家使用的数据未免重复,而因此研究出来的大模型能力就比较接近
大模型是否优秀,不仅依赖数据的精度与网络结构,也是对其与行业结合软硬件协同能力的比拼。单纯只强调低头研发高参数集、强算力模型等的方向,轻视一些与行业的协同二次调试等问题,就会陷入闭门造车的局面,限制了落地的路,走不远
一些预训练大模型经过极致化(数据、模型、算力)的发展后,也有可能面临小众、泛用性差的情形,比如一些高校研发的预训练大模型只能在小众的学术圈子里使用,无法工程化使用,最终沦为一次性的模型,浪费大量资源
大模型成为一些机构和企业秀肌肉的军备竞赛,开始比拼各自参数集数量级。你百亿级,我就千亿级。数据集本身就有限,标榜自己的数据集越大,水分可能就比较多,而在真实落地使用的情况方面,也并不不一定理想
算力资源和训练时间消耗过大,且也只限于部分行业的部分问题,普适性差
国内预训练模型的玩家们可用的中文数据集有限,就是我们知道的几种主流常用数据来源。在有限的数据集里,大家使用的数据未免重复,而因此研究出来的大模型能力就比较接近
大模型是否优秀,不仅依赖数据的精度与网络结构,也是对其与行业结合软硬件协同能力的比拼。单纯只强调低头研发高参数集、强算力模型等的方向,轻视一些与行业的协同二次调试等问题,就会陷入闭门造车的局面,限制了落地的路,走不远
一些预训练大模型经过极致化(数据、模型、算力)的发展后,也有可能面临小众、泛用性差的情形,比如一些高校研发的预训练大模型只能在小众的学术圈子里使用,无法工程化使用,最终沦为一次性的模型,浪费大量资源
写在最后
希望不是!
与其追逐万亿参数的巨大模型,不如把更多精力放在构建解决现实世界问题的、实用且高效的解决,不更好么?

技术邻APP
工程师必备
工程师必备
- 项目客服
- 培训客服
- 平台客服
TOP
