大模型的核心秘密:开学季与招聘季的思考启示
大模型技术在近年来取得了显著的进展,特别是在开学季和招聘季,它成为了一个热门话题。本文探讨了大模型的核心秘密,分析了其背后的关键因素,包括数据源、算法和算力,并讨论了数据科学专业和数据分析师职业发展的道路。
一、大模型的密码
又到了一年的开学季,也是招聘季,今年最火的应该就是大模型应用了,作为一名互联网从业者,肯定要去独立思考一个问题:大模型的本质是什么,为何突然就火了?
以最热的chatgpt来说,仔细研究发现,竟然用的还是前馈神经网络和自回归模型这些算法,很巧的是,这套东西就是我读书时的研究方向,也就是说,十几年前都有了,这么多年,还是那一套。那到底是什么驱动大模型的本质变化
大家都知道,一个模型效果好坏的核心三个元素是:数据源、算法、算力。算法这块没什么新花样,那就只能是其他两个因素了,数据源这块最大的挑战是数据质量问题,算力这块最大的挑战就是计算显卡。
数据源质量:在数据正式可用之前,要做的一件事就是数据标注,就是打标签,得定义他,要不然计算机程序无法理解。但是呢,数据标注这个事人工工作量非常大,要想把几千亿、几百T数据很好的使用,肯定不能靠手工,必须要有模型能够对无标注数据进行理解。具体来说就是让模型在大规模无标注数据上针对通用型任务进行训练,使模型具备理解语言的基础能力。这一套在ML里面有个专业名词—无监督学习
无监督预(自监督)训练:在没有标注的数据上做预训练。假设我们有一段文本,里面每一个词都是有序的,模型使用 Transformer 解码器来预测第一个词出现的概率。预测的方式就是通过前面的词的序列来预测接下来词出现的概率,某种意义上讲就是各种枚举然后看概率,前面的词越长,预测出后面词出现的概率精度就越高,这点应该是非常容易理解的。同时我们也可以想象出,这个计算是非常恐怖的。
此外,数据量的大小对于运算计算机算力的要求往往呈现指数级别的关系,这也是强大算法的核心需求。原因是数据清洗和数据标注的核心意义就是将人们理解的非结构化数据转变成计算机可以理解的结构化数据。而人工智能对数据的本质理解其实就是矩阵的运算,矩阵的维度往往代表着数据特征的维度,这也是训练神经网络参数的基础,一般情况下,数据维度越多,模型参数量越多,模型越复杂,模型的准确度越高,对算力的指数需求越高。本质是数据维度与算力指数呈现正相关。
综上我们可以得出:大模型与小模型或者说传统模型对比,本质就是两个差异,一是算力变强了,也就是显卡性能好,二是数据量变多了,过往可能就是几千个参数,现在动不动就是多少个B,而这一切又离不开算力。所以说本质还是因为算力的进步带来了大模型的可想像力及落地。至于算法本身,无非就是调优再调优,总能找到空间
二、开学季,高校的数据科学专业
以前数据分析风口的时候,很多人转型数据分析,现在又到大模型了,肯定会心动,不少人都想去转型。其中一种方式就是去读个对口的在职研究生,目前大模型这块还是数据科学与大数据技术专业这个分支下。
数据科学专业的课程包括数学、统计学、数据挖掘、机器学习、程序设计、数据库管理、数据可视化、数据处理和数据分析等内容。学习如何使用编程语言(如Python、R等)和数据分析工具(如SQL、Tableau等)来处理和分析数据,并掌握基本的统计学和数学知识。研究方向主要包括以下几个方面:
1、人工智能方向:研究如何用人工的方法去模拟和实现人类智能,其研究基础是知识表示和推理、人工神经网络等。
2、数据技术方向:以Hadoop生态圈工具为代表的一系列对数据的收集、存储、分析和计算,强调对此类工具的熟练掌握和使用。
3、数据分析、计算与可视化方向:使用R或Python语言进行数据分析,基于Tableau、D3.js和Echarts等工具对数据进行可视化和可视分析
根据中国大学排行榜官网(CNUR)专业排名及评级结果。北京大学、复旦大学和华东师范大学排名全国数据科学与大数据技术专业前三,评级结果为S
三、招聘季,后续就业发展的三条路
基于数据科学的三个研究分支,在就业的时候会有三个方向,这也基本代表了目前数据分析人员发展的三条道路
1、人工智能方向:后续会从事算法的研究,包括算法设计、AB测试、模型调试,非常值钱,要求就是数学基本功扎实。本身大模型就是这个方向
2、大数据技术方向:后续会从事数据处理工作,包括采集、加工、存储、传输、平台建设,要求就是编程功底好。大模型本身也非常依赖
3、数据分析业务策略方向:后续会从事业务分析师、数据产品经理工作,包括提数、分析、报告,商业,要求就是综合能力强,人手不够的时候就当产品来上。大模型本身也需要数据策略产品经理,一个大模型可能会有不同的版本,基于不同数据也可能训练出不同的结果。策略产品经理的角色在于评估大模型的训练效果和制定优化策略。
可以看出,数据分析这条路一直很值钱,核心就是你要自己成长,能够自我进化
四、什么性格特质适合数据分析师
今年奥运会男乒1/4决赛樊振东VS张本智和的对决中,解说的一句话很有感触,拼到最后的已经不是技术,而是你的性格,你内心想成为的那种人。我们都知道性格,实际上就是你面对一个事情时候下意识的那个反应,比如说把你扔在陌生人当中,突然有人向你说话。你会不会回应他。这个就跟你性格当中的内向跟外向有关。那么究竟什么样的性格适合做数据分析师?
那测量性格的方法有很多种,比如说MBTI、disc,那其中呢,我觉得MBTI比较全面,并且我身边很多人都做过,所以我知道我身边的数据分析师都是什么样的性格,所以我就拿MBTI做例子,跟大家做一个分享。MBTI呢,主要是通过四个维度来考察性格,分别是
1、外向E,内向I
2、实感S,直觉N
3、理智T,情感F
4、判断J,感知P
每个维度下有两种类型,总共四个维度。据我身边的观察,我身边的数据分析师有大量的人都是STJ,也就是I和E无所谓,也就是内向和外向并没有明显的区分,这两个都可以,因为内向外向是相对的。然后偏务实、理智能够很快决策,这个也很好理解。这里也分享下MBTI链接,大家可以自己花1分钟时间去测试看下是否适合做数据分析师,特别是进化出的大模型架构师,很值钱!
本文由 @数据分析与人工智能 原创发布于人人都是产品经理。未经作者许可,禁止转载
题图来自Unsplash,基于CC0协议
该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务
- 目前还没评论,等你发挥!