e06084's Blog

借deepseek出圈谈谈我加入大模型之路 Zh

Published at 2025-02-09 | Last Update

春节Deepseek火爆出圈,火爆到什么程度?连我爸都跑过来问我,是不是人工智能我们已经打败美国啦。

2年前决定加入大模型的时候就看过梁老板的采访,当时就很敬佩他的纯粹信仰。虽然这波的火爆出圈个人觉得有各种因素原因,不过他们确实在不少方面有创新性的颠覆,这个阶段的成绩也是梁老板从一而终的结果。为他点赞。

正好,这两天看到知乎上看到一个北大博士分享他过去一年的工作经历,记录了他曾经和deepseek擦肩而过的过程,工作了小半年的想法。这样的故事其实很多,很多优秀的人有很多选择,人性驱使就会选择当时认知情况下利益最大化的那个选项。而高收益的选项往往在一开始不确定性比较强。

这让我回想到2年前我在做选择的时候也有很多类似的纠结。

在读研究生期间,我选的方向就是CV。那个时候CV都还不是很普遍,基本还是上一代的图像处理技术,都不能算的上是系统的AI方向。python也不是主流语言,当时做研究还主要用matlab和opencv。paper是仰望lifeifei的一些成果。都没有关注到deep learning在那个时候已经开始发力。那个时候自己不够专注,导师给予的指导也很少,并没有在科研上有什么建树,反而对国内的科研非常失望,也对自己的科研能力丧失了信心。

毕业后,没找到什么对口的工作,就去外企躺平了几年。然而,毕业后没几年国内第一波的AI厂商开始诞生并崛起。我自己水平太差,也没有付出精力投入,只是偶尔关注,已经渐行渐远了。

17年的时候,我记得第一篇文章,我写的是《人工智能能否再造福尔摩斯》。想重拾大学时候的梦想:机器学习。我已经有点忘记当时的背景,但是可以肯定的是,自己还是没有坚持的很好。

兜兜转转到了22年,工作生活都有不少变动。那一年我有开始关注老许的go+项目,学习了一些计算机语言的底层原理。失眠的夜晚反复读吴军老师的《数学之美》。对“语言”这个东西有一些更深的感悟,于是在公众号写了一篇《人类语言vs.计算机语言(一)》。巧合的是22年底chatGPT火爆出圈。当时,我就被惊艳到了。我当时的直觉是,在不久的将来我会被它取代。这只是一个直觉,算不得上多深的认知,因为我对当时deep learning的发展,行业内的各种情况一无所知。

23年开始换工作,一共面了两家,其中一家就是现在的单位。拿到offer的时候我欣喜若狂,因为离曾经的梦想如此之近,尤其在我完全没有经验的情况下。不过,在之后,我也纠结了一段时间,比如另一家给的待遇更好,现在这家单位因为比较新,很多东西都是模糊的,不能给准确的承诺。对,和那位博士网友一样,人性使然,我在为“六便士”纠结。最后我还是忠于内心选择了现在的单位。作为新入局者,并没有什么大的建树,不过我至少会专注坚持10年。

deepseek技术上革新有很多大佬都分析过了,我个人觉得它在其他方面带来的意义更重大,比如创新的自信上,比如技术型产品的商业模式上,比如新一代企业家的方法上。

写这篇主要是想勉励自己专注和坚持。