借deepseek出圈谈谈我加入大模型之路 Zh

Published at 2025-02-09 | Last Update

春节Deepseek火爆出圈，火爆到什么程度？连我爸都跑过来问我，是不是人工智能我们已经打败美国啦。

2年前决定加入大模型的时候就看过梁老板的采访，当时就很敬佩他的纯粹信仰。虽然这波的火爆出圈个人觉得有各种因素原因，不过他们确实在不少方面有创新性的颠覆，这个阶段的成绩也是梁老板从一而终的结果。为他点赞。

正好，这两天看到知乎上看到一个北大博士分享他过去一年的工作经历，记录了他曾经和deepseek擦肩而过的过程，工作了小半年的想法。这样的故事其实很多，很多优秀的人有很多选择，人性驱使就会选择当时认知情况下利益最大化的那个选项。而高收益的选项往往在一开始不确定性比较强。

这让我回想到2年前我在做选择的时候也有很多类似的纠结。

在读研究生期间，我选的方向就是CV。那个时候CV都还不是很普遍，基本还是上一代的图像处理技术，都不能算的上是系统的AI方向。python也不是主流语言，当时做研究还主要用matlab和opencv。paper是仰望lifeifei的一些成果。都没有关注到deep learning在那个时候已经开始发力。那个时候自己不够专注，导师给予的指导也很少，并没有在科研上有什么建树，反而对国内的科研非常失望，也对自己的科研能力丧失了信心。

毕业后，没找到什么对口的工作，就去外企躺平了几年。然而，毕业后没几年国内第一波的AI厂商开始诞生并崛起。我自己水平太差，也没有付出精力投入，只是偶尔关注，已经渐行渐远了。

17年的时候，我记得第一篇文章，我写的是《人工智能能否再造福尔摩斯》。想重拾大学时候的梦想：机器学习。我已经有点忘记当时的背景，但是可以肯定的是，自己还是没有坚持的很好。

兜兜转转到了22年，工作生活都有不少变动。那一年我有开始关注老许的go+项目，学习了一些计算机语言的底层原理。失眠的夜晚反复读吴军老师的《数学之美》。对“语言”这个东西有一些更深的感悟，于是在公众号写了一篇《人类语言vs.计算机语言（一）》。巧合的是22年底chatGPT火爆出圈。当时，我就被惊艳到了。我当时的直觉是，在不久的将来我会被它取代。这只是一个直觉，算不得上多深的认知，因为我对当时deep learning的发展，行业内的各种情况一无所知。

23年开始换工作，一共面了两家，其中一家就是现在的单位。拿到offer的时候我欣喜若狂，因为离曾经的梦想如此之近，尤其在我完全没有经验的情况下。不过，在之后，我也纠结了一段时间，比如另一家给的待遇更好，现在这家单位因为比较新，很多东西都是模糊的，不能给准确的承诺。对，和那位博士网友一样，人性使然，我在为“六便士”纠结。最后我还是忠于内心选择了现在的单位。作为新入局者，并没有什么大的建树，不过我至少会专注坚持10年。

deepseek技术上革新有很多大佬都分析过了，我个人觉得它在其他方面带来的意义更重大，比如创新的自信上，比如技术型产品的商业模式上，比如新一代企业家的方法上。

写这篇主要是想勉励自己专注和坚持。

« 目标函数

e06084's Blog

借deepseek出圈谈谈我加入大模型之路 Zh