抱歉,您的浏览器无法访问本站
本页面需要浏览器支持(启用)JavaScript
了解详情 >

靖待的技术博客

小清新IT旅程 | 为中华之崛起而读书

     **希望2024年能深耕技术。**

2023年,技术方面,对自己不太满意。

今年总结

先说说博客吧,毕竟博客是我技术向感受的输出窗口。今年发布的博文很少,尤其是4月以后到10月几乎停更。这有两大原因,一方面是生活上的,一方面是技术上的。
  在生活中,今年总是会被外界看起来不大的事情所牵绊,陷入各种内耗中。2022年底阳康后,身体似乎比以前要虚很多。2023年发烧的次数似乎比前十年加起来都多,甚至出现了这辈子没体验过的40.4℃(幸好脑子影响不大…吧)。很多次都有想学的心,但是整体状态让我只想躺着休息。这就是心有余而力不足吗?可是我三十还没到呢,这不对。明年一定要改。

技术博客只谈技术。
  在技术上,去年底开始,大模型技术受到关注,今年三月火热程度仿佛新技术革命一般,我也兴致勃勃地去阅读chatGPT的论文,去理解什么是RLHF,什么是PPO,如何去模型分布式训练等。但是当我粗浅地了解这些东西后,我陷入了一种莫名的失落感。NLP算法似乎进入到了一种谁的数据多、谁的算力大,谁就能赢得更高的准确率和召回率,而那些细微的模型区别,在这些东西的掩盖下,似乎已经不那么重要。未来,可能只有极个别接触到模型的核心算法去做模型的事情,其他人沦为数据处理师或者模型应用师,比如最新的Prompt工程师。
  这个词刚出来的时候,我是很不屑的。一个东西称为技术,应该是需要门槛的。但是Prompt这种玩意儿不需要会数据结构,也不需要会组成原理,甚至只要会打字(哦,语音输入也不是不行)就可以干的事情,也能算技术?这也能叫工程师?然而现实啪啪打脸,讲prompt优化的论文在各大顶会上如泉涌,一时间我真的分不清是因为这一块好灌水,还是因为prompt真的是技术。到现在,我还是有些不解,很多论文提出了各种玄学调prompt的方法,甚至还总结了很多经验,可是模型只要稍作修改,那些奇技淫巧很可能都失效了啊。这种感觉,就仿佛盲人摸象般,只知其然而不知其所以然。
  总之,困惑不外有二。一是个人很难复现大模型能力,我也想改模型,也想训练调参,但是没有那么多卡,也没有几十个数据团队为我服务,现在几乎失去了个人单打独斗就能创造的机会,只能看看论文,找找开源代码玩参数很小的玩具;二是火热的prompt技术似乎也没什么技术含量。所以,四月后很长时间,我对大模型一直抱有抵触情绪,有时候恨不能刻意避开它。仿佛它并不是一种厉害的发明,更像是粗鲁的大力飞砖打败了细致的算法。那段时间,经常在知乎上看到这种论调:NLP已死。那我去年从搜广推转向NLP,岂不是49年入国军?
  有时候也觉得自己很可笑,明明只是个刚入行的算法新手,竟然还挑剔起现在最火热的技术了,颇有点眼高手低。基础打扎实了吗就在这嚷嚷,我经常暗自嘲笑自己。然而我依然我行我素,我觉得扩散模型好玩、有用,多模态模型好玩、有用,大模型?啊nono。
  这种困扰直到被人骂了才清醒许多。“既然你觉得prompt算不上技术,那以前微调那些,也并没有重训模型,只是在原模型上修修改改,要说技术含量,也算不了什么技术。那你干嘛还要学微调那些呢?技术都是慢慢发展起来的。”不知道为什么,就这几句话反而说动我了。是我应该去适应技术,而不是让世界迁就我。如果足够强大,提出更好的技术时,也许世界就会跟随我。(纯属白日做梦~哈哈)
  所以,在很晚的11月,我又重新捡起大模型的论文看了起来。Better late than never嘛。

工作上,逐渐从新人成长为熟悉业务的老员工。可惜员工流动频繁,逐渐地,很少被指导技术了,自己一个人摸索总是不断走弯路。虽然一直明白,学技术要靠自己,可是还是偶尔做梦要是能跟着大佬学习多好。今年有了两个实习生,也是人生中第一次带人,自己非常理解如果有个经验稍多一点的人帮助白纸们规划或者点评一下,其实对他们来说也许可以省时省力一些。所以我尽量在他们困惑时帮一把,至少在这段实习中有些收获,虽然也很忐忑自己能力有限无法给予太多他们想学的东西,但是我已尽力啦,希望他们对我还算满意。

读书上,技术书籍今年读完了几本,还凑合。

明年计划

  • 跟着大模型的步伐,学!学就是了!
  • 基础,打基础,NLP基础永不过时
  • 搜广推算法持续关注
  • 写几个自己感兴趣的小软件
  • 了解机器人相关算法
  • 强身健体,为祖国健康工作!

希望明年能深耕技术。

评论