Reaction---WhynotTV(翁家翌:OpenAI,GPT,强化学习,Infra,后训练,天授,tuixue,开源,CMU,清华)
这一期和上一期隔了非常久啊,不过请的人依旧硬核,虽然我没之前不知道翁家翌何许人也,但是看到这个 title 就知道又是一个大佬。能够感觉到就是这个 podcast 的嘉宾的定位似乎在变化,之前似乎都是那种 AI 相关领域的初创公司老板,不过现在来看可能扩展到了 AI 相关领域做出过很有影响力的工作的人。
翁家翌自己说他学东西“慢”,但其实在我看来又是一个由自己独特天赋的人:极其敏锐的数学直觉。看了这么多期,我发现能做出影响力的工作的人,总有些异于常人的天赋,且能长时间自发地投入到看似“枯燥”的事情上。比如他会自学初中自学高中乃至于大学的数学,我感觉这个人与人之间确实不一样。相比之前,我确实就是一个普通人:属于“有想法,完不成”的那类。就是我初中的时候也觉得高等数学好有意思,然后还买了大学的教材,但是只看了前几页;甚至现在也一样,觉得某个东西有趣、有用,想学一学,却总是没能坚持下去。
这种“坚持不懈”的能力算不算一种天赋呢?是因为运气不好没遇到那件能提供持续动力的事情,还是这世界上本就没有这种事?为什么有的人能从大众眼中的“无聊”中获得强大的自驱力,而别人不能?如果连这种我们以为能后天培养的东西都是天赋的话,究竟还有什么是可控的?
我小的时候就是就是也可以说是基本不信命,我觉得“三分天注定,七分靠打拼”这句话非常有道理,但是现在我已经 22 了,个人经历也算是比较丰富了,而且也活在这样一样国际局势动荡不安,所谓“百年未有之大变局”这样一个时代。越来越感觉很多可能会改变我一生轨迹的选择、机会都来的非常巧合,或者说都来的很“靠运气”,我也越来越觉得“尽人事听天命”可能才是大部分人的人生底色。
翁家翌提到了竞赛,也提到了信息差。在我的求学过程中,我深深地感觉到了后者的作用。我从 5 岁开始踢足球,然后某种程度上被选入了东北路小学(一个足球非常强的小学,走出了很多的国脚、职业球员),相当于是进入了职业梯队。不过后来就因为家里的原因,退出了球队,然后退出的主要原因是觉得我踢的一般,可能没什么前景,其次就是还是觉得学习才是正道。但是知道我初三,我才知道,体育特长生可以特招进高中,还可以特招进大学。我一直以为这个路径早就没有了,是 90 年代的时候或者更早时候才有的路径。所以初三的时候我又开始重新捡起足球,去跟校队训练,去练校招项目,但是从小学四年级到初三差不多快 6 年的时间,我没用再进行任何的专业训练。虽然现在想想的话,塞翁失马,焉知福祸,但一个梯队青训球员,退出之后竟然从没想过走校园足球,就真的是有点离谱的。
在我的认知里其实竞赛也有点类似了,就大部分人跟我一样,根本不知道,我是上了高中才知道可以搞竞赛拿降分,或者报送的。在翁家翌那个年代,他也会认为搞竞赛面对的压力会小一点,有点类似于捷径,其实我在某种意义上是认可的,尤其是比较早期的竞赛,现在感觉竞赛也是越来越卷(其实某种意义上反映出了竞赛的信息差被打破了)。我其实一直不认为就是竞赛生比正常学生在天赋上会强非常多,高考能裸分考上清北复交这种级别学校的人其实也都是天之骄子,很强的。但这确实是两种差别很大的路,其实适合不同的人,选择那条比较适合自己的其实才是最重要的。
不过当年那种降分力度确实夸张,完全是信息差的红利。虽然小众路线失败了会很惨,而且挺考验你的心理的,因为你跟大部分人在做的事情不太一样,但只要有点成绩,结果都极好,铜牌都能本一线上交。现在各类特招收紧,真的只有极少数顶级人才才能得到优待。
我在看这个播客的时候,有一点感觉特别神奇,就是翁家翌他这个肢体动作,给我一种很局促的感觉,就两只手有点不知道放在哪的感觉,纯题外话,就是看着有点难受。
你去看瓮家翌的人生轨迹,会觉得他这个实在是标准的“竞赛天才”成功之路,小的时候立刻方面的天赋,靠竞赛冲上清北,大一大二就进组,大三去美国实习,甚至还是三巨头 Joshua 的组。本科毕业滑铁卢了一下,只有 CMU 的硕士,但是自己搞了很多 impactful 的 open source project,水硕毕业直接进入 OpenAI。但是其实这中间也是有很多令他也感觉迷茫的时刻,比如做 RL 游戏,觉得纯是“过拟合”,没什么意义,做的很痛苦;去到 Joshua 的组,训一个类似于现在 MoE 架构的模型,两三个月没有产出,现在知道那是不可能训出来的,但当时周围同学都发了 paper,只有他没有 paper,这个 peer pressure 实话实说,我自己带入一下都感觉有点窒息,估计得天天自己开导自己。其实我想要说的是,即便是再强的人也不是所有的东西成功的,一个事情能不能成运气真的很重要。而且在学术圈混,connection 真的很重要,可能真的比你的 publication 重要,尤其是在现在这个时代,本科生顶会一堆一堆的,一作顶会都可能排不上座位。
播客里聊了很多关于评价体系的话题。他说主流评价体系没意义,我部分认同,但又觉得它有存在的合理性。分数未必代表一切,但太低了大概率能反映问题;PhD 未必比 Master 好,主要看个人规划。但是很多时候你没有太多选择,比如说想我这样的不想要在给家里添负担的,就会觉得要读一个全奖,但是现在又基本没有全奖 master,全是花钱项目,还巨贵,如果是这样的话,有 PhD offer 我就必然会去 PhD。人确实是会不由自主的会被环境影响,但是这是没办法避免的,就像今天看了这个 podcast 的人,会有我要寻找新的评价体系这个想法,其实也是受了环境的影响(这个 podcast),这个聊多了就会往宿命论的方向讨论了,我们最后在详细了。
“挣脱出固有的评价体系,找到适合自己的评价体系”,这句话其实前半句不重要,重要的是后半句。其实主要是找到那个最对你有利的评价体系,如果当前的评价体系有利于你,你就应该支持,如果不是,你就应该掀桌子,自立门户。所以其实也没有什么优劣之分了,尤其是现在这个社会评价体系说实话已经非常多元了,绩点真的没什么太大作用,跟你的托福成绩一样。但这样的一个趋势,又让哪些勤勤恳恳,真的努力学习知识的同学遭遇到了某种“不公平”。因为现在太多的课程,你完全不需要好好学,也可以拿一个 A。与此同时又会有一堆人吐槽学这个没有用,学那个没有用,在网上怼天怼地的,我完全不能认同,我认为我在美国上了这么多课,刨除掉极个别非常离谱的一两门课,其他的不管是什么课,你都能看到老师是有认真设计的,教的东西也许对找工作没用,但是并不是“一无是处”的知识。而其实也正是这种“多样化”的评价系统,导致真正愿意静下心认真学习课程内容的人变少了,大家平时都是各种找科研,做项目,投简历,准备面试,课程全是实在不行了混一下,我感觉还是挺悲哀的。
这个 podcast 还聊到了一些开源项目,像天授什么的。在聊这一块的时候谈到了一个词 consistency,我真的深有同感,我现在也算是参与了一些需要合作的项目,这个多人如何合作真的是一个非常难以解决的问题,而之所以难以解决,其根源就 consistency 这个词上,实在是太难 control 了。项目的一致性真的非常重要。根据我的个人经历,就算只有三个人都很难管理,加的 feature 越多,越 buggy,shitty,腐化会更严重,最后只能重构。
现在工程能力确实重要。Idea 一直很 cheap,难得的是“靠谱”的 idea。AI 的出现降低了好的 idea 的权重,因为你可以更低成本地实现更多想法,“瞎猫碰到死耗子”的概率变大了。关于 Master 去 Research Site,但我觉得还是挺难的,大部分人去 research site 感觉还是的 phd,想要有一个 Master 学位就去 research site 当然是可能的,但是我感觉就是纯纯看个人能力了。
“教一个 researcher 如何做好 engineering,要远比教一个 engineer 如何做好 research 来的难”,这句话其实可能也是整个 podcast 最出圈的一句话,感觉其实就是个人观点吧,事实上就是现在每个人 engineering 的能力都被 AI 大幅提升了,现在 engineering 能力最强的可能不是那些写代码最厉害的人,而是最大胆,最善于利用 AI 工具的人。
正确的参数对模型 performance 的影响确实很大,我现在深有同感,因为我之前的一个工作是在做音乐模型,这个不一样的参数,,听感确实天差地别。除了推理,训练的时候其实也是这样,找不对参数训练可能就训崩了,只能说确实是玄学。
我申请季算是刚刚过,然后之前也投过一些公司的 intern,给我的感觉确实就是,你真的需要知道你要干什么,然后你要去打探这方面的消息,然后去针对性地学习。现在在学校上的课那些,只能说少数可能用的上,大部分都没用,然后 GPA 现在大家也都没那么在意了。比如说你想要去投推理岗位,你就去看这些岗位的要求,然后你去学习这些岗位需要的知识,然后再去面试。我觉得这个招募信息上面的要求就是最 latest,最精准的。
现在 ai infra 相关的方向和岗位非常之火,尤其是工业界更是火的没边了,我的感觉就是突然一下子就火了,在我大二的时候(大概 2024 年),就想要找一个比较前沿,但是没有特别卷的方向,有一天突然就看到了 MLSys,感觉很不错啊,很适合我,结果现在 PhD 还没读呢,感觉已经全是人了。翁家翌其实很多言论都挺极端的,就是他会下一些程度词很强的判断,包括关于 infra 的问题,他的言论给我的感觉就是,大家都是乱试,谁试的快,谁的模型就好,跟什么方向,技术路线没什么关系,做算法的每天干的活就是重复性劳动。当然,感觉他对很多岗位都挺悲观的,他觉得算法会被 ai 取代,干 infra 的会紧随其后。
其实你能看到很多人批评他很傲慢,感觉很看不起人。其实我觉得我在某种意义上能理解他的这个态度。因为其实他后面他说道了,他觉得他自己在 openai 干的活也很 trivial,也不是什么需要很强的天赋才能干的活,他觉得可能随便来一个人,有跟他一样的 context,也能干的很好。其实他并不是傲慢,只是平等的觉得大家都不重要而已。我觉得他有这种想法跟他后面的坚定的宿命论想法可能是同源,因为他觉得每个人的人生其实是固定的,那你所取得的一切成功其实都是必然的,你只是拿到一个比较好的剧本而已,我觉得这何尝不是另一种心态上的平等呢。说实话,其实大家也都越来越能意识到,就是每个人都是普通人,都会出错,这个世界也都是“草台班子”,没有谁是不可替代的。
感觉每个人在年轻的时候,都会有一种自命不凡的感觉,但后来都会发现大家其实都是普通,然后就会发现环境的重要性,人脉的重要性,你认识的人不一样,接触到的信息不一样,你的人生真的会不一样。这里顺道还提到了公司的组织架构,翁家翌认为一个好的组织架构实现的就一个事情:信息流通流畅,怎么样能最高效的让大家拥有一致的 context。这一点我也是深有同感,我们就一个不到十个人的小组,真正干活的就三两个人,忙的时候都要天天开会,非常离谱。
作为一个还在 OpenAI 的员工,虽然是做 infra 的,但是还是不免要讲一下模型训练的问题。在这里翁家翌其实就也说了一下 OpenAI 的技术路线(其实大家也都早就知道的差不多了)。他在这里提到了一个大家现在其实都很关心的问题,怎么找完美的 metrics,或者说怎么做 benchmark,归根到底就一句话,怎么样客观地 measure 模型的能力。这个真的很重要,也很难,因为如果我们能有一个完美的 metrics,我们不用干别的,就想办法刷分就好了,就把 loss function 设计得往上靠就好了,想尽一切办法往上靠就行了。但问题就在于,没有一个 benchmark 是靠谱的,都只是 indicators。我现在做一个 music model,模型训练的时候的最大的问题也在于此,没有一个靠谱的 metric 来 measure 模型的 performance,最靠谱的方法仍然是人耳听,就很难搞。
关于闭源开源,他一直强调的就是 OpenAI,如果开源就会活不下去。其实我觉得这就说明了现在的竞争多激烈,就是 openai 根本没有信心如果开源了之后还能继续打赢其他人(现在闭源了其实也打不赢其他人)。而且其实他们的 slogan 也并不纯粹,他们说他们想要实现造福全人类的 AGI,理论上来讲如果是这样的话,谁来实现其实不重要,但是事实上对他们而言,由他们来实现可能才是最重要的,因为他们“不相信”别人会把这样强大的模型用到一个好的地方,只有他们才能确保强大的 AGI 真的会造福全人类。对此我只能摇摇头,笑一下,虽然我不觉得他们说这话是真心的,但是如果他们是真心的,其实反而更离谱不是吗,真的把自己当成 “the one” 了。
整个访谈最有意思的一个地方就是最后的有关宿命论的探讨,翁家翌还是一如既往的在这里下了一个非常强的判断,他就是认为世界的命运是确定的,而且它深信不疑,甚至他还说他自己验证过。其实我现在也越来越觉得其实个人无法控制人生,就我现在回过头去看一些会影响我的一生的重要选择,或者说一些人生的关键节点,我其实会发现我根本没有选择,可能也不是没有选择,而是最优的选择就那么一条。并且很多时候你都会发现,随机性在这些重要节点的占比是巨大的。高考分数上下波动 3-5 分是非常简单的,我甚至感觉上下波动 20 分都很正常。但是,就算仅仅只有 3-5 分的差别,你将来的人生基本上就完全不同了。还有很多那种机会,完全就是非常巧合的机会,但是可能彻底改变你的人生轨迹。虽然我感觉你的人生很大程度上,运气占了很大的一部分权重,所以你的主观能动性既重要也不重要,但是我还是不太信宿命论的,不过“尽人事,听天命”而已。宿命论这个观点是无法证伪的,但是无法证伪,就相当于事实吗?阴谋论的最大特征就是没法证伪。
但不管你怎么看待这个世界,你总是要继续生活的,尤其是现在这个时代吧,peer pressure 我感觉真的是很大,你总能看到居多的离谱新闻,什么高中生顶会一作之类的。总之呢,我觉得还是看开一点吧,不管怎么样,你总是要对明天有信心嘛。