第41章 未来模型的大与小
“孟同学就完全不考虑加入白度吗?”李彦弘表情波动了一刹那,但几乎微不可查,“我想我应该是现在全华国最重视AI技术的CEO,我们白度也是全华国目前投入最大的公司。”</p>
“你已经有了心仪的去处?还是说,你对条件有很高的要求?具体的情况我们可以再谈嘛,直接跳过这个环节,是否太草率了一点。”李彦弘此时求才的心还是很诚的。</p>
“我倒是没有任何怀疑李总诚意或者财力的意思,我听阿里克斯说李总去年出价的力度绝对是冠绝全场的。”这其实是虚张声势了,阿里克斯自然不会对外人说这种细节,不过在李彦弘听来,这么一个细节绝对大大增加了话语的可信度。</p>
“虽然没有提到比较具体的细节,但他说如果不是辛顿老师的背伤,其实他们很希望加入白度。”这个其实是后来辛顿自己访谈中透露的,孟繁岐使用了两个细节,显得自己已经和辛顿团队非常熟悉,争夺到了一定的主动权。</p>
“你已经和谷歌大脑的人联系上了?”李彦弘想起去年竞价的事情,还是一肚子气,这件事真是晦气。</p>
原本白度最早提出的千万美金已经几乎打动辛顿了,教了一辈子书的辛顿哪里见过这么多钱,当即口头表示了意向。</p>
结果在正式签署敲定之前,他那两个学生拦住了自己的导师,出了個主意,三人成立了一家空壳公司,让科技巨头来竞价,以收购的方式雇佣。</p>
这一来一去,时间一耽误,就给了谷歌操作的时间和空间。</p>
最后的竞价上,李彦弘明明没有输,只是对方三人心向谷歌。见谷歌出价已经高过自己的心理价位,就直接敲定了结果。</p>
这么办事情,还竞价什么,直接跟谷歌去谈呗?</p>
虽然表面上白度的表现在那次事件中一直很体面,但李彦弘心里还是有些不爽的。</p>
当初谷歌拿下辛顿团队是近水楼台先得月,如今燕京出了一个不得了的本科生,学校还就在他白度的总部旁边。</p>
李彦弘觉得这是时来运转,天道有轮回。</p>
加拿大离你美国近,燕京离你美国还近吗?</p>
因此李彦弘今天驱车前来会面,心情还是不错的。</p>
却没有想到,还没聊几句,竟然情况和走势又要和去年一样了。</p>
“谷歌大脑确实已经给我发了意向书,条件相当优厚。”孟繁岐坦然相告,“实不相瞒,我基本上已经决意加入,因此先前说跳过招聘的部分,也是为了节约李总的时间。”</p>
“孟同学,不管谷歌究竟给你开出什么条件,你都可以拿他们的合同直接来白度就职。”李彦弘回想去年的情况,也不来回竞价了,直接就给了一个封顶的条件。</p>
“不论你能和谷歌谈到什么价位,我都多出百分之20。”李彦弘表情沉重,一字一句道。</p>
去年为了辛顿团队4000多万美金愣是没能拿下,今年这个本科生,谷歌怎么也不可能出更高的价格。</p>
李彦弘虽然嘴上说不论多少,其实还是有一个心理的底线,只要不超过他去年的开价,他都可以接受。</p>try{ggauto();} catch(ex){}
孟繁岐听了心里暗笑,若是真有魄力,就别管别人出价多少,直接报出个价位来才叫自信。</p>
还得拿别的offer过来才能要价,怎么听都感觉有点缺乏定价能力的味道。</p>
值得多少,自己竟然没数吗?还需要看别人的出价。</p>
不过孟繁岐既然不打算加入,便也没有多想这件事。</p>
“李总,钱的事情当然很重要,但也不能说是全部。我和谷歌也没有完全谈完价格,目前他们给我开出的价格大概是千来万美金。”</p>
“我还有许多其他在意的因素,比如说学业,您可能也知道我休学了,但一直休着也不是个办法,我总得找个斯坦福这样的大学读读书吧。”</p>
“当然了,这些其实都是我个人的事情,算是小事。更重要的事情是,华国目前的情况和氛围,是否真的适合最前沿的AI技术发展。”</p>
孟繁岐虽有重生的优势,但有一位长者说得好。</p>
人呐,就不知道,自己不可以预料。</p>
一个人的命运啊,当然要靠自我奋斗,但是也要考虑到历史的进程。</p>
“华国的氛围是否适合最前沿的AI技术发展?此话怎讲?”李彦弘如今也是走在开拓道路上,这件事情自然是他非常关心的事情。</p>
“李总是这个时候唯一愿意亲自出马来找我的人,我便也掏心掏肺跟您说几句心里话。”孟繁岐回顾了一下AI整体的发展脉络,如此说道,“AlexNet和我的DreamNet现在彻底打开了深度学习的大门,可以预见,在短时期内,各个方向和领域的AI模型性能将会有一个巨大的突破。”</p>
“不错,如今正是比拼时速的时候,一步快,则步步快。”李彦弘点头称是,肯定了这个前提。</p>
“技术上的指标是一回事,从总体的趋势上来看,如果想要真的把AI的技术落地,让人们都可以使用,无非就是把模型做大或者做小。”</p>
“做大或者做小...?你是指终端还是云端两种发展的方向?”李彦弘很快跟上了孟繁岐的思路。</p>
“没错,学术研究的时候起初不会过多关注模型的参数量大小,和它的计算损耗。但实际投入使用的时候,则会必然分出极致优化缩减的小模型,和强调性能开放接口给人使用的云端大模型。”</p>
“在早期的时候,可能会反复魔改和调整模型的结构和设计,让模型尽可能快,尽可能好。但久而久之,随着数据的积累,筛选,更高质量的标注,以及最重要的,更大的模型参数量。”</p>
“规模极其庞大的模型,会在某一个临界点彻底产生质变,让绝大部分小模型失去价值。尤其是以语言语音类,和图像生成类模型。它们的使用体验是无法向下的。”</p>
孟繁岐回想起重生前,李总面对ChatGPT(3.5版本)和GPT-4,强行顶住压力提早推出的大模型文心一言,不得不在心中叹了口气。</p>
其实文心一言并不是一无是处,只是这种与人交互的智能模型,如果相形见绌,就会显得特别不堪一击。</p></div>
“你已经有了心仪的去处?还是说,你对条件有很高的要求?具体的情况我们可以再谈嘛,直接跳过这个环节,是否太草率了一点。”李彦弘此时求才的心还是很诚的。</p>
“我倒是没有任何怀疑李总诚意或者财力的意思,我听阿里克斯说李总去年出价的力度绝对是冠绝全场的。”这其实是虚张声势了,阿里克斯自然不会对外人说这种细节,不过在李彦弘听来,这么一个细节绝对大大增加了话语的可信度。</p>
“虽然没有提到比较具体的细节,但他说如果不是辛顿老师的背伤,其实他们很希望加入白度。”这个其实是后来辛顿自己访谈中透露的,孟繁岐使用了两个细节,显得自己已经和辛顿团队非常熟悉,争夺到了一定的主动权。</p>
“你已经和谷歌大脑的人联系上了?”李彦弘想起去年竞价的事情,还是一肚子气,这件事真是晦气。</p>
原本白度最早提出的千万美金已经几乎打动辛顿了,教了一辈子书的辛顿哪里见过这么多钱,当即口头表示了意向。</p>
结果在正式签署敲定之前,他那两个学生拦住了自己的导师,出了個主意,三人成立了一家空壳公司,让科技巨头来竞价,以收购的方式雇佣。</p>
这一来一去,时间一耽误,就给了谷歌操作的时间和空间。</p>
最后的竞价上,李彦弘明明没有输,只是对方三人心向谷歌。见谷歌出价已经高过自己的心理价位,就直接敲定了结果。</p>
这么办事情,还竞价什么,直接跟谷歌去谈呗?</p>
虽然表面上白度的表现在那次事件中一直很体面,但李彦弘心里还是有些不爽的。</p>
当初谷歌拿下辛顿团队是近水楼台先得月,如今燕京出了一个不得了的本科生,学校还就在他白度的总部旁边。</p>
李彦弘觉得这是时来运转,天道有轮回。</p>
加拿大离你美国近,燕京离你美国还近吗?</p>
因此李彦弘今天驱车前来会面,心情还是不错的。</p>
却没有想到,还没聊几句,竟然情况和走势又要和去年一样了。</p>
“谷歌大脑确实已经给我发了意向书,条件相当优厚。”孟繁岐坦然相告,“实不相瞒,我基本上已经决意加入,因此先前说跳过招聘的部分,也是为了节约李总的时间。”</p>
“孟同学,不管谷歌究竟给你开出什么条件,你都可以拿他们的合同直接来白度就职。”李彦弘回想去年的情况,也不来回竞价了,直接就给了一个封顶的条件。</p>
“不论你能和谷歌谈到什么价位,我都多出百分之20。”李彦弘表情沉重,一字一句道。</p>
去年为了辛顿团队4000多万美金愣是没能拿下,今年这个本科生,谷歌怎么也不可能出更高的价格。</p>
李彦弘虽然嘴上说不论多少,其实还是有一个心理的底线,只要不超过他去年的开价,他都可以接受。</p>try{ggauto();} catch(ex){}
孟繁岐听了心里暗笑,若是真有魄力,就别管别人出价多少,直接报出个价位来才叫自信。</p>
还得拿别的offer过来才能要价,怎么听都感觉有点缺乏定价能力的味道。</p>
值得多少,自己竟然没数吗?还需要看别人的出价。</p>
不过孟繁岐既然不打算加入,便也没有多想这件事。</p>
“李总,钱的事情当然很重要,但也不能说是全部。我和谷歌也没有完全谈完价格,目前他们给我开出的价格大概是千来万美金。”</p>
“我还有许多其他在意的因素,比如说学业,您可能也知道我休学了,但一直休着也不是个办法,我总得找个斯坦福这样的大学读读书吧。”</p>
“当然了,这些其实都是我个人的事情,算是小事。更重要的事情是,华国目前的情况和氛围,是否真的适合最前沿的AI技术发展。”</p>
孟繁岐虽有重生的优势,但有一位长者说得好。</p>
人呐,就不知道,自己不可以预料。</p>
一个人的命运啊,当然要靠自我奋斗,但是也要考虑到历史的进程。</p>
“华国的氛围是否适合最前沿的AI技术发展?此话怎讲?”李彦弘如今也是走在开拓道路上,这件事情自然是他非常关心的事情。</p>
“李总是这个时候唯一愿意亲自出马来找我的人,我便也掏心掏肺跟您说几句心里话。”孟繁岐回顾了一下AI整体的发展脉络,如此说道,“AlexNet和我的DreamNet现在彻底打开了深度学习的大门,可以预见,在短时期内,各个方向和领域的AI模型性能将会有一个巨大的突破。”</p>
“不错,如今正是比拼时速的时候,一步快,则步步快。”李彦弘点头称是,肯定了这个前提。</p>
“技术上的指标是一回事,从总体的趋势上来看,如果想要真的把AI的技术落地,让人们都可以使用,无非就是把模型做大或者做小。”</p>
“做大或者做小...?你是指终端还是云端两种发展的方向?”李彦弘很快跟上了孟繁岐的思路。</p>
“没错,学术研究的时候起初不会过多关注模型的参数量大小,和它的计算损耗。但实际投入使用的时候,则会必然分出极致优化缩减的小模型,和强调性能开放接口给人使用的云端大模型。”</p>
“在早期的时候,可能会反复魔改和调整模型的结构和设计,让模型尽可能快,尽可能好。但久而久之,随着数据的积累,筛选,更高质量的标注,以及最重要的,更大的模型参数量。”</p>
“规模极其庞大的模型,会在某一个临界点彻底产生质变,让绝大部分小模型失去价值。尤其是以语言语音类,和图像生成类模型。它们的使用体验是无法向下的。”</p>
孟繁岐回想起重生前,李总面对ChatGPT(3.5版本)和GPT-4,强行顶住压力提早推出的大模型文心一言,不得不在心中叹了口气。</p>
其实文心一言并不是一无是处,只是这种与人交互的智能模型,如果相形见绌,就会显得特别不堪一击。</p></div>