第54章 实拍实测
“这特么根本不可能啊..”余恺还是不能理解这个恐怖的速度提升,“你这里应该是使用了自己新提出的DreamNet吧?”</p>
“是的,我提出的残差网络对性能的提升有非常大的帮助,这种帮助是具有普适性的。并不是只有分类任务,在检测分割还有其他类型的任务上,都有非常强力的性能提升。”</p>
“但如果想要做到这个运行速度,你实际上也没法使用你论文中提到的,50层,100层吧?”</p>
“那是当然,对于快速检测算法来说,没有必要使用过于深的网络结构。18层或者34层的版本就已经足以负担大多数需求了。”</p>
“不对,这不可能。”余恺拿出李彦弘带回的DreamNet论文复印件,仔细验算了一遍DreamNet18层和34层的参数量。</p>
“对于这个参数量的网络来说,你最多也只能做到每秒3-5张图片才对。”余恺算来算去,还是根本对不上结果。</p>
孟繁岐本想解释一番,说巨额的速度提升来自于检测端的创新突破,而不是骨干网络。</p>
YOLO方法不做滑动窗口,也不去提出可选区域,而是直接对整个图片做回归。</p>
这样的做法泛化性能很好,对不同类型不同场景的图片性能波动不大,但是在比较精细的事情上稍有欠缺,比如较小物体的检测和绝对位置。</p>
但刚一想开口,又觉得不大保险。</p>
眼前的两位技术负责人都是高手中的高手,自己言多必失,若是点醒了别人,那可就大事不好了。</p>
“具体的结果已经展示给几位了,算法的细节和原理,现在这个阶段肯定是不方便和几位细聊的。”孟繁岐微笑应道,“如果你算出来不可能,说明你的前提就错了。”</p>
“对我個人来说的话,其实这个成绩还有很大的优化空间的,只是我目前的主要兴趣并不在这个方向上。”</p>
听听,这说的是人话么!</p>
汪海峰刚想说点什么,闻言一时语塞,当场噎住。</p>
他这两年检测算法搞了不少,距离这个结果还有十万八千里呢,结果眼前这人说得这叫什么话?</p>
目前对这个方向不是那么感兴趣?那你倒是怎么在提升检测精确度的同时还给他加速了一百多倍的?</p>
随便写了点是吧?气不气人呐?</p>
“你后续会负责继续对这个系列算法进行优化吗?”李彦弘非常关注这件事,如果孟繁岐答应持续优化升级这个系列,其实就会起到一个类似招聘的效果。</p>
“那这个就要看我们合同具体怎么签了。”孟繁岐打起了太极,合同没看到,这种事情自然不好说。</p>
李彦弘靠在椅背上,左手扶着下巴,开始了沉思。</p>
孟繁岐不怀疑李彦弘在AI方向的投入力度,从2013-2023的这十年,李彦弘累计投入了超过千亿在AI方向上,平均下来每年都有上百亿。</p>
即便从每年的经费里面匀出来百分之一,也都够自己吃得饱饱的了。</p>
“我们自己这边也有一些图片数据,方便挪过来做一下推理吗?”汪海峰问道。</p>try{ggauto();} catch(ex){}
“没问题,都可以的。”孟繁岐听了这句话,顿时警惕了起来。一般来说,要求算法直接在自己的数据上推理听起来很正常,但实际上是不大合理的事情。</p>
数据不同,图片里的种类很可能完全不是一个东西,自然也就无法检测。</p>
需要对应的训练数据来微调一下模型,才比较合理。</p>
结合前面两位技术人员的质疑态度,孟繁岐开始怀疑,今天突然被叫到这里来,是不是因为有人根本不相信自己的结果。</p>
虽然有点不爽,但倒也可以理解吧。</p>
孟繁岐从自己的包中直接掏出了一个外接摄像头,“或者直接接一个摄像头也可以,我们就不花那个力气挪动数据了。”</p>
电脑直接插U盘是有一定风险的,这也是为什么后来许多大厂的主机根本不允许员工或者其他人员外接任何设备。</p>
白度两位技术人员的多次质疑,让孟繁岐的回应也变得谨慎了起来。</p>
之前和李彦弘的沟通太过顺利,导致自己先前的心态有些儿戏了,对待这种重大的交易,还是需要更加谨慎一些。</p>
“你已经提前做了相关的测试,添加了接口吗?”余恺这下心里完全没底了。</p>
外接一个摄像头是最直接粗暴的做法,所有人都可以实时地看到检测算法在摄像头所拍内容上的效果。</p>
这个东西想要作假,几乎不可能了。</p>
刚才自己眼神示意汪海峰提出用白度自己的数据测试,其实潜台词无非就是,孟繁岐可能提前使用这部分测试数据在自己的模型上进行了微调。</p>
说白了就是作弊,让模型先学习过了这些即将用作测试的数据。看完了参考答案再答题,分数自然可以突飞猛进。</p>
而外接一个摄像头实拍实测,就相当于第三方考官现场出题,压根就没有了作弊的机会。</p>
由于之前已经做过测试和适配,孟繁岐没有花费多久就接上了摄像头,并开始运行自己的算法。</p>
举着摄像头对准了白度的三位高层,电脑屏幕的图像上很快就被算法框选出了人物,桌,椅,电脑等元素的位置和类别。</p>
孟繁岐故意晃动了一下摄像头,所有的选框都几乎紧贴着目标物体,丝滑地跟随。完全没有现在检测算法最大的弊病,检测框追不上人的现象。</p>
孟繁岐又举着摄像头四处拍摄了一番,对比较常见的物体,书本,水杯等物体的识别都没有看出什么问题。</p>
此时此刻,即便再想不明白,两位技术负责人还是唯物的,相信科学的。</p>
余恺深深地出了吐了一口气,“这是一个非常恐怖的突破啊....”</p>
“不知道从互联网巨头的管理视角来看,这个‘恐怖的突破’是怎样的价值呢?”</p>
实话实说,孟繁岐还真不清楚这件事。他知道这些技术的细节和突破的力度。</p>
但时间线稍微一提前,这个东西在白度这样的互联网巨头里能换来多大的价值,缺少高层管理经验的孟繁岐是很不好估算的。</p></div>
“是的,我提出的残差网络对性能的提升有非常大的帮助,这种帮助是具有普适性的。并不是只有分类任务,在检测分割还有其他类型的任务上,都有非常强力的性能提升。”</p>
“但如果想要做到这个运行速度,你实际上也没法使用你论文中提到的,50层,100层吧?”</p>
“那是当然,对于快速检测算法来说,没有必要使用过于深的网络结构。18层或者34层的版本就已经足以负担大多数需求了。”</p>
“不对,这不可能。”余恺拿出李彦弘带回的DreamNet论文复印件,仔细验算了一遍DreamNet18层和34层的参数量。</p>
“对于这个参数量的网络来说,你最多也只能做到每秒3-5张图片才对。”余恺算来算去,还是根本对不上结果。</p>
孟繁岐本想解释一番,说巨额的速度提升来自于检测端的创新突破,而不是骨干网络。</p>
YOLO方法不做滑动窗口,也不去提出可选区域,而是直接对整个图片做回归。</p>
这样的做法泛化性能很好,对不同类型不同场景的图片性能波动不大,但是在比较精细的事情上稍有欠缺,比如较小物体的检测和绝对位置。</p>
但刚一想开口,又觉得不大保险。</p>
眼前的两位技术负责人都是高手中的高手,自己言多必失,若是点醒了别人,那可就大事不好了。</p>
“具体的结果已经展示给几位了,算法的细节和原理,现在这个阶段肯定是不方便和几位细聊的。”孟繁岐微笑应道,“如果你算出来不可能,说明你的前提就错了。”</p>
“对我個人来说的话,其实这个成绩还有很大的优化空间的,只是我目前的主要兴趣并不在这个方向上。”</p>
听听,这说的是人话么!</p>
汪海峰刚想说点什么,闻言一时语塞,当场噎住。</p>
他这两年检测算法搞了不少,距离这个结果还有十万八千里呢,结果眼前这人说得这叫什么话?</p>
目前对这个方向不是那么感兴趣?那你倒是怎么在提升检测精确度的同时还给他加速了一百多倍的?</p>
随便写了点是吧?气不气人呐?</p>
“你后续会负责继续对这个系列算法进行优化吗?”李彦弘非常关注这件事,如果孟繁岐答应持续优化升级这个系列,其实就会起到一个类似招聘的效果。</p>
“那这个就要看我们合同具体怎么签了。”孟繁岐打起了太极,合同没看到,这种事情自然不好说。</p>
李彦弘靠在椅背上,左手扶着下巴,开始了沉思。</p>
孟繁岐不怀疑李彦弘在AI方向的投入力度,从2013-2023的这十年,李彦弘累计投入了超过千亿在AI方向上,平均下来每年都有上百亿。</p>
即便从每年的经费里面匀出来百分之一,也都够自己吃得饱饱的了。</p>
“我们自己这边也有一些图片数据,方便挪过来做一下推理吗?”汪海峰问道。</p>try{ggauto();} catch(ex){}
“没问题,都可以的。”孟繁岐听了这句话,顿时警惕了起来。一般来说,要求算法直接在自己的数据上推理听起来很正常,但实际上是不大合理的事情。</p>
数据不同,图片里的种类很可能完全不是一个东西,自然也就无法检测。</p>
需要对应的训练数据来微调一下模型,才比较合理。</p>
结合前面两位技术人员的质疑态度,孟繁岐开始怀疑,今天突然被叫到这里来,是不是因为有人根本不相信自己的结果。</p>
虽然有点不爽,但倒也可以理解吧。</p>
孟繁岐从自己的包中直接掏出了一个外接摄像头,“或者直接接一个摄像头也可以,我们就不花那个力气挪动数据了。”</p>
电脑直接插U盘是有一定风险的,这也是为什么后来许多大厂的主机根本不允许员工或者其他人员外接任何设备。</p>
白度两位技术人员的多次质疑,让孟繁岐的回应也变得谨慎了起来。</p>
之前和李彦弘的沟通太过顺利,导致自己先前的心态有些儿戏了,对待这种重大的交易,还是需要更加谨慎一些。</p>
“你已经提前做了相关的测试,添加了接口吗?”余恺这下心里完全没底了。</p>
外接一个摄像头是最直接粗暴的做法,所有人都可以实时地看到检测算法在摄像头所拍内容上的效果。</p>
这个东西想要作假,几乎不可能了。</p>
刚才自己眼神示意汪海峰提出用白度自己的数据测试,其实潜台词无非就是,孟繁岐可能提前使用这部分测试数据在自己的模型上进行了微调。</p>
说白了就是作弊,让模型先学习过了这些即将用作测试的数据。看完了参考答案再答题,分数自然可以突飞猛进。</p>
而外接一个摄像头实拍实测,就相当于第三方考官现场出题,压根就没有了作弊的机会。</p>
由于之前已经做过测试和适配,孟繁岐没有花费多久就接上了摄像头,并开始运行自己的算法。</p>
举着摄像头对准了白度的三位高层,电脑屏幕的图像上很快就被算法框选出了人物,桌,椅,电脑等元素的位置和类别。</p>
孟繁岐故意晃动了一下摄像头,所有的选框都几乎紧贴着目标物体,丝滑地跟随。完全没有现在检测算法最大的弊病,检测框追不上人的现象。</p>
孟繁岐又举着摄像头四处拍摄了一番,对比较常见的物体,书本,水杯等物体的识别都没有看出什么问题。</p>
此时此刻,即便再想不明白,两位技术负责人还是唯物的,相信科学的。</p>
余恺深深地出了吐了一口气,“这是一个非常恐怖的突破啊....”</p>
“不知道从互联网巨头的管理视角来看,这个‘恐怖的突破’是怎样的价值呢?”</p>
实话实说,孟繁岐还真不清楚这件事。他知道这些技术的细节和突破的力度。</p>
但时间线稍微一提前,这个东西在白度这样的互联网巨头里能换来多大的价值,缺少高层管理经验的孟繁岐是很不好估算的。</p></div>