关灯 特大 直达底部
亲,双击屏幕即可自动滚动
正文 第634章 给学术圈一点小小的北邮震撼



但直接这么做,预测精度必然会存在误差,成绩会差一些。



原因很简单,模型最终输出的是五千个选项的概率。



在面对这五万张只有一千种标准答案的验证图片时,通用模型依然会按照五千个类别的范围去预测。



一旦它把图片分类成了比赛规定的一千个类别之外的选项,按照赛制就会被判定为错误。



它还需要时间去针对这一千个特定的类别重新训练,才能做到精准得分。



楚一航没管那么多,直接在终端里输入调用tensorflow框架的命令。



回车键敲下。



隔壁机房的散热风扇转速瞬间飙升,噪音穿透了玻璃门。



屏幕上开始滚动运行日志。



钟柏盯着显存占用率的监控面板。



“集群的显存占用直接拉满了。”



“九章平台对amd显卡的调度策略真够暴力的。”



叶言看着进度条。



“处理五万张图片,传统算法少说得跑个两三天。”



“我看这进度,估计一顿饭的功夫就能出结果。”



楚一航往后靠在椅背上。



“这就叫算力碾压。”



十分钟过去。



终端屏幕上的滚动日志停了下来。



最后一行输出了一串统计数据。



钟柏揉了揉眼睛,指着屏幕上的数字。



“我是不是看花眼了?”



叶言凑过去,一个字符一个字符地念出来。



“top-1准确率:40.2%。”



“top-5准确率:80.5%。”



楚一航保持着靠在椅背上的姿势,摸下巴的手停住了。



郭长征立刻推开钟柏,自己握住鼠标,点开测试代码的日志文件。



他快速检查着数据加载流程和对比逻辑。



“没有发生数据泄露。”



“这个模型的训练集里,不包含这些验证集的数据。”



郭长征得出结论。



“代码没问题,这确实是我们那个通用模型在全新验证集上跑出的真实成绩。”



钟柏倒吸了一口凉气。



“这还只是我们用通用数据训练的基础模型啊。”



“还没专门针对imag的一千个分类做重新训练呢。”



叶言迅速在脑海里计算着行业平均水平。



“目前用传统的sift特征提取加上支持向量机算法。”



“在这类复杂图片识别任务上,最高正确率也就只能做到20%到25%。”



楚一航站起身来,看着屏幕。



“20%对40%。”



“这不是同台竞技,这是直接把桌子掀了。”



钟柏激动得满脸通红,直接点开浏览器上imag的官网。



“现在排行榜上还是空的,一个队伍都没上传。”



“楚哥,咱们赶紧把这个测试集的预测结果跑出来,直接上传一波。”



“先拿个40%的成绩挂在榜首。”



“给全世界的学术圈一点小小的北邮震撼。”



“不行,不能传。”郭老师却是摇了摇头。



钟柏满脸写着问号,手悬在鼠标上。



“为什么啊郭老师?这么高的分数,传上去绝对能霸榜个把月。”



郭长征指着打印下来的比赛规则说

本章未完,点击下一页继续阅读

(2/3)
  • 加入收藏
  • 友情链接