关灯 特大 直达底部
亲,双击屏幕即可自动滚动
正文 第656章 专访(上)


“有一天我爸下班回家,他在饭桌上跟我聊起了iage比赛。他说现在的计算机视觉正在经历一场变革,让我有兴趣可以去了解一下。”



苏晚晴适时地引导。



“所以是爸爸的鼓励让你迈出了第一步?”



顾超凡点头。



“对。我爸是搞底层架构开发的,他经常跟我念叨一些技术名词。他在指导和点拨我的时候,给我推荐了盛夏科技开源的tensorflow框架。”



“他说这个东西能让我少走很多弯路。”



苏晚晴看着提纲上的问题。



“很多研究人员都觉得深度学习的门槛非常高,需要极强的数学功底和复杂的算法设计能力。你作为一个高中生,在面对这些庞杂的知识时,觉得困难吗?”



顾超凡放松了许多,谈到技术,他的话匣子被打开了。



“如果是以前,那肯定难如登天。我连大学的微积分和线性代数都没学过,怎么可能去手写那些复杂的反向传播算法和矩阵运算代码?”



他用手比划了一个方块的形状。



“但是我用了tensorflow之后,发现事情完全变了。这感觉就像是在搭乐高积木。”



苏晚晴挑起眉毛,表现出很感兴趣的样子。



“搭乐高?这个说法很有意思,能具体解释一下吗?”



顾超凡坐直了身子。



“你看,乐高玩具的每一个模块,不管它是长条的、方形的还是圆形的,它的接口都是标准化的。我不需要知道这个塑料是怎么倒模出来的,我也不需要知道它的材料成分是什么。我只需要知道,我把这个模块插到那个模块上,它就能拼出一面墙,或者一辆车。”



顾超凡越说越兴奋。



“tensorflow给我的感觉就是一盒超级强大的数字乐高。它把那些最复杂、最难懂的底层数学运算全都打包封装好了。我只需要调用它的api接口。”



他用双手在空中模拟着连接的动作。



“我要加一个卷积层,啪,调用一个模块;我要加一个池化层,啪,再加一个模块。这帮我屏蔽了所有的底层复杂性。”



“而且每一个模块应该怎么样使用,在什么样的情况下使用,官方的文档里面,都给了比较详细的示例代码和教程。”



苏晚晴看着他专注的表情,继续发问。



“也就是说,你并不需要理解每一行底层代码的逻辑,也能完成顶尖模型的训练?”



顾超凡非常坦诚地点头。



“是的。外网那些大牛管这个叫深度学习前沿研究。我倒感觉这种操作像是‘炼丹’。”



苏晚晴笑了出声。



“炼丹?为什么这么叫?”



顾超凡也跟着笑了起来。



“因为很多时候,我也不完全确定为什么加了这一层,准确率就会提升。”



“我就是在框架里不断地调整参数。”



“改一改学习率,调一调批次大小,然后把数据喂进去跑。”



“就像古代道士把药材扔进炼丹炉里,看看最后能炼出个什么东西来。”



他收起笑容,语气变得认真。



“但是,能够让我这样不断试错、不断‘炼丹’的前提,是这个丹炉必须足够好用。”



“tensorflow帮我处理了显存分配、跨硬件调用这些最麻烦的事情。如果让我自己去写cuda代码来调度gpu,我估计写三年都写不出一个能跑的deo。”
(2/2)
  • 加入收藏
  • 友情链接