这篇文章源于读了《深度学习入门-基于Python的理论与实现》这本书。之所以读这本书,是因为今年给自己定下来的目标:技术视角广度的延伸之一是机器学习命题。为什么定这个目标呢,直接源于两个主要的影响。

  • 早几个月逛一亩三分地,看到地里讨论的目前硅谷程序员的技术栈,后端(Server Side)基本是标配ML(机器学习/深度学习)的

  • 在推上关注的一个独立开发者(ServerCat的作者),本职是个iOS客户端开发,却成功通过在产品中集成机器学习的能力,做出了非常优秀的作品:熊猫吃短信-基于文本特征的垃圾短信过滤 & DAMA-基于深度学习自动打码图片敏感信息

这两点给我带来非常大的触动,让我感受到机器学习的巨大威力和社区印象力。

其实早在2017年,我就试图入门过机器学习,当时还在jizhi社区(jizhi.im)上购买了相关的课程:

当时我还在公司组织大家一起学习,做了一个王者荣耀手游英雄的简易分类器:

为什么最终还是没持续学习呢?

我觉得最主要的原因,就是一直没有合适的教材,当年的机器学习的学习资料,充斥着非常复杂的推导公式和数据理论,实在是令人望而却步。

《深度学习入门》这本书,说来也是一个契机,恰好也是上面提到的那位iOS开发同学推荐的。11月13日EDG决赛夺冠那天,约了好友一起观赛,带着在地铁上打发时间用的,没想到读了一部分后就被吸引了。

这本书没有那么多的公式,推导更多是直观的,感性的,显然作者不是为了追求或严谨或高深的对一门技术的显摆,而是娓娓道来,恨不得再浅显易懂一些。

根据深度学习的可视化相关的研究,随着层次加深,提取的信息(正确地讲,是反映强烈的神经元)也越来越抽象。

如果堆叠了多层卷积层,则随着层次加深,提取的信息 也愈加复杂、抽象,这是深度学习中很有意思的一个地方。最开始的层对简 单的边缘有响应,接下来的层对纹理有响应,再后面的层对更加复杂的物体 部件有响应。也就是说,随着层次加深,神经元从简单的形状向“高级”信息 变化。换句话说,就像我们理解东西的“含义”一样,响应的对象在逐渐变化。

这里的描述彻底打动了我,尽管机器学习的理论非常复杂,数学求证非常晦涩,但是它现在呈现出的形态是多么自然,多么符合直觉。

想起来摆在案头的吴军的《数学之美》,还有同样读了到开头的《素数之恋》,他们都想传达出来的,都是一种纯粹和自然的美感,这些恐怕都是饱经应试教育洗礼的我,迟迟无法体会到的。

相见恨晚,为时未晚,得把上面两本书再放进阅读日程了。