徐慧志的个人博客
2021年12月28日

2021-12-28 重新学习深度学习的感想

发布于 2021年12月28日  •  3 分钟  • 1082 字
Table of contents

重新学习深度学习的感想

由于项目上我们需要用深度学习的模型来完成一个功能,于是最近两周我又复习了下深度学习的知识。

学习机器学习的课程是17/18年的事情,当时上这门课让我非常suffer。一方面,机器学习代表着高大上的人工智能,让人忍不住探索它为什么这么神奇,于是我花了很多时间去搞懂机器学习到底是在干嘛,AI又是怎么一回事。另一方面,真的非常痛苦。上课时教授轻飘飘的几句话,背后是及其复杂的数学原理和计算,记得这门课的参考书是Pattern Classification,第二章朴素贝叶斯我看了一个月才看懂。而且作业超级多,占分数比又很重,每个周末都和小伙伴在TEL楼写作业写到深夜。

机器学习课程完成之后,我又在Coursera上面做完了吴恩达的那个著名的Deep Learning课程,不过也只是大概有了一个了解,不知道为什么模型能够把图片的特征学会。

总之,我没学懂,也不知道有什么用,苦苦挣扎上完AI相关的几门课,做完毕设,只觉得解脱了,想着再也不想用和概率统计打交道了。

这次重新学习,感受反而不一样了。

首先,觉得现在的AI中文环境真的太好了(也是因为太卷了),基本上涉及AI的所有方面都有人写博文/教程给读者看。

例如这个网站https://zh-v2.d2l.ai/index.html,里面有原理,有三种框架的写法,下面还有讨论。

其次,对机器学习的幻想已经破裂了。这几年AI的发展,和16/17那时候没什么大的进步。以前存在的问题现在还是存在。例如依赖太多标注的数据,泛化能力差,可解释性不强。总的来说,大家都知道AI指望不上了。

再次,我有实际的问题需要解决。所以没有过多看原理,而是直接拿模型用。

既然是工程上的探索,也就是说,没有什么把握,也不知道做不做的出来,也不知道效果符不符合要求。

做工程最重要的先让程序跑起来。

于是,我开始准备了一个很小的数据集。太菜了,做图像标注,搞清楚模型的组成就用了一周。

第二周,领导问我进度,给我推荐了另一个模型。

这次要面对的问题,首先是要弄清楚用回归还是分类做。回归指“在什么程度上是A”,分类解决“是A还是B”。

其次是考虑用文本分类还是图像分类。

再其次是如何标注数据。什么样的数据是有效的。

由于我处理的是文档,所以要么把文本取出来,要么把文档转为图像。这又涉及到特征工程的处理。

还要面临数据不够的情况。

最后这两周,跑的两个模型,一个还可以,一个是负相关。

搜集数据、标注数据、清洗数据、训练模型(包括调参)、部署模型,整个过程枯燥、繁复的嘞。

深度学习比机器学习优秀的地方在于自己不用费尽心思去找特征工程,神经网络自己会学习。

Sein heißt werden, leben heißt lernen.

Der einfache Weg is immer verkehrt.