首先上来必不可能去啃那几本书(花书,西瓜书之类的),因为不是数学专业且没有极大的动力是学不下去的,大多是数学公式的推导过程。
类似这个书,其实把基本的矩阵和概率知识弄明白就行了,后面就是实践了(借助知乎高赞回答)
这是一门要实践的知识,理论再精美,不work没有用。
1. 首先最应该做的是把最基本的向量和矩阵运算与numpy和pytorch的操作对应起来,并熟练掌握。你问具体是哪些,就是线性代数的内容。
2,其次就是各种维度变换操作:升维,降维,变形,维度交换这有专门的库einops。当然torch原生操作也必须熟练。
3. 然后就是神经网络的经典模块,全链接,卷积,池化,rnn,注意力等,看李沐大神的B站视频
4. 然后你就可以看论文,或者看理论《花书》,对着别人源码来复现。
5. 由于这几年的发展,深度学习的理论涉及的数学越来越广泛,机器学习的经典方法还是要学习一遍的。三大经典书籍可以看看mlapp,prml,esl。对于初学者这里面的任何一本你翻开,估计都要头大,我只能说慢慢啃。想要顺畅的看懂,你需要熟练掌握矩阵微分与求导。涉及的数学也是很广泛的,你要抑制一下好奇心,不然你都想搞透,每看一页都要付出很大的代价。
6. 其次就是诸如涉及高维的数学:微分几何,还有随机分析,ode,ped,动力系统,
做完123基本可以入门,搞定45基本理论可以做的比较扎实,但是45没人带,自学估计要比较长时间。6就看你基本功了,数学学好这些都无所谓。尽管实现自己idea就可以了。