data:image/s3,"s3://crabby-images/0b2c7/0b2c7f9a5624fafe04020d968fe23b165f2c8e5a" alt="img_09acbf97db25a23fc51293b7c5fa3d02.png"
若要独立用 Python 处理数据科学问题,Pandas 是绕不过去的。
新番
今天,花了一上午的时间,跟着这个 Youtube 系列教程,学习了 Pandas 中级技巧。
data:image/s3,"s3://crabby-images/d5fe9/d5fe9f7ec064c0174413d11643540db08e597215" alt="img_706ba2da3d3e505fea6fbc4a736876a4.png"
视频来自于 Data School。发布者是 Kevin Markham 。
data:image/s3,"s3://crabby-images/3e06e/3e06e57f16142b862eb0dcb296650ff6fe30bdec" alt="img_89ec4501f7fea199c86950fb653dc770.png"
在这个系列视频教程里, Kevin 将自己的 PYCON 2018 workshop 分成了10个部分全部精剪后释出。一步步带你领略 Pandas 的魅力。
我用了2个多小时,完成了他10个视频的全部内容。
收获颇丰。
利用教程中提到的美国交通警务数据来自于斯坦福开放警务项目(THE STANFORD OPEN POLICING PROJECT)。
data:image/s3,"s3://crabby-images/ad4b9/ad4b9534f6fd48e159645bd64c34fd5afe418368" alt="img_764b348fbb930235cc83989326978654.png"
这是数据大概的样子:
data:image/s3,"s3://crabby-images/9829c/9829c88d7b935c208c5be22e1956f3978b3db77b" alt="img_03be6936500889cb1b1951d4863e64e1.png"
一步步按照 Kevin 的指令练习,你可以完成这些内容:
分析男女司机的交通违规都包括哪些类别?每一类占比如何?
data:image/s3,"s3://crabby-images/804a4/804a4886ba5e93df709476a86e44ab2da2a3d6c7" alt="img_adff33ab71165f1ebe494b21e871af66.png"
那些被搜查车辆的男女司机,各是由于什么原因?
data:image/s3,"s3://crabby-images/bed39/bed39097492784930715ee3e1d5ad80ead416b2e" alt="img_8c257bdcb03be95676c634155ec0953a.png"
哪个时段,警察发现违规的数量最多?
data:image/s3,"s3://crabby-images/847b4/847b4abecd0644b07dcadda59e40c244e1b76e51" alt="img_72b9b90f2de7176a61db25c2375289e6.png"
不同违规行为里,司机年龄是如何分布的?
data:image/s3,"s3://crabby-images/f3cf9/f3cf9a8bb48e59d1935bb0c8e6b6548a165d0555" alt="img_b5e2329b8cdd80e0c07a0cbe5921ba32.png"
这些分析结果,只是这个教程的一小部分而已。
更妙的是,上述这些图形,几乎都是利用两三条 Pandas 语句,就可以做出。有的只需要一条就可以。
怎么样?有没有想学习的冲动?
教程与 ipynb 文件,都可以从这个github repo下载。
data:image/s3,"s3://crabby-images/29006/29006d46c5badc14ee37daaa9bfeb81295a83ea8" alt="img_a8975cdfb5ac9e968ba18bd9d43402d7.png"
安装好 Anaconda 3之后,你就可以打开一个 Jupyter Notebook,跟着视频一起做了。
老友
说说我是怎么找到这么好的视频教程的。
其实一点儿也不稀奇。