【李沐】十分钟从 PyTorch 转 MXNet
PyTorch 是一个纯命令式的深度学习框架。它因为提供简单易懂的编程接口而广受欢迎,而且正在快速的流行开来。MXNet通过ndarray和 gluon模块提供了非常类似 PyTorch 的编程接口。本文将简单对比如何用这两个框架来实现同样的算法。
GTC 2019大会,一文看完阿里云三场演讲精华
今年的英伟达GTC China上,阿里云异构计算和容器服务四位技术专家介绍了阿里云和英伟达共同研发的国内首个轻量级GPU实例VGN5i、飞天AI加速解决方案,以及如何在阿里云容器服务中使用CPU加速大数据处理。
PyTorch快餐教程2019 (2) - Multi-Head Attention
# PyTorch快餐教程2019 (2) - Multi-Head Attention
上一节我们为了让一个完整的语言模型跑起来,可能给大家带来的学习负担过重了。没关系,我们这一节开始来还上节没讲清楚的债。
还记得我们上节提到的两个Attention吗?
![两种Attention机制](https://upload-images.jianshu.io/upload_images/