万事开头难!入门TensorFlow,这9个问题TF Boys 必须要搞清楚

本文涉及的产品
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介:

作为目前最普及的深度学习框架,TensorFlow 实不必多做介绍。

无论国内国外,有相当数量的程序员以 TensorFlow 入门深度学习开发,逐步走上职业机器学习工程师的道路。然而,TensorFlow 有一定的使用门槛。不管是编程范式,还是数学统计基础,都为非机器学习与数据科学背景的伙伴们带来一定的上手难度,更不要提处理不同任务时需面对的各类算法模型。

鉴于此,雷锋网(公众号:雷锋网)将与跨国 IT 服务巨头 ThoughtWorks,联合举办线上培训课程“TensorFlow & 神经网络算法高级应用班”,将于 4 月 25 日星期二开课。

开课前夕,两位授课老师——ThoughtWorks 高级咨询师佟达、数据架构师白发川接受了雷锋网的采访,与大家分享新手入门 TensorFlow 容易遇到的一些问题,以及他们的入门经历与使用体验。详见下文。

嘉宾介绍

佟达,哈工大信息与通信工程硕士,在校时获得美国数学竞赛建模一等奖。当年加入 TW 咨询团队时,创下最年轻成员的记录。现任 ThoughtWorks 高级咨询师,中国区数据团队资深技术专家。

万事开头难!入门TensorFlow,这9个问题TF Boys 必须要搞清楚

白发川,ThoughtWorks 数据架构师,深度学习框架 deeplearning.scala 贡献者。设计实现了金融、工业、互联网等多个领域的大数据平台建设和数据处理。

万事开头难!入门TensorFlow,这9个问题TF Boys 必须要搞清楚

下面,我们来看两位老师对入门 Tensorflow 的建议,以及他们的经验之谈。

新手入门深度学习,选择 TensorFlow 有哪些益处?

佟达:首先,对于新手来说,TensorFlow的环境配置包装得真心非常好。相较之下,安装Caffe要痛苦的多,如果还要再CUDA环境下配合OpenCV使用,对于新手来说,基本上不折腾个几天是很难搞定的。 

其次,基于TensorFlow的教学资源非常多,中英文的都有,这对于新手也是非常有帮助的。Google做社区非常有一套,在中国有专门的一群人,会在第一时间把Google的开发者相关的进展翻译成中文。

另外,由于有Google背书,TensorFlow从长期演进来看,基本上可以保证这个技术不会昙花一现。对于一个深度学习新手来说,学习任何一个工具,都有成本,如果刚学会,这个工具就没人用了,这个沉没成本还是很高的。

白发川:TensorFlow分为图和session两个部分,因为构建和执行在不同的阶段,所以很好的支持了模型的分布式,所以学习TF可以比较好的理解模型的分布式计算,另外TF支持直接从分布式文件系统,例如HDFS系统读取数据,所以可以说TF是接通机器学习和大数据的一个桥梁。

新人上手 TensorFlow 经常会遇到哪些问题或困难?

 佟达:第一个困难应该是来自编程范式的变化,因为TensorFlow是声明式开发方式,通过Session真正执行程序,这和常见的开发语言编程范式不太一样。如果是曾经有过函数式编程的Lazy Evaluation经验,接受起来会好一点。

 当掌握了基本的TensorFlow操作之后,就要使用TensorFlow做些真正有意义的事情。这时候的一大困难在于,TensorFlow的报错信息不那么直观,如果执行出错,新手很难从一大堆调用栈中找到有用的信息。

白发川:首选遇到的应该是数学的知识,TF本身是一个深度学习的框架,和我们常规的程序框架例如Spring,Hibernate之类的框架定位不太一样,会偏向数学部分一点,例如矩阵计算,求导等,虽然TF已经封装了对应的计算的API,但是我们还是需要知道这些概念性的知识,这样才知道应该用什么API。 

其次TF通过图的构建和计算部分分离实现模型的分布式,这一块的理解对初学者来说有时候也不太容易。

学习遇到困难之后,有哪些途径可以寻求帮助?

 佟达:如果身边有人可以提供指导,直接寻求帮助一定是最有效的。如果身边没有这样的人可以提供帮助,那么StackOverflow是在线寻求帮助的首选。Google的TensorFlow开发团队会有人专门在StackOverflow上回答问题,当然除了Google的人,还有很多热心的开发者提供帮助,比如说我(笑)。

白发川:目前TF的中文资料相对匮乏,所以优先的参考途径肯定是TF的官方doc文档,目前极客学院对TF官方文档做了汉化翻译,不过相对会比官方的延后一点。

 有没有推荐的学习资源?

 佟达:资源太多了,比如Udacity的Deep Learning课程,Coursera上的Machine Learning课程,还有Stanford提供的课程录像,比如CS231n和CS224n。另外,被称为深度学习圣经的《Deep Learning》也在网上(deeplearningbook.org)免费提供。

白发川:Stanford目前有很多针对机器学习的课程,例如CS231N,还有针对TF的CS20SI,这些都是很好的课程。

是否推荐新手从 Keras 入手?除 Keras,还有哪些适配 TensorFlow 的第三方工具推荐新手使用?

佟达: TensorFlow的API比较底层,有时候要做一件很简单的事情,要写很多辅助代码。而Keras的接口设计非常简洁,做同样的事情,Keras的代码大概是TensorFlow的三分之一到五分之一。不过我认为新手对两者都应该学习一下,这样对于理解原理更有帮助。事实上,我甚至推荐连TensorFlow都不用,先用纯Python自己做一个简单的神经网络。 

除了Keras之外,tf slim,tflearn等都是早期尝试简化TensorFlow的工具,不过自从1.0开始,TensorFlow官方支持Keras,估计以后Keras会成为主流。 

另外,TensorBoard是新手必须学会使用的,这个工具有非常好的可视化辅助工具,帮助工程师调试模型以及训练过程。tfdbg是1.0之后发布的调试工具,可以在每一个step中实时查看数据变化。不过这个工具目前能做的还不多,而且还有性能问题,开调试模式和非调试模式内存相差好几倍,所以还有很大的提升空间。

白发川:Keras相比TF来说封装的更好,可以说API更加工程化,所以如果说对于机器学习完全没有概念,Keras是一个不错的选择。目前有很多围绕TF进行封装的框架或者工具,例如Keras本身就是对TF的包装,其次TF Learn等也可尝试。

能不能讲讲你们当初上手 TensorFlow 的经历?学习过程中都遇到了哪些困难,又是如何解决的?

 佟达:我在使用TensorFlow之前,使用过其他一些机器学习/深度学习框架,比如主要用于语音识别的Kaldi,图像识别的Caffe,还有Spark MLlib,DeepLearning4j等。所以上手TensorFlow并没有带来特别大的困难。

当用TensorFlow做的事情越来越复杂之后,我开始尝试扩展TensorFlow,比如写一些自定义的Op。在TensorFlow中添加自定义Op需要用C++实现,编译好之后,在Python里面讲动态库链接进来才能使用。这一过程还是有些复杂,尤其是C++的代码有问题需要调试,需要使用lldb(llvm的debug工具,类似gdb),这对开发这的要求比较高。另外TensorFlow的编译使用的是Bazel,这是谷歌开源的一个多语言项目管理工具,要想把自定义的Op编译出来,还需要花点时间研究Bazel。

实际上,Google很成功的把TensorFlow封装的很好,开箱即用,然而,框架本身的复杂度还是很高,一旦你想要深入进去,还是需要下很大功夫。

白发川:TF不是我接触的第一个深度学习框架。我是从大数据做起,到后来的开始用Spark MLlib做开发,也使用过h2o和deeplearning4j这些框架,最后才接触TF的。所以对于我来说,更多的是学习TF的API设计相关的改变,以及对比其他框架TF做了哪些差异化的地方。对于API这一块,直接参考TF的Doc就是最好的方法。

不过我可以介绍一下入门到机器学习的经历,我最开始的工作也是和大多数人一样,从事web开发,或者mobile的开发,所以我的情况应该和大多数人相同,后来我开始接触到机器学习的时候发现和之前的思维差别挺大的,首先在我们从事一般的像mobile之类的开发的时候,我们并不会关心什么是矩阵的逆,什么是函数的导数,更加不会关心什么是链式求导,而在机器学习里面,这些都是基础,所以我又重新捡回了大学的线性代数和微积分再次过了一遍。

TF是个深度学习框架,所以使用TF的时候不可避免的要理解什么是隐层,什么是激活函数,激活函数有哪些,以及如何定义损失函数等等这一些概念,对于这一块我当时除了调研一些书籍外也通过看stanford的一些课程来学习,当然过程中也和很多同行进行交流和总结,特别是对于调参这一块,除了学习之外更多的需要自己进行实践。

TensorFlow 升级到 1.0 版本之后,感觉到了哪些提升?

 佟达:对我来说,TensorFlow 1.0最重要的变化在于高阶API,比如Estimator,以及和Keras的集成,这些改变可以大幅度的减少我们构建模型的代码量。

另外,1.0的API也经过了一些调整,这导致一些旧代码和新版本不兼容,不过从长期维护来看,1.0的API有更好的一致性,对于开发者来说,还是利大于弊。

白发川:首先相比之前的版本,1.0的速度肯定是变快了,这个官方也明确的提到了,并且也给出了一定的参考指标,TF 1.0加入了XLA,这也是为未来性能优化做的基础。

除了性能方面的体验外,在开发中,TF的API进行的很大的修改,相比之前来说更加的人性化,感觉起来有点像numpy的感觉,所以如果不是1.0的代码,可能会不兼容,不过TF提供了转换的脚本,可以方便直接把代码转换到1.0。

TF1.0提供了调试工具TFBDG,无论是大数据还是机器学习相关的开发,调试始终不是那么顺畅,而1.0提供的调试工具,可以说正在逐渐的弥补这一块,虽然目前还是有很多问题,不过已经有了很大的进步。

你们认为,目前 TensorFlow 有哪些局限性?其中又有哪些是开发者可以利用第三方工具克服的?

 佟达:TensorFlow的设计范式带来的一个天生限制就是在TensorFlow中,想要动态修改计算图比较困难。实际上动态修改计算图的需求并不少见,比如训练机器翻译或者聊天机器人的模型,句子长度不一样,计算图其实是不一样的。以前,要解决这个问题,就是设定一个比较长的输入长度,对于比较短的句子,填充一些占位字符。今年早些时候,TensorFlow发布了一个工具,TensorFlow Fold,可以相对方便的动态修改计算图。不过总的来说,TensorFlow在计算图的设计灵活性上还是有些欠缺。

白发川:目前来说,TF要想发挥最大的效果,还是需要借助于GPU,当然这并不算TF的局限,应该说所有数值计算的框架都有这个特点,对于这个目前大家的做法都是搭建自己的GPU集群,GOOGLE甚至开发了自己的GPU:TPU。

虽然大家都比较认可TF是工程化做的很好的深度学习框架,实际上它还是有一些门槛的,简单到API的设计,复杂到模型的训练和调参,其实还是是有一定门槛的,相比来说Keras的API设计更加直观化。

TF虽然提供了java和go的api,不过目前还不太成熟和稳定,所以对于开发语言,我还是推荐python,或者说我建议大家想往这个方向学习的时候,尽量掌握python这门语言,在我们实际开发中,会有很多用处的。

TensorFlow 在 ThoughtWorks 的业务中扮演了什么角色?对于公司进行产品开发,有没有更合适的选择?

 佟达:TensorFlow是 ThoughtWorks 目前在深度学习项目上的首选平台,因为它的工程化做的确实要比其他框架成熟,同时又和Hadoop、Kubernetes这些我们已经在很多项目中使用的工具兼容。

至于“更合适”,现在还不太好下判断,Facebook的PyTorch口碑很不错,MxNet被Amazon和很多IT公司支持,而Intel的BigDL另辟蹊径,在CPU上优化深度学习,而且和Spark无缝集成,看起来对于已经使用云计算和大数据工具的公司来说吸引力也非常大。所以在深度学习框架这个领域,目前处于百花齐放的状态,最后谁会胜出,还不好说。

白发川:ThoughtWorks 有自己的机器学习团队,主要方向为大数据和人工智能,当然这两个方向的划分并不完全独立的,实际上在实际开发中我们是将两者结合,实现基于大数据下的人工智能,对于深度学习的框架,我们spike过目前存在的大多数框架,最终选择了TF,所以我们的工作都是将TF工程化和市场化。

在选择对比了不同的框架之后,我们也比较明确现有框架的一些优缺点和局限,所以我们也研发了TW自己的深度学习框架:deeplearning.scala,框架本身是基于scala开发,具体的信息大家可以在github上看到,目前是开源的。




本文作者:三川
本文转自雷锋网禁止二次转载, 原文链接
相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
目录
相关文章
|
6月前
|
机器学习/深度学习 TensorFlow 算法框架/工具
TensorFlow入门指南:基础概念与安装
【4月更文挑战第17天】TensorFlow入门指南介绍了该流行深度学习框架的基础概念和安装步骤。核心概念包括张量(多维数组)、计算图(表示计算任务的图结构)、会话(执行环境)以及变量(存储模型参数)。安装TensorFlow可通过pip或conda,GPU支持需额外条件。安装成功后,通过Python验证版本即可开始使用。
|
TensorFlow 算法框架/工具
tensorflow 入门学习
tensorflow 入门学习
39 0
|
1月前
|
TensorFlow 算法框架/工具
Tensorflow学习笔记(二):各种tf类型的函数用法集合
这篇文章总结了TensorFlow中各种函数的用法,包括创建张量、设备管理、数据类型转换、随机数生成等基础知识。
34 0
|
3月前
|
C# 开发者 前端开发
揭秘混合开发新趋势:Uno Platform携手Blazor,教你一步到位实现跨平台应用,代码复用不再是梦!
【8月更文挑战第31天】随着前端技术的发展,混合开发日益受到开发者青睐。本文详述了如何结合.NET生态下的两大框架——Uno Platform与Blazor,进行高效混合开发。Uno Platform基于WebAssembly和WebGL技术,支持跨平台应用构建;Blazor则让C#成为可能的前端开发语言,实现了客户端与服务器端逻辑共享。二者结合不仅提升了代码复用率与跨平台能力,还简化了项目维护并增强了Web应用性能。文中提供了从环境搭建到示例代码的具体步骤,并展示了如何创建一个简单的计数器应用,帮助读者快速上手混合开发。
83 0
|
3月前
|
机器学习/深度学习 人工智能 TensorFlow
深度学习入门:使用Python和TensorFlow构建你的第一个神经网络
【8月更文挑战第31天】 本文是一篇面向初学者的深度学习指南,旨在通过简洁明了的语言引导读者了解并实现他们的第一个神经网络。我们将一起探索深度学习的基本概念,并逐步构建一个能够识别手写数字的简单模型。文章将展示如何使用Python语言和TensorFlow框架来训练我们的网络,并通过直观的例子使抽象的概念具体化。无论你是编程新手还是深度学习领域的新兵,这篇文章都将成为你探索这个激动人心领域的垫脚石。
|
6月前
|
机器学习/深度学习 数据可视化 TensorFlow
使用TensorFlow进行深度学习入门
【5月更文挑战第18天】本文介绍了TensorFlow深度学习入门,包括TensorFlow的概述和一个简单的CNN手写数字识别例子。TensorFlow是由谷歌开发的开源机器学习框架,以其灵活性、可扩展性和高效性著称。文中展示了如何安装TensorFlow,加载MNIST数据集,构建并编译CNN模型,以及训练和评估模型。此外,还提供了预测及可视化结果的代码示例。
|
6月前
|
机器学习/深度学习 人工智能 自然语言处理
使用TensorFlow进行深度学习入门
【5月更文挑战第11天】本文引导读者入门TensorFlow深度学习,介绍TensorFlow——Google的开源机器学习框架,用于处理各种机器学习问题。内容包括TensorFlow安装(使用pip)、核心概念(张量、计算图和会话)以及构建和训练简单线性回归模型的示例。通过这个例子,读者可掌握TensorFlow的基本操作,包括定义模型、损失函数、优化器以及运行会话。
|
6月前
|
机器学习/深度学习 PyTorch TensorFlow
【TensorFlow】TF介绍及代码实践
【4月更文挑战第1天】TF简介及代码示例学习
97 0
|
6月前
|
机器学习/深度学习 TensorFlow 区块链
TensorFlow 和 Keras 应用开发入门:1~4 全
TensorFlow 和 Keras 应用开发入门:1~4 全
211 0
|
11月前
|
前端开发 TensorFlow 算法框架/工具
新容器 react tf tensorflow 物体识别 web版本
新容器 react tf tensorflow 物体识别 web版本
63 0

热门文章

最新文章