终身学习者、大学教师。稍微懂一点儿写作、演讲、Python和机器学习。公众号“玉树芝兰”(nkwangshuyi)。
本文为你介绍,如何从 Waze 交通事件开放数据中,利用序列模型找到规律,进行分类预测。以便相关部门可以未雨绸缪,提前有效干预可能发生的严重拥堵。
硬件平台、软件环境和算法模型的一站式支持,可以让各学科的研究都能从数据科学的发展获益。 开放 今天是北得克萨斯大学(University of North Texas, UNT)科研信息技术服务中心(Research IT Services)的开放日(Open House)。
这一份视频教程中,我会用简明的例子和手绘图,为你讲解循环神经网络(Recurrent Neural Network, RNN)的原理和使用方法。
本文带你认识一个优秀的新深度学习框架,了解深度学习中最重要的3件事。 框架 看到这个题目,你可能会疑惑: 老师,你不是讲过如何用深度学习做图像分类了吗?迁移学习好像也讲过了啊! 说得对!我要感谢你对我专栏的持续关注。
本文通过一个命令行转换 pdf 为词云的例子,给你讲讲 Python 软件包安装遇挫折时,怎么处理才更高效? 遭遇 前两天,有位读者留言求助。
用好 R 环境下的 BiblioShiny 软件包 ,可以让你在友好的图形化界面,快速扫描科研领域。 场景 作为一个初学者,你可能很希望快速了解一个新的科研领域。
据说技术门槛在降低。作为文科生的你,该如何从这种趋势中收获更多? 苦恼 你大概经常听别人提起,技术的门槛在降低。 数据科学、机器学习、自然语言处理、神经网络、人工智能……一系列的名词让你眼花缭乱,让你对这个时代充满兴奋的感觉。
需求 有个朋友提出,希望把目录中的许多 markdown 文件,批量转换为对应名称的 pdf 格式文件。我于是编写了一个 Python 脚本,并且分享给你。
多问自己一个“那又怎样?”,会很有用。 疑问 7月初,我赴南京参会。 James Hendler 教授的演讲非常精彩。 其中一个片段,让我印象深刻。
之前给你写的科研入门系列文章,一不留神,居然都攒成了本书。 链接 咱们开门见山。 我把之前公众号和专栏发布的关于毕业论文写作全过程(包含选题、文献阅读、文献分析、论文写作和答辩注意事项等)内容,集结成了一本书,并且在线发布了。
将事情缩减至其根本实质。 实质 “第一性原理”这个词儿被吹得神乎其神,似乎是威力无穷。 大家都知道了伊龙马斯克(Elon Musk)把这个原理用得好,可以把火箭发射成本降低到原先的几十甚至上百分之一。
如果一幅图胜过千言万语,那么一幅会动的图呢? 需求 绘制统计图形,是为了给谁看? 显然不是给电脑看。 因为它看不懂,也没必要看。给它数据就好了。
用最简单的方式,完成探索性分析。 痛点 实践中,大量数据分析时间,都会花在数据清洗与探索性数据分析(Exploratory Data Analysis, EDA)。
分不清谭卓和郝蕾?各来200张照片,让深度学习帮我们识别吧。 问题 《如何用Python和深度神经网络识别图像?》一文中,我给你展示了如何用深度学习,教电脑区分机器人瓦力和哆啦a梦。
负荷 下午,我用 Python 深度学习框架 Keras 训练了一个包含3层神经网络的回归模型,预测波士顿地区房价。 这是来自于 “Deep Learning with Python” 书上的一个例子。
好的模型,为什么非得是人能够理解的? 有的人,对深度学习(deep learning)模型,很不以为然。 说根本没有搞清楚因果关系,只是拿出相关性来说事儿。
利用 Python 和 Spacy 尝试过英文的词嵌入模型后,你是不是很想了解如何对中文词语做向量表达,让机器建模时捕捉更多语义信息呢?这份视频教程,会手把手教你操作。
咱们以《三国演义》人名和兵器谱为例,尝试读取不同结构的文本文件,并且对其中的信息进行统计分析和可视化。 入门 如何帮助学生高效入门 Python ,一直是困扰我的问题。
咱们的 Python 教程代码已经可以免安装在线运行了。但如果你希望在本地克隆运行环境,请参考本文的步骤说明。 疑惑 这些日子,我用课余时间,忙着把自己知识星球的分享文章转移到语雀平台,以便于订阅用户阅读和获得即时推送。
若要独立用 Python 处理数据科学问题,Pandas 是绕不过去的。 新番 今天,花了一上午的时间,跟着这个 Youtube 系列教程,学习了 Pandas 中级技巧。
其实,不只是iPad,手机也可以。 痛点 我组织过几次线下编程工作坊,带着同学们用Python处理数据科学问题。 其中最让人头疼的,就是运行环境的安装。
本文教你用简单易学的工业级Python自然语言处理软件包Spacy,对自然语言文本做词性分析、命名实体识别、依赖关系刻画,以及词嵌入向量的计算和可视化。 盲维 我总爱重复一句芒格爱说的话: To the one with a hammer, everything looks like a nail. (手中有锤,看什么都像钉) 这句话是什么意思呢? 就是你不能只掌握数量很少的方法、工具。
不愿意看那一堆公式符号,却想知道卷积神经网络(Convolutional Neural Network)如何做图像分辨?分享一段我给自己研究生的讲解答疑视频,希望对你有帮助。
毕业前,着力打造三种核心能力,让你在人群中脱颖而出,远离被人工智能淘汰的担忧和烦恼。 精彩 放假前的周末,在为公众创,教师、学生、企业家和社会公益人士们围坐,看视频。
image 关于毕业论文写作,我大概也只能帮你到这儿了。 需求 不少高年级本科生,在面对毕业论文写作的时候,颇有一种未经训练,即被推上战场的感觉。
如果你不想学编程,数据采集爬虫也是可以用的。 简介 最近的一次组会,我们请来了一位分享嘉宾——15级研究生庞琳同学,给我们科研团队分享网站评论数据的采集。
好的答辩幻灯,是你的重要产品。你要锁定客户,理解痛点,并且有效传递信号。 痛苦 毕业论文季,许多同学都会很痛苦。 好不容易做完了毕业论文,还得做幻灯,准备答辩。
最近我试用了一段时间的幕布,用户体验很好。 image 虽然本人用workflowy, dynalist和幕布等独立大纲应用时间不长,但是使用 Emacs + org-mode 超过 10 年,对这种列表大纲式应用并不陌生。
image 写给研究初学者的论文阅读简明教程。 痛苦 做研究,少不得要读论文。 如果你不了解一个领域已经被研究成了什么样子,又如何找到自己研究的切入点呢? 可是,对许多初学者来说,读论文是件痛苦的事儿。
本文为你展示,如何用Python把许多PDF文件的文本内容批量提取出来,并且整理存储到数据框中,以便于后续的数据分析。 问题 最近,读者们在后台的留言,愈发五花八门了。
利用Python机器学习框架scikit-learn,我们自己做一个分类模型,对中文评论信息做情感分析。其中还会介绍中文停用词的处理方法。 疑惑 前些日子,我在微信后台收到了一则读者的留言。
你期待已久的Python网络数据爬虫教程来了。本文为你演示如何从网页里找到感兴趣的链接和说明文字,抓取并存储到Excel。 需求 我在公众号后台,经常可以收到读者的留言。
链接散落的教程文章,做个详细的导读,助你更高效入门数据科学。 问题 2017年6月以来,我陆续在自己的简书专栏《玉树芝兰》里,写了一系列数据科学教程。
只需要花10几分钟,跟着教程完整做一遍,你就能自己用Python做出词云了。 《如何用Python做词云?》图文版发布于2017年6月,是我数据科学系列教程中的第一篇。
本视频教程针对Windows 7平台,集成3.6版本Python的Anaconda录制。 根据我多次线下编程工作坊获得的反馈经验,发现Python初学者居然在环境安装步骤,就很可能遭受挫折。
罗胖说他找到了“最长跑道”。你以为他说的是卖书?还是卖课?其实,他已经换了跑道,要开始“卖人”了。 跑道 丁酉年的最后一场得到例会,罗胖发烧了。
传统的关键词检索论文,浩如烟海的结果让你无所适从?试试人工智能检索引擎。根据你的研究兴趣和偏好,便捷而靠谱帮你找论文。 image 烦恼 进入一个新领域,读论文是必然途径。
手里明明有一份学生成绩Excel表格,却还得一一手动把它们输入到教务系统?类似这样的简单重复枯燥操作,其实你都可以一键让电脑自动替你完成。 痛点 期末了,学生们考完试,都愉愉快快放假回家了。
给你10万张图片,让你找出与其中某张图片最为近似的10张,你会怎么做?不要轻言放弃,也不用一张张浏览。使用Python,你也可以轻松搞定这个任务。
用VOSviewer尝试CNKI中文文献关键词共现(keyword co-occurence)分析时,你可能会踩到一个大坑。本文帮助你绕开这个坑,或是从坑里爬出来。
只需要10几行Python代码,你就能构建自己的机器视觉模型,快速准确识别海量图片。快来试试吧! 视觉 进化的作用,让人类对图像的处理非常高效。
本文一步步为你介绍,如何用Python自动判断多张图片中哪些超出阈值需要压缩,且保持宽高比。如果你想了解Python图像处理的基础知识,欢迎动手来尝试。 痛点 我喜欢用Markdown写文稿,然后发布到不同写作平台。
记住几个关键词,可能对你开启职场生涯有些帮助——负责,尊重,不要计较。 你马上就要毕业走上职场了,这是一件让人欣喜的事情。 但是目前的情况,让我看到了一丝隐忧。
当你开始接触丰富多彩的开放数据集时,CSV、JSON和XML等格式名词就会奔涌而来。如何用Python高效地读取它们,为后续的整理和分析做准备呢?本文为你一步步展示过程,你自己也可以动手实践。
本文一步步为你演示,如何用Python从中文文本中提取关键词。如果你需要对长文“观其大略”,不妨尝试一下。 2017-12-07-20-38-22-7-426487.png 需求 好友最近对自然语言处理感兴趣,因为他打算利用自动化方法从长文本里提取关键词,来确定主题。
本文用简明的样例,介绍如何使用Markdown和自动化工具帮你处理数学公式、参考文献引用、图片交叉索引等学术论文写作中常见的棘手问题。快来试试吧。 image 苦恼 自从我学会了如何在数字文档上用红笔写写画画,跟学生合写文章和指导毕业论文的工作就变得轻松多了。
看似无边无际、高深难懂而又时刻更新的数据科学知识,该怎样学才更高效呢?希望读过本文后,你能获得一些帮助。 疑惑 周五下午,我给自己的研究生开组会。
Python深度学习简明实战教程来了。别犹豫了,赶紧从零开始,搭建你自己的第一个深度学习模型吧! 想不想了解如何用Python快速搭建深度神经网络,完成数据分类任务?本文一步步为你展示这一过程,让你初步领略深度学习模型的强大和易用。
疑惑 《如何用VOSviewer分析CNKI数据?》一文发布后,有同学问我: 王老师,我有个问题,我用cnki导出关键词后,想统计关键词的词频,我应该用什么样的工具?如果不利用citespace和python,做出excel那种的统计表格,该怎么做呢? 这个问题,我觉得很有意思。
学会了用VOSviewer分析Web of Science数据后,想不想知道如何用它分析中文文献?本文用CNKI数据做样例,一步步教你实现步骤。 image 疑问 自从写了《如何快速梳理领域文献》一文后,不少读者留言或者来信问我一个问题: 如何可视化分析中文文献呢? image 我之前没有用VOSviewer做过中文文献的梳理,所以还真不知道VOSviewer是否有这个功能。