对机器视觉 图像处理有一定的兴趣 要做一条有梦想的咸鱼
暂时未有相关通用技术能力~
阿里云技能认证
详细说明加快节奏,重新看一下cudaC手册
由于之后图像上可能要结合NLP的问题加快节奏 刷一波NLTK,用python3
一个寒假一起入门深度学习
这里主要介绍一下基于Python生成中文词云,学习只要是通过网上的博客,及python中文分词库jieba
python的一个蛮酷炫的功能是可以轻松地实现词云。github上有关于这个项目的开源代码:https://github.com/amueller/word_cloud注意跑例程时要删除里面的wordcloud文件夹词云的功能有部分是基于NLP,有部分是基于图像的,下面以一段github word.
来做一个关于卷积神经网络的归类,先从LeNet开始: LeNet出自Yann Lecun(卷积网络之父),Yoshua Bengio(蒙特利尔大学教授,吴恩达的同门),Leon Bottou(将随机梯度下降引入学习中)三位大牛之手 这里附上LeNet的原始论文:Gradient-Based Learning Applied to Document RecognitionLeNet提出于1998年,当时以SVM为主的基于统计的学习方法和像一些sift之类的基于专业知识的特征统计的检测方法非常流行,同时当时计算机计算能力弱,还没有像GPU一样的加速工具,即使是像mnist的数据集,也是个挑战。
好不容易实验室来了两台性能还可以的服务器,正好师兄师姐比较忙没空来配置服务器,所以我可以暂时使用服务器来学一下怎么配置集群,哈哈,单机已经满足不了我了。
介绍一些深度学习中CV方面的一些常用的数据集: (一)mnist手写字体数据集: mnist数据是由Google实验室的Corinna Cortes和纽约大学柯朗研究所的YannLeCun建立的一个手写字体数据集,其中训练集包含60000训练的手写数字图片,测试集包含10000张图片,一个训练集的标签集,一个测试集的标签集。
python的一个蛮酷炫的功能是可以轻松地实现词云。 github上有关于这个项目的开源代码: https://github.
Yann LeCun 扬·勒丘恩 卷积神经网络之父 YoShua Bengio 蒙特利尔教授 吴恩达的师兄弟 Geoffrey Hinton 神经网络之父 三人合作的深度学习文字(好不容易计算机科学能在nature上发表) 深度学习主要通过反向传播来改变程序的内参,卷...
Rotation equivariant vector field networks 提出Rotation Equivariant Vector Field Networks(RotEqNet,旋转等变向量场网络) ,对CNN网络的旋转不变性进行改进。
感知器(perception)是二分类线性分类模型,其输入为实例的特征向量,输出为实例的类别,取+1和-1的二值,感知机对应于输入空间(特征空间)中将实例划分为正负两类的分离超平面,属于判别模型,感知机学习旨在求出将训练数据进行线性划分的分离超平面,为此导入基于误分类的损失函数,利用梯度下降法对于损失函数进行极小化,求得感知器模型。
无奈笔记本的性能太渣,双系统切换太麻烦,索性就拿tx2来当第二台电脑,需要在linux上跑的demo都放到tx2上跑; 先安装caffe(我重刷了两次机o(『﹏『)o)。 先配置依赖项 sudo apt-get install libprotobuf-dev libl.
暑假各种事忙得差不多后,终于有时间拿出早就申请到的tx2,开始刷机教程,这两天几乎踩边了所有的坑。 第一个坑,虚拟机 一般在安装VMware虚拟机时,建议的安装空间20GB,但是我从英伟达官网上下载下来的Jetpack3.
首先先要安装python+opencv环境 这里我们用python3.5环境, 可以去https://repo.continuum.io/archive/下载windows,linux,macos的anaconda旧版本 安装好后建议对pip源进行更换,可以减少pip...
在学习时,经常会遇到分类的问题,简单的讲:分类就是设定一个阈值,将你想分类的对象与这个阈值进行比较,根据结果来进行决定分类。 最简单的分类函数是阶跃函数(简单粗暴) 但问题在于,这模型不够光滑,阶跃点从0到1突变,阶跃点难以处理,分类的效果也就那样。
期待已久的jetson tx2终于到了,来做一个开箱 (ง •̀_•́)ง jetson tx2是英伟达的第三代GPU嵌入式开发板 前两代分别是jetson tk1和jetson tx1 jetson tk1: 绿色的版板子接口丰富 jetson tx1: pc...
看到有几本新的opencv书出来,梳理一下之前没看到过的知识: CommandLineParser类:可以帮助管理需要输入的命令行参数 CommandLineParser的构造函数为: CommandLineParser parser(argc,argv,keys):...
OpenGL这个库好,比起之前用过的opencv,cuda等开放库,opengl才几兆,不用安装,而且相对于VTK来说,OpenGL封装好的函数较为底层,灵活度较高,也可以更好地体现自己编写的算法的好坏。 OpenGL写程序先要OpenGL的头文件,lib,.dll相关配置可以在网上找到,这里不再累述。 对一个像我一样的初学者来书目前认为的OpenGL画图主要有三步:
爬虫主要就是要过滤掉网页中无用的信息,抓取网页中有用的信息 一般的爬虫架构为: 在python爬虫之前先要对网页的结构知识有一定的了解,如网页的标签,网页的语言等知识,推荐去W3School: W3school链接进行了解 在进行爬虫之前还要有一些工具: 1.首先Python 的开发环境:这里我选择了python2.7,开发的IDE为了安装调试方便选择了用VS2013
之前用MFC开发结果界面太难看被pass了,要求用C#重新来开发>_<,不过终于摆脱VC6.0的蛋疼操作了Y。 先来连接数据库 (1)用c#连接MYSQL数据库需要用到mysql-connector-net,这个组件网上查找就可以下载,安装直接按next,按默认路径安装; (2)新建一个Winfrom工程后,引用这个组件 在解决方案资源管理器中右键引用-&
Vtk,(visualization toolkit)是一个开源的免费软件系统,主要用于三维计算机图形学、图像处理和可视化。 VTK编程中主要用到的几个对象 vtkRenderer ,vtkRenderWindow,vtkActor,vtkMapper,其渲染场景如下图所示(图片来自东灵工作室博客) 在VTK的封装类中有一个专门为用三维杂序点进行重建曲面的类:vtkSur
这里我们用MFC框架来做VTK的界面 VTK比较蛋疼的是不能像图片一样直接在MFC的picture控件中显示,需要自己添加自定义控件来显示画出的模型, 1.首先新建一个类如MyCustomControl Ctrl+W打开建立类向导界面,选择Add Class->new 名字填写如MyCustomControl Base class选择generic CWnd
在MFC编程中开始学习都是只利用一个主线程,比较蛋疼的是,当你只用一个主线程进行如播放,查询时,MFC的界面会卡死,你无法进行其他的操作,这时需要进行多线程的编程,在操作时生成一个子线程来进行一些如播放,查询等的费时的操作。 多线程,经常会与对实时性要求比较高的并行运算结合,用来隐藏数据传输过程中用到的等待时间。 基于MFC的多线程在上一篇博客的基础上进行改进: 1.简
用vc6.0进行开发真的有点蛋疼,在实现jpeg图片的播放,vc6.0的picture控件居然只支持位图>_< 开始想法是在程序中加一个编码过程,边读图边解码边显示,先将JPEG图片转化为位图再显示,但代价是在OPENCV中的自带的函数支持编解码,但要先写下来,所以读写再度时间较长无法满足实时性的要求; 第二种方法是用VTK中带的vtkJPEGReader类,
kmean是常用的聚类算法之一主要步骤为: 1.读如点数据,随机选取k个点成为最后要聚的类数目; 2.求剩下的点到这k个点的距离,取最小值,按点的距离聚成一类; 3算同一类中点的质心坐标,即x,y的平均值作为中心点, 4求个点到这中心点的距离,按距离再进行聚类; 5迭代求中心,再聚类; 6当中心点变化在相邻两次迭代的变化数值小与某一范围时停止迭代 7用OpenG
在VC6.0上进行开发,用到的是VTK,按网上提供的教程VTK需要用5.0版本(额,这个好老,费了很大劲终于找到了) vtkdata-5.0.0.tar vtk-5.0.0.zip 相关配置方法可以参考下面的博客: http://blog.sina.com.cn/s/blog_4cee400e0100b0rd.html · 直接复制粘贴地址可能不行需要手打一遍(这
OpenACC中常用的一些导语与子语 : #pragma acc kernels 如同上一篇代码所显示,在代码前之间加上,编译器发现这一指令时会自动将接下来代码中可以改动的改成并行 #include<stdio.h> #define N 256 int main() { int i,a[N],b[N],c[N]; for(i=0;i<