渣渣一枚
一.问题描述 B1[1 2 3 4 5 6 7 8 9] B2[12 13 14 21 31 41 51 1 1 81 1 1] 两个十进制矩阵,行数不一样,分别是n1和n2,列数必须一致,为nwords,输出的矩阵Dh是[n1,n2],这和求两句真的欧氏距离一样的。
一.问题描述 [1 1 1 0 1 0 1 1 0 1 0 0 1 1 0] 每两位3转换为一个十进制数,共5列,那么转换后是ceil(5/3)=2列。 [7 1 6 1 1 2] 二.问题分析 1.每八个字符划分为一个十进制,nwords=ceil(size(b,2)/8) 2.按列处理每行的字符,只不过1到8是一组,为第一列;9到17是二组,为第2列。
“性格写在脸上;人品刻在眼里;生活方式显现在身材;情绪起伏表露于声音;家教看站姿;审美看衣服;层次看鞋子;投不投缘,吃一顿饭就能知道 。” -——很经典的话,你只要有足够的阅历,其实,“人是可以貌相的”。
这属于基础知识,老师应该讲的,可是;老师没讲.....在这个实验室,一师姐老师只要不在考试购物唱歌,完全无视其他人存在,给各个单身小学弟卖钱包,手表.......真是够了,精神污染.... 一.最小最大归一化 和区间映射(我理解的是把一个区间[a,b]映射到[c,d],c+(x-a)*(d-c)/(b-a),没查,应该是这样,主要要理解的问题是两段距离映射的话要除以比例因子(d-c)/(b-a),自己理解的,这样就可以把数据映射到[-1,1])不一样,这是映射到[0,1],就是x' = (x-min)/(max-min),其中max和min分别是是x序列的最大、小值,并不是0和1。
生活不易........ 一.青春照 二.高情商的九种表现 发现于微招聘。 1.对最熟最亲的人,依然保持尊重和耐心 2.与人吵架时,忍住了让他崩溃的那句话 3.在心情最糟的时候,依然按时吃饭 4.
先写的这一篇,很多东西没再重复写。 一.所需软件 jdk和ubuntu都是32位的。 二.安装JDK 1.建jdk文件夹 cd usr sudo mkdir javajdk 2.
一.所需软件 注意:安装MyEclipse后,我再已安装软件里找不到MyEclipse,所以我在root权限下用命令行启动MyEclipse,貌似避免了很多权限问题。 sudo su 输入密码 cd usr/myeclipse ./myeclipse 二.步骤 1.先把hadoop-eclipse-plugin-1.2.1.jar复制到ubuntu桌面(我的不能直接复制到MyEclipse的dropins目录下,我同学的能,真是奇怪啊),然后在进入桌面。
1、我们在Main()函数中,调用Test()函数,我们管Main()函数称之为调用者,管Test()函数称之为被调用者。如果被调用者想要得到调用者的值:1)、传递参数。2)、使用静态字段来模拟全局变量。
提供的是一种思路,和具体语言无关。 string test = "good good study day day up"; string r = test.Replace("oo",""); int num = (test.
1.注释:注销,解释2.单行://多行:/**/文档注释:///按enter主食要保证 别人一看就明白3.快速对期待吗:ctrl+k+d,按住ctrl不放,按k,迅速抬起,再按d(按D得时候k已经抬起)。
一.问题来源 返回检索到的数据(按相关度排序)在原始数据中的索引。 二.问题解析 x = [1 4 3 5; 1 3 2 6];sortrows(x)其结果是按照row来排列,默认首先排第一列,1和1一样大,那么排第二列,3比4小,所以1 3 2 6应该在第一行。
1.cmd运行devenv启动VS。 2.解决方案:公司 项目:部门 类:员工 3.右边的解决方案管理器:会自动隐藏,想让他固定的话,就点击关闭按钮中间的“自动隐藏”;可以拖动到上下左右,当出现阴影的时候放手。
在以往的项目建设中,编制项目进度计划常常采用甘特图(或称横道图)来表示,甘特图简单明了、形象直观,能够描述每一个项目或任务的开始与结束时间,但不适合用于大型和复杂信息工程项目的建设和监理工作。 因为甘特图不反映各项工作之间的逻辑关系,因而难以确定某项工作推迟对完成工期的影响;当实际进度与计划有偏差时也难以调整。
这不涉及公司机密,是我查资料查到的。 计算所许佳铭博士说的话:在研究的过程中,我发觉几乎很少有研究者提供不同对比方法的代码。这为研究带来了很大不便,而且我坚信在研究的过程中,我们应专注于新算法的设计,而不是新人进来时都得重新造轮子,我们可以在现有代码的基础上学习它,并将它进行拓展,为自己使用。
% x是原数据集,分出训练样本和测试样本 [ndata, D] = size(X); %ndata样本数,D维数 R = randperm(ndata); %1到n这些数随机打乱得到的一个随机数字序列作为索引 Xtest = X(R(1:num_test),:...
一.问题来源 来自于一份大规模hash图像检索代码。 二.问题解析 2.1 添加目录 addpath('./utils/'); 2.2 添加目录及其子目录 addpath(genpath('./utils/.');
一.问题来源 来源于换关键字,从LSH转换为hash检索,这要感谢李某。 二.解析 笔者认为关键思想是数据降维后使用矩阵旋转优化,其他和LSH一样的。 2.1 PCA降维 先对原始空间的数据集 X∈Rn×d 用PCA进行降维处理,设经过PCA降维后的数据集为 V∈Rn×c ,该问题就可以转化为将该数据集中的数据点映射到一个二进制超立方体的顶点上,使得对应的量化误差最小,从而而已得到对应该数据集优良的二进制编码。
如果想要得到较高的精度,则需要较长的编码。 编码长度m增长的话,则item碰撞的概率会成倍的减小,从而导致召回率下降。 为了得到较高的召回率,则需要多个哈希表。 参考http://yongyuan.
夜深人静时分,宿舍就我自己,只有蚊子陪伴着我,我慢慢码下这段文字............ 感觉知识结构不完善:上学期看论文,发现类间离散度矩阵和类内离散度矩阵,然后百度,找不到,现在学模式识别,见了,发现是数学公司,不过老师不讲........ 一.问题来源 今天有个意想不到的收货,下午讲课的时候遇到一个人主动加我,来自南京信息工程大学的某X(处于隐私保护,未经李某X同意,笔者不敢公开其信息),下面是他的话:很久没去博客园了。
一.问题来源 来自于一份PSO代码,PSO中需要初始化粒子位置和速度。 二.问题探究 众所周知,Matlab中的rand()函数产生的是伪随机数,但一般用来也可以接受。但是,如果我们知道伪随机数的初始状态,那么产生的伪随机数是唯一确定的。
前两章的协同过滤和就内容的推荐都建立在“大量数据”的基础上,运用概率方法来进行计算和预测。不过,在现实生活中,有些物品,如:汽车、房屋、计算机,用户不会频繁的消费。如何在这种情况下对用户进行推荐? 这种case,在现实生活中很常见的就是在淘宝上面用general的query来搜索一些大宗物品,如:相机、电视、空调、等等。
马克·吐温曾经说过,所谓经典小说,就是指很多人希望读过,但很少人真正花时间去读的小说。这种说法同样适用于“经典”的计算机书籍。 最近一直在看LSH,不过由于matlab基础比较差,一直没搞懂。
基于内容的推荐的基本推荐思路是:用户喜欢幻想小说,这本书是幻想小说,则用户有可能喜欢这本小说 两方面要求:(1)知道用户的喜好;(2)知道物品的属性 基于内容的推荐相比协同过滤方法(个人观点):协同过滤用到了大量用户的群体行为特征,两个特点,(1)要大量用户,(2)除了用户的行为之外,不需要其他信息;基于内容的推荐,需要用户和物品的额外信息,如:用户喜好、物品属性等等,但是不需要存储、处理大量的用户数据。
matlab求极限(可用来验证度量函数或者隶属度函数)可用来验证是否收敛,取值范围等等。 一.问题来源 搜集聚类资料时,又看到了隶属度函数,没错,就是下面这个,期间作者提到m趋于2是,结果趋于1,我想验证下,于是查资料。
协同过滤算法是推荐系统中最古老,也是最简单高效的推荐算法。简单说协同过滤就是根据以往的用户产生的数据分析,对用户的新行为进行匹配分析来给用户推荐用户最有可能感兴趣的内容。 协同过滤算法是为了解决长尾现象,也就是说推荐系统是为了解决长尾现象而诞生的。
第一部分是学习ID3时候积累的。 一.以前写的基础知识 1.信息:是用来消除不确定性的度量,信息量的大小,由所消除的不确定性的大小来计量(香农)。 2.由于不确定性是由随机性引起的,所以用概率来描述和计量;熵entropy:源于热力学,是分子混乱程度的度量。
我想站在大神肩膀上...貌似是计算所的一个小伙伴... 总结的很好,看得出来有一定的功底.... 不过对于自己看过了的东西,就不愿意再翻看第二遍了。恰好这本书和项亮那本很像,就直接看这本书了。顺便记记笔记,贴到这里,供更多人参考。
感谢敖山、薛霄老师把我引进了统计学和现代服务业的大门.......至少是长见识了。 查相似项检索时发现的。 中间一部分资料来自厦门大学数据库实验室,感谢大牛们的传道授业,爱你们。 查资料时发现很多计算机相关(比如分布式、数据库)的研究生都曾经是数学系的学生。
一.引言 1.1 分布式对象技术要解决的基本问题 分布式对象技术是在面向对象技术的基础上发展起来的,它要解决的主要问题是位于不同进程中的对象之间的调用问题。 支持访问异地对象,支持访问异构对象(java平台调用C、vb,C++)。
一.题外话 虽然是科普,不过笔者个人认为大道至简,也就是说越简单的东西很可能越值得探讨,或者另外一种说法越简单的东西越不好讲解;其实笔者认为这就是《编程之美》所要传递的——大道至简。 软件构建老师给我推荐的《走出软件作坊》还没看呢。
通过LSH hash functions我们能够得到一个或多个hash table,每个桶内的数据之间是近邻的可能性很大。我们希望原本相邻的数据经过LSH hash后,都能够落入到相同的桶内,而不相邻的数据经过LSH hash后,都能够落入到不同的桶中。
一.问题描述 做一个类似校园网首页,主要是导航栏的设置,ul默认纵向排列,如何横向排列,同时去掉圆点。 二.问题解决 2.1 先写导航条 用两个ul嵌套,一个ul是横向导航条,另一个是每个小项目下连一个竖向的ul。
学到现在越来越感觉计算机网络、操作系统的重要性,组成原理到没感觉出来,求推荐资料,我想要的是描述性解释,教材不是我想要的,谢谢! 感觉自己的知识很老旧,在没有出国也没去高水平大学的条件下,只能通过网络学习了,感谢博客园。
需要代码联系作者,不做义务咨询。 一.算法实现 基于p-stable分布,并以‘哈希技术分类’中的分层法为使用方法,就产生了E2LSH算法。 E2LSH中的哈希函数定义如下: 其中,v为d维原始数据,a为随机变量,由正态分布产生; w为宽度值,因为a∙v+b得到的是一个实数,如果不加以处理,那么起不到桶的效果,w是E2LSH中最重要的参数,调得过大,数据就被划分到一个桶中去了,过小就起不到局部敏感的效果。
感谢开源大神,慢慢收集资料。网上资料很少,我在找如何用matlab处理movielens数据集时找到的。 用ml-100k这个数据集,包括主函数和相似度函数。 代码托管于CSDN。
IP并发数限制,老师说西工大的CNKI才20个并发指标,HPU自不必说。但是我略表怀疑,这只是翻译助手而已,就像百度翻译和百度数据库的区别,如何验证呢?去校外用该助手,如果能用,那么就不是IP并发限制。
一.问题来源 来自于一份LSH代码,记录下来。 二.函数解析 2.1 bsxfun bsxfun是一个matlab自版本R2007a来就提供的一个函数,作用是”applies an element-by-element binary operation to arrays a and b, with singleton expansion enabled。
比如,对一本书的评分,下面列出两个描述方式,前者是我所提倡的,括号里的是豆瓣现在采用的。 1分:我很不喜欢(很差) 2分:我不喜欢(较差) 3分:还行(还行) 4分:我喜欢(推荐) 5分:我非常喜欢(力荐) 一个显然的区别是:前者是从主观出发的,后者则主要是基于客观情况的。
一.问题来源 昨晚看微博,发现于梁斌penny,他在说现在的面试制度考不出来真功夫,也就是基本功,面试题千篇一律的算法,看过会,不看就不会。期间提到了快慢指针求中位数。 查资料时我发现,这其实是计算机系统原理里的知识点。
一.问题来源及描述 今天看了July的微博,发现了七月问题,有这个题,挺有意思的。 数组A中任意两个相邻元素大小相差1,现给定这样的数组A和目标整数t,找出t在数组A中的位置。如数组:[1,2,3,4,3,4,5,6,5],找到4在数组中的位置。
一.问题来源 如右侧的微博关注组件,直接用div的align居中没效果,我就开始百度了。即在 ..... 中,如何使.....中的内容在div 标签中处于水平居中? 二.解决方案 1 2 3 4 .......... 5 6 7 style="margin-left:auto; margin-right:auto;"是为了让table横向居中,td默认是垂直居中的,果然有效。
一.问题来源及描述 本科毕设的时候积累的问题,整理如下。 红头文件下面的署名,上下要对齐。 二.解决办法 经验证,第一次拉标尺要把标尺放在第一行的光标处,为了换行后,再次enter,tab后到与上一行对齐的位置。
一.高级搜索 百度高级搜索出现如下页面。 二.逻辑连接 site:在某一网址内搜索关键词。 filetype:查找ppt,pdf等。 inurl:引用的url内包含后面字段。 intitle:比如新闻的标题包含。 -():表示不包含里面的关键词。
一.问题来源 修改博客页面时,突然想到 二、解决办法 2.1原来办法 在img和a中加入align="center",发现不行 2.2百度答案 ... 用 用;这样的话整体就会居中,如果只想文字中的话,在百度吧。
先说点题外话,早上同学给我了一套卷子,让我做,他对象的机试题,第一题是求点队中的最小距离点对,没说数据量,那肯定直接暴力就行了(有给分点,正确输入给5分,什么什么给五分),或者分治算法(编程之美里的);第二题是替换字符串;第三题是求给出的四边形的面积,逼着认为这个不能用海伦公式,因为可能是凹四边形,需要向量公式。
今晚在数据挖掘研究院看到的一篇文章《自动推荐系统效果为什么不好》,为什么朋友推荐的书总是让我满意,难道朋友在推荐书的时候作了比计算机所能进行的运算还要复杂的大脑活动了吗?用户的诉求和心理很微妙,很多时候你自己都不知道自己的诉求,前1分钟你想吃肯德基,后1分钟你可能放弃这个想法,正如keso说的我买了本股票的书,不代表我就得接受机器推送的其他股票书籍。
Hybrid Recommender System based on Fuzzy Clustering and Collaborative Filtering 给出题目,想找的话直接在ElsevierSD里下载即可。
一、问题由来 这个题目的由来是在《编程珠玑》里遇到的,故记录一下。还可以这么说,”如何从二进制文件中等概率取整数?”或者”在不知道文件总行数的情况下,如何从文件中随机的抽取一行?”这个题目说的有点不清楚实际上是:一个二进制文件中有好多好多整数,你要随机取出一个。
用户界面,用户体验。 在创建网站选择色调时,大多数企业想到的是美观。其实,颜色所起到的作用远超出人们的想象。 关于颜色与购买习惯的心理学书籍比比皆是,下面要谈的并不是心理学,而是一些基本的规律,如各种颜色代表着什么,分别将吸引哪些人群等等。