暂无个人介绍
在前面概要的了解了lucene的内容下面就深入一下lucene的各个模块。这里我们主要深入一下lucene的索引,就是如何构建索引的过程及概念。 lucene与关系型数据库 从两个角度比较一下吧,一个是从索引方面,一个是模糊查询,其实归为一类的化就是全文检索的对比。
在上面的篇幅中我们已经了解到了lucene,及lucene到底是做什么的,什么情况下才能够使用lucene,下面我们就结合一个例子来详细说明一下lucene的API,看看lucene是如何工作的。 lucene的下载 其实这个很简单了,直接到baidu或者google上搜索一下,一般情况下第一个就是我们要的链接。
信息检索的概念 信息检索(Information Retrieval)是指信息按一定的方式组织起来,并根据信息用户的需要找出有关的信息的过程和技术。狭义的信息检索就是信息检索过程的后半部分,即从 信息集合中找出所需要的信息的过程,也就是我们常说的信息查寻(Information Search 或Information Seek)。
做一个网络爬虫的程序吧,根据客户的需求,要求把相关的内容爬取到本地 最终选择的是apache nutch,到目前为止最新的版本是1.3 1. Nutch是什么? Nutch是一个开源的网页抓取工具,主要用于收集网页数据,然后对其进行分析,建立索引,以提供相应的接口来对其网页数据进行查询的一套工具。
什么是nosql NoSQL(NoSQL = Not Only SQL),意思是不仅仅是SQL的扩展,一般指的是非关系型的数据库。 随着互联网web2.0网站的兴起,传统的关系数据库在应付web2.0网站,特别是超大规模和高并发的SNS类型的web2.0纯动态网站已经显得力不从心,传统的电信行业动辍就千万甚至上亿的数据,甚至有客户提出需要存储相关的日志数据50年以上,暴露了很多难以克服的问题,而非关系型的数据库则由于其本身的特点得到了非常迅速的发展。
在做web开发的时候难免遇到一个问题,那就是,选择什么样的框架。下面把前端的框架简单的列一下。 1、flex Apache基金会今天发布了Flex 4.8版本,这是Adobe将Flex捐献给Apache基金会后发布的第一个版本。
在上面已经配置了sts及virgo的环境,并且能够成功的运行virgo服务器了。接下来我们来用sts建几个工程。 我们模拟的是一个注册的例子,在我们实际的案例中,有的时候会把数据写入到数据库,写入到文件或者写入到内存中,已方便不同的操作。
Spring-DM是什么 Spring-DM 指的是Spring Dynamic Modules. dm Server 是一个完全模块化部署的,基于OSGi的Java服务器,为运行企业Java应用和Spring应用提供更加强大的灵活性和可靠性。
什么是mongodb MongoDB是一个基于分布式文件存储的数据库。由C++语言编写。旨在为WEB应用提供可扩展的高性能数据存储解决方案。 MongoDB是一个介于关系数据库和 非关系数据库之间的产品,是非关系数据库当中功能最丰富,最像关系数据库的。
saas的由来 saas现在可能还是一个比较新的概念,或者说还不是那么普及,那么现在我们就来看一下saas的由来并且来看一下saas是不是以后软件发展的趋势。 从做项目说起 软件公司从做项目开始,针对某个行业会针对性的做不同的项目,项目中包含的内容可能相当,也可能不相同,以XX公司为例,假设XX公司做办公自动化业务。
Apache Felix Felix是一个OSGi版本4规范的Apache实现。 OSGi是一个基于Java的服务平台规范,其目标是被需要长时间运行、动态更新、对运行环境破坏最小化的系统所使用。有许多公司(包括Eclipse IDE,它是第一个采用OSGi技术的重要项目)已经使用OSGi去创建其微内核和插件架构,以允许在运行时刻获得好的模块化和动态组装特性。
开发web的两种方式 基于OSGI开发B/S应用有两种方式: 1)在OSGI框架中嵌入Http服务器 2)在Servlet容器中嵌入OSGI框架 Http服务器嵌入到OSGI框架环境配置 配置运行环境,选择Run->Run Configuration,new一个环境 保留以下几个Bundle,包括javax.
模块化的规范 在Java中现在是没有一个模块化的概念的,或者说没有一个事实上的标准。就是如何组成一个模块,然后哪些模块是给内部使用,哪些模块是给外部使用的。 OSGI就可以解决上面的问题,应用程序可以像搭积木一样完成搭建,例如对于一个正在运行的系统,压根日志服务,但目前系统中没有提供日志服务的模块,那么可以直接开发出相应的日志服务模块,然后动态的加载到系统中,不需要重新启动服务,只需要动态的注册就可以,这样日志服务就可以使用了。
什么是OSGI OSGi(Open Service Gateway Initiative)有双重含义。一方面它指OSGi Alliance组织;另一方面指该组织制定的一个基于Java语言的服务(业务)规范——OSGi服务平台(Service Platform)。
在使用HBase一定要明白HBase的适用场合,因为HBase并非适用于每种情况。 首先,要确认有足够多的数据存入HBase。 如 果有几亿或者几十亿条记录要存入HBase,那么HBase就是一个正确的选择;否则如果你仅有几百万条甚至更少的数据,那么HBase当然不是正确的选 择,这种情况下应当选择传统的关系型数据库,因为如果这么少的数据存入HBase,就会导致数据堆积在一两个节点上,而HBase集群内部的其他节点都处 于空闲状态。
什么是SAAS 软件即服务英文是Software-as-a-service的意译。国外称为SaaS,国内通常叫做软件运营服务模式,简称为软营模式。 SAAS的起源 软营模式(Saas)是随着互联网技术的发展和应用软件的成熟,而在21世纪开始兴起的一种完全创新的软件应用模式。
第1章引言 1.1nutch和solr Nutch 是一个开源的、Java 实现的搜索引擎。它提供了我们运行自己的搜索引擎所需的全部工具。 Solr 拥有像 web-services API 的独立的企业级搜索服务器。
第1章 引言 1.1 编写目的 详细说说操作权限并且在sshpermissions中是如何处理及使用操作权限的。 1.2 关于操作 这里所说的操作权限是指在我们工作中,比如张三“添加”了一条员工的记录,李四“修改”了哪条信息,管理中对某个角色进行了“授权”。
第1章引言 1.1编写目的 介绍apache cassandra。 1.2非关系型数据库—Cassandra 1.2.1简介 Cassandra是一个混合型的非关系的数据库,类似于Google的BigTable。
搭建hbase的时候遇到这个问题org.apache.hadoop.hbase.client.RetriesExhaustedException: Failed setting up proxy interface org.
当我把hadoop、hbase安装配置(具体参考这里)好了之后,启动hbase的shell交互模式,输入命令却出现了下面这样的错误: ERROR: org.apache.hadoop.hbase.
第1章 引言 1.1 编写目的 介绍pig,一个不得不说的hadoop的扩展。 1.2 什么是pig Pig是一个基于Hadoop的大规模数据分析平台,它提供的SQL-LIKE语言叫Pig Latin,该语言的编译器会把类SQL的数据分析请求转换为一系列经过优化处理的MapReduce运算。
第1章 引言 1.1 编写目的 对关于hadoop的文档及资料进行进一步的整理。 1.2 相关网站 毋庸置疑 http://hadoop.apache.org/ 国内 http://www.
java.lang.IllegalArgumentException: Wrong FS: hdfs://localhost:54310/user/Hadoop/b, expected: file:/// at org.
tar zxvf ut6410-android2.1.tgz tar zcvf ut6410-android2.1.tgz ut6410-android2.1/ tar --exclude ut6410-android2.
第一章 引言 1.1 编写目的 在sshpermissions中加入工作流部分,主要整合的是jbpm4.4。并且将流程设计器和业务做了初步的整合。同时也修改了前期的一些bug。 1.2 关于jbpm JBPM,全称是Java Business Process Management(业务流程管理),它是覆盖了业务流程管理、工作流、服务协作等领域的一个开源的、灵活的、易扩展的可执行流程语言框架。
第一章 介绍 1.1 编写目的 介绍流程设计软件并且简单附上使用说明。因为还不是很完善,所以希望大家能多提出自己的意见的见解。 1.2 基本结构 1.3 使用技术 主要使用flex技术做前端的页面,后端使用jbpm4.4做为流程引擎。
第一章 引言 1.1 编写目的 使用easyui+ssh2+shiro的权限管理系统,粒度可细化到按钮及菜单级别。目前是第一个稳定版本,可实现基本的权限控制功能,并且可以使用shiro的标签对细粒度的权限进行管理。
1.1 简介 在开发工具上添加自己需要的功能,可以基于eclipse的插件进行扩展以满足新功能的需要。下面就说说如何在eclipse上如何添加菜单项。 1.2 建立工程 新建eclipse插件工程 工程名自定义一下,我的工程名是com.popmenu.extend 选择下一步,在这里可以用向导给我们自动生成的,也可以建立完成之后到扩展点自己添加,这里我们选择默认的模板。
开发eclipse插件遇到的问题的时候,遇到了一个问题,纠结了好一会 最后在英文的提示中看到,必须使用eclipse rcp进行开发 Tip If you only see an "Generic" entry you most likely have not downloaded "Eclipse for RCP/Plug-in Developers".
第一章 phonegap介绍 1.1 什么是phonegap PhoneGap是一个自由开放源码的开发工具和框架,允许利用HTML + JavaScript + CSS的强大功能在多个手机平台上开发程序,开发出来的程序经过在各自的平台上编译形成独立的安装程序。
1、缓存,在持久层或持久层之上做缓存。2、数据库表的大字段剥离,保证单条记录的数据量很小。3、恰当地使用索引。4、必要时建立多级索引。5、分析Oracle的执行计划,通过表数据统计等方式协助数据库走正确的查询方式,该走索引就走索引,该走全表扫描就走全表扫描。
1、罐子满了吗 在一次关于项目管理的课上,教授在桌子上放了一个装水的罐子,然后又从桌子下面拿出一些可以从罐口放进罐子里的“鹅卵石”。当教授把石块放完后,正好堆满整个罐子。这时教授问他的学生:“你们说,这罐子现在是不是满了?” “是”所有的学生异口同声地回答说。
PORTAL是什么 portal是一个基于web的应用,它能提供个性化,单点登陆,不同源的内容聚合,和信息系统的表示层集中。聚合是整合不同web页面源数据的过程。为了提供用户定制的内容,portal可能包含复杂的个性化特征。
WSO2的应用服务器 WSO2的应用服务器是基于WSO2 Carbon平台的企业级就绪的应用程序服务器。继承的WSO2 Web服务应用服务器(WSAS),WSO2的应用服务器(AS)支持除了其Web服务管理功能的Web应用程序部署和管理。
Mvc4g是一个简单的框架来实现的GWT应用程序的MVC模式。 主要思想 其主要思想是,以减轻开发人员的工作,以单独的视图从模型。该框架是一个XML文件,将允许开发人员告诉视图发射事件时要执行什么样的行动需要配置。
Jbpm-gwt-console源码编译 从svn下载,svn的下载地址是 http://anonsvn.jboss.org/repos/soag/bpm-console/tags/bpm-console-2.
WSO2的企业服务总线(ESB)的用户指南 用户指南介绍了如何配置WSO2 ESB使用基于Web的管理控制台。 WSO2的管理控制台已经过测试的Mozilla Firefox2.0,3.0和Internet Explorer 6.
Junit测试异常事件触发 下面的示例中测试在程序中触发异常事件的流程,流程如下 测试程序 public void testTimerBoundaryEventInterrupting() throws Exception { KnowledgeBase kbase = crea...
Junit测试调用子流程 下面的示例中测试在程序中调用其它程序的子流程的示例,需要加载两个配置文件 和 需要指定属性 下面是调用的示例程序 public void testCallActivity() throws Exception { System.
在上一篇写的是消息中介,接下来是代理服务 代理服务 顾名思义,代理服务充当了WSO2 ESB服务的代理,通常是一个已经存在的服务端点,代理服务可以使用不同的传输方式。 客户可以直接发送请求代理服务的ESB,客户看到服务代理。
Junit测试或流程 下面的示例中使用的是或流程,看如下流程图 判断节点的值是大于0,大于10还是大于20 看测试程序 public void testInclusiveSplit() throws Exception { KnowledgeBase kbase = createKnowledgeBase("BPMN2-InclusiveSplit.
Junit测试评估流程 评估流程的界面如下: 这个示例里边用到了Script Task,Service Task和User Task Log执行记录日志的功能,打印出一段信息 RegisterRequest调用外部预定义的程序或者其它引擎的程序 Two调用人工任务 看一下调用的测试程...
Junit测试的mini流程helloworld 这是一个在demo中使用的Script Task做的简单示例,在执行到这个任务结点的时候自动输出"hello world" 打开BPMN2-MinimalProcess.
看几个jbpm5中带的示例程序吧,包括了很多我们在日常生活中的场景 循环示例 本示例是一个在外部传入的变量,通过传入的变量来判断循环次数的演示程序,看一下流程定义的内容 如图: 初始化的时候设置变量i的值为0,然后进入流程结点,选择的是XOR,就是异或的意思,在循环中输出变量i的值并且加1, 在后面的选择节点上判断变量i的值,如果小于count则循环继续,如果大于i那么就进行完成结点,输出结点中的内容。
eclipse插件 需求Eclipse的3.6或更新版本 Graphiti框架,使用更新站点 可以直接下载更新Graphiti http://download.eclipse.org/graphiti/updates/0.
在您好的应用程序中使用一个新的流程 流程处理 (1)你需要建立一个知识库,其中包含过程定义 KnowledgeBuilder kbuilder = KnowledgeBuilderFactory.
快速开始 首先下载jBPM,http://sourceforge.net/projects/jbpm/files/ 可以有选择性的下载: bin:jBPM的二进制文件和它们的依赖包 src:核心模块的源码 gwt-console:jBPM的控制台,包括服务端和客户端 docs:文档 ...
介绍 jBPM是一个灵活的业务流程管理(BPM)套件。这使得业务分析师和开发人员之间的桥梁。传统的BPM引擎有一个重点,是有限的非技术人员。 jBPM的有两个重点:它提供了一种方式,企业用户和开发人员喜欢它的流程管理功能。
下面通过两个示例来介绍消息中介和服务中介的最常见的使用场景。 先决条件 JDK or JRE version 1.6.x 或更高 Apache Ant version 1.7.0 或更高 消息中介 在这个示例中,ESB将用于过滤和记录日志信息。