对学院网站进行抓取、建索、排序、搜索、摘要显示。是Web界面。
首先利用httpclient+多线程去模拟客户端去进行获取网页的内容,然后采用jsoup+多线程来进行解析网页内容并存储本地
项目主要使用技术
Httplcient
Jsoup
多线程
数据库dao模式
IKAnanyzer
Lucene
Javascript /jQuery
Bootstrip
Web
这是从网页抓取数据,保存在本地运行程序main方法建立索引
运行Java程序 启动Tomcat 访问页面输入关键字就可以进行搜索