㭍葉_高分内容_个人页-阿里云开发者社区

发表了文章 2018-10-20

P, NP, NP-complete, NP-hard问题对比

图片来源于维基百科左图在假设P≠NP的情况下有效，右图在假设P=NP的情况下有效在假定P≠NP的情况下, 有 NP问题：可以在多项式时间内被验证的问题。

发表了文章 2018-10-19

循环不变式(loop invariant)

循环不变式，是指让每次循环都成立的逻辑表达式，用于证明整个算法的正确性。它通过证明循环体三条性质的正确性来证明整个算法的正确性。三条性质：初始化：循环的第一次迭代前，循环不变式为真。

发表了文章 2018-10-19

大O符号基础

大O符号(Big O notation)，又称渐进符号，是用于描述函数的渐近行为的数学符号。它是指用另一个(通常更简单的)函数来描述一个函数数量级的渐进上界。

发表了文章 2017-06-07

使用Luke Lucene进行索引

目录 luke 简介 luke下载及安装 luke 使用打开luke Overview选项卡 Documents选项卡 search选项卡 Commits选项卡 Plugins选项卡导出索引为XML 检查索引正确性总结 1. luke 简介 luke### 是一个用于Lucene/Solr/Elasticsearch 搜索引擎的，方便开发和诊断的 GUI（可视化）工具。

发表了文章 2017-05-31

玩转Apache Solr 6.5.1

以下都是基于linux环境参考链接：http://lucene.apache.org/solr/quickstart.html 目录： solr 基本命令总结 solr 命令参数详解 solr 查询语法详解 solr schema配置详解 1.

发表了文章 2017-05-31

Ubuntu 16.04 LTS下安装配置Solr-Mmseg4j

安装环境：Ubuntu 16.04 LTS; Java JDK 1.8.0 目录检查系统环境安装Apache Solr 配置solr-mmseg4j 1.

发表了文章 2017-05-25

Ubuntu 16.04 LTS下安装配置Java环境

系统版本：Ubuntu 16.04 x86 JDK版本：jdk1.8.0_131 1. 下载Java JDK文件官网网址：http://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.html .tar.gz的包是Ubuntu系统用的，.rpm是CentOS系统我是在云服务器配置的，用wget下载由于网络的原因下不全，所以在本地下好之后上传到了云服务器。

发表了文章 2017-05-22

mmseg4j中文分词包使用报告

目录认识中文分词包（下载、安装及运行）分词方法与效果分析分词算法学习分词结果提交(2017/5/24完善方法2) 基于分词结果的词云分析 1.认识中文分词包（下载、安装及运行） 1.1 简介 mmseg4j 用 Chih-Hao Tsai 的 MMSeg 算法实现的中文分词器，并实现 lucene 的 analyzer 和 solr 的TokenizerFactory 以方便在Lucene和Solr中使用。

发表了文章 2017-05-17

Scrapinghub试用报告

实验对象：scrapinghubs 实验目的：通过体验爬虫工具，进一步加深对数据检索的认识目录 scrapinghubs简介 scrapy cloud试用报告在Scrapyinghub创建工程本地配置并连接到Scrapinghub 使用scrapy cloud进行数据爬取 portia试用报告新建portia工程选择爬取实体导入scrapy cloud 总结 1.Scrapinghub简介 scrapinghub首页 *简介 scrapinghub 帮助人们将网站转化为数据。

发表了文章 2017-05-16

Scrapy采集“人民的名义”豆瓣评价实验报告

转载请注明出处！！！实验对象：豆瓣电影--人民的名义实验目的：通过使用scrapy框架采集“人民的名义”评价内容，进一步体会信息检索的过程。实验过程：分析采集实体->确定采集方法->制定爬取规则->编写代码并调试->得到数据人民的名义 ps:由于最近豆瓣发布的 Api V2测试版需要授权走oauth2，但是现在不开放key申请，所以直接爬了网页。

发表了文章 2017-05-15

Apache Tika使用报告

实验对象：Apache Tika 实验目的：通过尝试使用Apache Tika进行文件格式转换，加深对搜索引擎的理解和认识目录 Apache Tika简介配置Apache Tika运行环境用GUI图形界面进行文件格式转换的尝试用命令行使用Tika 在java工程中使用Tika 1. Apache Tika 简介 Apache Tika是一个用java编写的内容检测和分析框架，是Apache的Lucene项目的子项目。

发表了文章 2017-05-14

Scrapy采集新闻资讯实验报告

实验对象：四川大学公共管理学院官网--新闻动态页实验目的：运用Scrapy框架进行实际信息的采集以巩固和提高信息检索能力实验过程：分析采集实体->确定采集方法->制定爬取规则->编写代码并调试->得到数据 ---------------------...

发表了文章 2017-05-01

robots.txt学习笔记----以亚马逊&Github为例

目录： robots.txt简介亚马逊--robots.txt分析 Github--robots.txt分析总结 robots.txt简介介绍 robots.txt（统一小写）文件位于网站的根目录下，是ASCII编码的文本文件，用于表明不希望搜索引擎抓取工具访问的内容。

发表了文章 2017-04-30

Ubuntu 常用命令整理

目录 Ubuntu 系统更新 Ubuntu 用户管理 Ubuntu 文件管理（新增了修改文件权限） Ubuntu 软件安装 Ubuntu 搜索文件方法 lrzsz文件传输方法 Ubuntu 文件格式转换其它 Ubuntu 系统更新 sudo a...

发表了文章 2017-04-29

Linux云服务器下配置Scrapy并抓取数据

基础装备： Linux云服务器（阿里云Ubuntu 16.04）；建立远程连接的软件（这里用的是XShell）；友情链接： Scrapy入门教程：http://scrapy-chs.

㭍葉_个人页

个人介绍

擅长的技术

P, NP, NP-complete, NP-hard问题对比

循环不变式(loop invariant)

大O符号基础

使用Luke Lucene进行索引

玩转Apache Solr 6.5.1

Ubuntu 16.04 LTS下安装配置Solr-Mmseg4j

Ubuntu 16.04 LTS下安装配置Java环境

mmseg4j中文分词包使用报告

热门中文分词系统调查报告

Scrapinghub试用报告

Scrapy采集“人民的名义”豆瓣评价实验报告

Apache Tika使用报告

Scrapy采集新闻资讯实验报告

robots.txt学习笔记----以亚马逊&Github为例

Ubuntu 常用命令整理

Linux云服务器下配置Scrapy并抓取数据

P, NP, NP-complete, NP-hard问题对比

循环不变式(loop invariant)

大O符号基础

使用Luke Lucene进行索引

玩转Apache Solr 6.5.1

Ubuntu 16.04 LTS下安装配置Solr-Mmseg4j

Ubuntu 16.04 LTS下安装配置Java环境

mmseg4j中文分词包使用报告

热门中文分词系统调查报告

Scrapinghub试用报告

Scrapy采集“人民的名义”豆瓣评价实验报告

Apache Tika使用报告

Scrapy采集新闻资讯实验报告

robots.txt学习笔记----以亚马逊&Github为例

Ubuntu 常用命令整理

Linux云服务器下配置Scrapy并抓取数据

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

㭍葉_个人页

个人介绍

擅长的技术

P, NP, NP-complete, NP-hard问题对比

循环不变式(loop invariant)

大O符号基础

使用Luke Lucene进行索引

玩转Apache Solr 6.5.1

Ubuntu 16.04 LTS下安装配置Solr-Mmseg4j

Ubuntu 16.04 LTS下安装配置Java环境

mmseg4j中文分词包使用报告

热门中文分词系统调查报告

Scrapinghub试用报告

Scrapy采集“人民的名义”豆瓣评价实验报告

Apache Tika使用报告

Scrapy采集新闻资讯实验报告

robots.txt学习笔记----以亚马逊&Github为例

Ubuntu 常用命令整理

Linux云服务器下配置Scrapy并抓取数据

P, NP, NP-complete, NP-hard问题对比

循环不变式(loop invariant)

大O符号基础

使用Luke Lucene进行索引

玩转Apache Solr 6.5.1

Ubuntu 16.04 LTS下安装配置Solr-Mmseg4j

Ubuntu 16.04 LTS下安装配置Java环境

mmseg4j中文分词包使用报告

热门中文分词系统调查报告

Scrapinghub试用报告

Scrapy采集“人民的名义”豆瓣评价实验报告

Apache Tika使用报告

Scrapy采集新闻资讯实验报告

robots.txt学习笔记----以亚马逊&Github为例

Ubuntu 常用命令整理

Linux云服务器下配置Scrapy并抓取数据