Elasticsearch介绍
ES,是基于Lucene开发的一个分布式全文检索框架,往ES中存储和从ES中查询,格式都是JSON;
- 索引:Index,相当于数据中的Database;
- 类型:Type,相当于数据中的table;
- 主键:Id,相当于数据库中的主键;
往ES中存储数据,其实就是往ES中的Index下的Type中存储JSON数据;
Elasticsearch安装:单机版
1.安装JDK(1.8)
2.上传解压Elasticsearch-5.4.3
3.创建一个普通用户,然后将对应的目录修改为普通用户的所属用户和所属组
#es启动时需要使用非root用户,所有创建一个fly用户: useradd fly #为hadoop用户添加密码: echo 123456 | passwd --stdin fly #将bigdata添加到sudoers echo "fly ALL = (root) NOPASSWD:ALL" | tee /etc/sudoers.d/fly chmod 0440 /etc/sudoers.d/fly #解决sudo: sorry, you must have a tty to run sudo问题,在/etc/sudoer注释掉 Default requiretty 一行 sudo sed -i 's/Defaults requiretty/Defaults:fly !requiretty/' /etc/sudoers #创建一个bigdata目录 mkdir /{bigdata,data} #给相应的目录添加权限 chown -R fly:fly /{bigdata,data}
4.修改配置文件config/elasticsearch.yml
network.host: 192.168.100.211
5.启动ES,发现报错
bin/elasticsearch
#出现错误
[1]: max file descriptors [4096] for elasticsearch process is too low, increase to at least [65536]
[2]: max virtual memory areas vm.max_map_count [65530] is too low, increase to at least [262144]
#用户最大可创建文件数太小 sudo vi /etc/security/limits.conf * soft nofile 65536 * hard nofile 65536 #查看可打开文件数量 ulimit -Hn #最大虚拟内存太小 sudo vi /etc/sysctl.conf vm.max_map_count=262144 #查看虚拟内存的大小 sudo sysctl -p
6重启linux
shutdown -r now
7.通过浏览器访问ES
IP:9200
Elasticsearch安装:集群版
设置普通用户,ElasticSearch默认只能使用普通用户启动
###【在多台机器上执行下面的命令】###
#es启动时需要使用非root用户,所有创建一个fly用户: useradd fly #为hadoop用户添加密码: echo 123456 | passwd --stdin fly #将bigdata添加到sudoers echo "fly ALL = (root) NOPASSWD:ALL" | tee /etc/sudoers.d/fly chmod 0440 /etc/sudoers.d/fly #解决sudo: sorry, you must have a tty to run sudo问题,在/etc/sudoer注释掉 Default requiretty 一行 sudo sed -i 's/Defaults requiretty/Defaults:fly !requiretty/' /etc/sudoers #创建一个bigdata目录 mkdir /{bigdata,data} #给相应的目录添加权限 chown -R fly:fly /{bigdata,data}
1.安装jdk(jdk要求1.8.20以上)
2.上传es安装包
3.解压es
tar -zxvf elasticsearch-5.4.3.tar.gz -C /bigdata/
4.修改配置
vi /bigdata/elasticsearch-5.4.3/config/elasticsearch.yml
#集群名称,通过组播的方式通信,通过名称判断属于哪个集群 cluster.name: bigdata #节点名称,要唯一 node.name: es-1 #数据存放位置 path.data: /data/es/data #日志存放位置(可选) path.logs: /data/es/logs #es绑定的ip地址 network.host: 192.168.10.16 #初始化时可进行选举的节点 discovery.zen.ping.unicast.hosts: ["node-4", "node-5", "node-6"]
#出现错误
[1]: max file descriptors [4096] for elasticsearch process is too low, increase to at least [65536]
[2]: max virtual memory areas vm.max_map_count [65530] is too low, increase to at least [262144]
#用户最大可创建文件数太小 sudo vi /etc/security/limits.conf * soft nofile 65536 * hard nofile 65536 #查看可打开文件数量 ulimit -Hn #最大虚拟内存太小 sudo vi /etc/sysctl.conf vm.max_map_count=262144 #查看虚拟内存的大小 sudo sysctl -p
5.使用scp拷贝到其他节点
scp -r elasticsearch-5.4.3/ node-5:$PWD scp -r elasticsearch-5.4.3/ node-6:$PWD
6.在其他节点上修改es配置,需要修改的有node.name和network.host
7.启动es(/bigdata/elasticsearch-5.4.3/bin/elasticsearch -h查看帮助文档)
/bigdata/elasticsearch-5.4.3/bin/elasticsearch -d
8.用浏览器访问es所在机器的9200端口
http://192.168.10.16:9200/ { "name" : "node-2", "cluster_name" : "bigdata", "cluster_uuid" : "v4AHbENYQ8-M3Aq8J5OZ5g", "version" : { "number" : "5.4.3", "build_hash" : "eed30a8", "build_date" : "2017-06-22T00:34:03.743Z", "build_snapshot" : false, "lucene_version" : "6.5.1" }, "tagline" : "You Know, for Search" }
10.停用es
kill `ps -ef | grep Elasticsearch | grep -v grep | awk '{print $2}'`
#查看集群状态
curl -XGET 'http://192.168.10.16:9200/_cluster/health?pretty' http://192.168.10.16:9200/_cluster/health?pretty
参考来源:http://www.elastic.co/guide/en/elasticsearch/reference/current/setup-configuration.html
参考来源:https://github.com/elastic/elasticsearch