Solr快速入门文档阅读推荐——官方文档常用章节推荐

本文涉及的产品
Redis 开源版,标准版 2GB
推荐场景:
搭建游戏排行榜
云数据库 MongoDB,独享型 2核8GB
推荐场景:
构建全方位客户视图
云数据库 Tair(兼容Redis),内存型 2GB
简介: 本文整理了Solr常见用法涉及的基础章节列表,通过这些章节的阅读学习,同学可以零基础快速入门使用Solr,并能够满足大部分企业的业务检索需求开发,掌握了熟悉使用Solr的基本技能。

HBase用户福利

新用户9.9元即可使用6个月云数据库HBase,更有低至1元包年的入门规格供广大HBase爱好者学习研究,更多内容请参考链接

概述

本文整理了Solr常见用法涉及的基础章节列表,通过这些章节的阅读学习,同学可以零基础快速入门使用Solr,并能够满足大部分企业的业务检索需求开发,掌握了熟悉使用Solr的基本技能。
由于Solr功能丰富,插件灵活,官方文档仅做手册的编辑方式涵盖所有的功能内容描述,但众多地方还是欠缺连贯性。难做到像教科书一样,让同学从头到尾高效学习一遍。
这里整理了Solr常用功能涉及的章节列表阅读推荐,并针对具体章节概念做了简单描述,希望未接触过Solr的同学可以快速入门,节省更多的学习时间,快速实践起来。

章节推荐

完整官方文档链接如下:solr7.3完整官方文档
入门阅读可以参照如下目录:

About This Guide 了解 //默认Solr服务端口8983, 有V1/V2 两种接口访问Solr

Getting Started 了解

  • Solr Tutorial 了解 //启动solr服务,运行index/search demo
  • A Quick Overview 了解
  • Solr System Requirements 了解 //主要是看具体版本的jdk要求
  • Installing Solr 了解 //了解solr安装过程

Deployment and Operations 了解

  • Solr Control Script Reference 熟悉 //熟悉solr -help 命令脚本所提供各种管理功能
  • Solr Configuration Files 熟悉 //Cloud模式下的solrconfig.xml和managed-schema作用

Using the Solr Administration User Interface

  • Overview of the Solr Admin UI 了解 //主要熟悉Cloud模式下的Solr Admin web UI管理collection
  • Logging 了解
  • Cloud Screens 了解
  • Collections / Core Admin 了解
  • Java Properties 了解
  • Thread Dump 了解
  • Collection-Specific Tools了解

    • Documents Screen了解
    • Files Screen 熟悉
    • Query Screen 熟悉
    • Schema Browser Screen 了解
  • Core-Specific Tools

    • Ping 了解
    • Plugins & Stats Screen 了解
    • Segments Info 了解

Documents, Fields, and Schema Design 熟悉

  • Overview of Documents, Fields, and Schema Design 熟悉 //熟悉solrconfig.xml和managed-schema配置文件
  • Solr Field Types 熟悉

    • Field Type Definitions and Properties 熟悉 //理解 indexed/stored/docValues/multiValued属性
    • Field Types Included with Solr 熟悉 //理解常见类型int/long/double/float/boolean/string 相对应预定义好的类型
    • Field Properties by Use Case 了解 //了解根据业务检索用途,需要开启哪些属性的参照表格
  • Defining Fields 了解
  • Copying Fields 了解
  • Dynamic Fields 了解
  • Other Schema Elements 了解
  • Schema API 熟悉 //熟悉api修改schema配置文件的各种配置项
  • DocValues 理解//查询业务涉及到facet&function/sort 时推荐开启

Understanding Analyzers, Tokenizers, and Filters 了解

  • Uploading Data with Index Handlers 了解

    • Transforming and Indexing Custom JSON 了解

Searching 熟悉

  • Query Syntax and Parsing 熟悉

    • Common Query Parameters 熟悉
    • The Standard Query Parser 熟悉
    • Function Queries 了解 //结合facet可以做min/max/avg/sum等聚合统计
  • JSON Request API 了解
  • JSON Facet API 了解
  • Faceting 了解
  • Pagination of Results 熟悉 //场景分页实现与cursorMark深翻
  • Collapse and Expand Results 了解 //聚合分组功能,类似group by
  • Result Grouping 了解
  • Response Writers 了解
  • Near Real Time Searching熟悉 //理解commit相关配置项
  • RealTime Get 了解

SolrCloud 了解

  • Getting Started with SolrCloud 了解
  • How SolrCloud Works 了解

    • Shards and Indexing Data in SolrCloud 熟悉
    • Distributed Requests 了解
  • SolrCloud Resilience 了解

    • SolrCloud Recoveries and Write Tolerance 了解
    • SolrCloud Query Routing And Read Tolerance 了解
  • SolrCloud Configuration and Parameters 了解

    • Setting Up an External ZooKeeper Ensemble 了解
    • Using ZooKeeper to Manage Configuration Files 了解
    • Collections API 了解
    • Parameter Reference 了解
    • Command Line Utilities 熟悉
    • SolrCloud with Legacy Configuration Files 了解
    • ConfigSets API 熟悉

The Well-Configured Solr Instance 熟悉

  • Configuring solrconfig.xml 熟悉

    • IndexConfig in SolrConfig 熟悉 //SortingMergePolicy实现预排序,业务查询有固定排序需求的可以考虑
    • UpdateHandlers in SolrConfig 熟悉 //熟悉几个commit参数配置
    • Query Settings in SolrConfig 熟悉 //理解几个cache配置功能,及其应用
  • Solr Cores and solr.xml 了解

    • Format of solr.xml 了解
    • Config Sets 了解 //可以对collection配置目录管理
  • Configuration APIs了解

    • Config API 熟悉 //可以动态修改collection某个配置项

Monitoring Solr 了解

  • Configuring Logging 了解
  • Performance Statistics Reference 了解 //了解一些关系的metrics指标含义

Client APIs 熟悉

  • Choosing an Output Format 了解
  • Client API Lineup 了解
  • Using Python 了解
  • Using SolrJ 熟悉 //掌握CloudSolrClient api使用

小结

上述章节基本涵盖了大部分企业检索查询需求的功能,也是使用阿里云HBase全文服务的 Solr基础知识。如有特殊的需求,再针对性阅读官方手册即可。
我们在 solr企业业务常见各种demo与答疑 中整理了许多查询统计场景demo供参考,如有新特性欢迎评论,后续会更新相应demo,供大家使用。

链接

云HBase全文服务使用文档
solr7.3完整官方文档
solr常用检索查询业务demo

相关实践学习
lindorm多模间数据无缝流转
展现了Lindorm多模融合能力——用kafka API写入,无缝流转在各引擎内进行数据存储和计算的实验。
云数据库HBase版使用教程
  相关的阿里云产品:云数据库 HBase 版 面向大数据领域的一站式NoSQL服务,100%兼容开源HBase并深度扩展,支持海量数据下的实时存储、高并发吞吐、轻SQL分析、全文检索、时序时空查询等能力,是风控、推荐、广告、物联网、车联网、Feeds流、数据大屏等场景首选数据库,是为淘宝、支付宝、菜鸟等众多阿里核心业务提供关键支撑的数据库。 了解产品详情: https://cn.aliyun.com/product/hbase   ------------------------------------------------------------------------- 阿里云数据库体验:数据库上云实战 开发者云会免费提供一台带自建MySQL的源数据库 ECS 实例和一台目标数据库 RDS实例。跟着指引,您可以一步步实现将ECS自建数据库迁移到目标数据库RDS。 点击下方链接,领取免费ECS&RDS资源,30分钟完成数据库上云实战!https://developer.aliyun.com/adc/scenario/51eefbd1894e42f6bb9acacadd3f9121?spm=a2c6h.13788135.J_3257954370.9.4ba85f24utseFl
目录
相关文章
|
6月前
|
存储 机器学习/深度学习 人工智能
【LangChain系列】第八篇:文档问答简介及实践
【5月更文挑战第22天】本文探讨了如何使用大型语言模型(LLM)进行文档问答,通过结合LLM与外部数据源提高灵活性。 LangChain库被介绍为简化这一过程的工具,它涵盖了嵌入、向量存储和不同类型的检索问答链,如Stuff、Map-reduce、Refine和Map-rerank。文章通过示例展示了如何使用LLM从CSV文件中提取信息并以Markdown格式展示
293 2
|
6月前
|
存储 机器学习/深度学习 人工智能
【LangChain系列】第一篇:文档加载简介及实践
【5月更文挑战第14天】 LangChain提供80多种文档加载器,简化了从PDF、网站、YouTube视频和Notion等多来源加载与标准化数据的过程。这些加载器将不同格式的数据转化为标准文档对象,便于机器学习工作流程中的数据处理。文中介绍了非结构化、专有和结构化数据的加载示例,包括PDF、YouTube视频、网站和Notion数据库的加载方法。通过LangChain,用户能轻松集成和交互各类数据源,加速智能应用的开发。
369 1
|
Kubernetes 云计算 Docker
【K8S系列】深入解析 k8s:入门指南(一)
【K8S系列】深入解析 k8s:入门指南(一)
262 0
|
Kubernetes API Docker
【K8S系列】深入解析 k8s:入门指南(二)
【K8S系列】深入解析 k8s:入门指南(二)
192 0
|
中间件 C#
MasaFramework入门第二篇,安装MasaFramework了解各个模板
MasaFramework入门第二篇,安装MasaFramework了解各个模板
210 0
MasaFramework入门第二篇,安装MasaFramework了解各个模板
|
JSON 搜索推荐 Java
第三章 Elasticsearch简介
第三章 Elasticsearch简介
第三章 Elasticsearch简介
|
JSON Ubuntu 程序员
elasticsearch实战三部曲之二:文档操作
本文是《elasticsearch实战三部曲》系列的第二篇,上一篇文章我们动手熟悉了索引相关的基本操作,现在一起来熟悉文档相关的操作
189 0
elasticsearch实战三部曲之二:文档操作
|
存储 数据采集 缓存
浅述Elasticsearch开发规范指南(持续更新)(下)
Elasticsearch 是一款流行的分布式开源搜索和数据分析引擎,具备高性能、易扩展、容错性强等特点。它强化了 Apache Lucene 的搜索能力,把掌控海量数据索引和查询的方式提升到一个新的层次。 本文将根据ElasticSearch的特点和日常开发中的经验,整理了在日常使用ElasticSearch进行开发的一些最佳实践。
|
存储 缓存 自然语言处理
浅述Elasticsearch开发规范指南(持续更新)(上)
Elasticsearch 是一款流行的分布式开源搜索和数据分析引擎,具备高性能、易扩展、容错性强等特点。它强化了 Apache Lucene 的搜索能力,把掌控海量数据索引和查询的方式提升到一个新的层次。 本文将根据ElasticSearch的特点和日常开发中的经验,整理了在日常使用ElasticSearch进行开发的一些最佳实践。