天天快资讯:【ES三周年】高效搜索引擎ElasticSearch介绍
ElasticSearch
简介
官网:https://www.elastic.co/cn/products/elasticsearch
(相关资料图)
特点:
高速、扩展性、最相关的搜索结果。分布式 - 节点对外表现对等,每个节点都可以作为入门,加入节点自动负载均衡。JSON - 输入输出格式是 JSON。Restful 风格,一切 API 都遵循 Rest 原则,容易上手。近实时搜索,数据更新在 Elasticsearch 中几乎是完全同步的,数据检索近乎实时。安装方便 - 没有其它依赖,下载后安装很方便,简单修改几个参数就可以搭建集群。支持超大数据:可以扩展到 PB 级别的结构化和非结构化数据。■Elasticsearch是一个基于Lucene的搜索服务器。它提供了一个分布式多用户能力的全文搜索引擎,基于RESTful web接口。
■Elasticsearch是用Java语言开发的,并作为Apache许可条款下的开放源码发布,是一种流行的企业级搜索引擎。Elasticsearch用于云计算中,能够达到实时搜索,稳定,可靠,快速,安装使用方便。
■Elasticsearch 还是高扩展、高实时的搜索与数据分析引擎。它能很方便的使大量数据具有搜索、分析和探索的能力。充分利用Elasticsearch的水平伸缩性,能使数据在生产环境变得更有价值。
ElasticSearch信息概览
什么是index,type,doc
■index:索引是文档(Document)的容器,是一类文档的集合,可以理解成我们常用的mysql中的数据库。
■Type 可以理解成mysql中的表。
■Document Index 里面单条的记录称为Document(文档)。等同于mysql中的一行数据。
建库,建表,建字段
■建库脚本
PUT http://127.0.0.1:9200/cunw-share-es-index
就这么一个请求就可以建成一个以cunw-share-es-index为库名的ES数据库索引库;
■建表脚本,建字段
PUT http://127.0.0.1:9200/cunw-share-es-index/sanbu/1
PUT http://127.0.0.1:9200/cunw-share-es-index/sanbu/1{ "name":"大哥", "sex": "男", "hight":"180", "date":"2022-01-01", "info":"Hello World"}索引基本创建完成。
什么是mapping
■mapping 是用来定义文档及其字段的存储方式、索引方式的手段,例如利用mapping 来定义以下内容:哪些字段需要被定义为全文检索类型;哪些字段包含number、date类型等格式化时间格式;自定义规则,用于控制动态添加字段的映射。
■mapping是一种简单的数据类型,例如text、keyword、integer、double、boolean、long、date、ip类型。也可以是一种分层的json对象(支持属性嵌套)。也可以是一些不常用的特殊类型,例如geo_point、geo_shape、completion。
■针对同一字段支持多种字段类型可以更好地满足我们的搜索需求,例如一个string类型的字段可以设置为text来支持全文检索,与此同时也可以让这个字段拥有keyword类型来做排序和聚合,另外我们也可以为字段单独配置分词方式,例如"analyzer": "ik_max_word"。从某种意义上来讲,就是表字段类型,int,varchar,date...
为什么要用mapping
提出疑问,修改一个字段的类型:
{ "sanbu": { "properties": { "hight": { "type": "integer" } } }}为什么不能修改一个字段的type?原因是一个字段的类型修改以后,那么该字段的所有数据都需要重新索引。Elasticsearch底层使用的是lucene库,字段类型修改以后索引和搜索要涉及分词方式等操作。
ElasticSearch 分片,副本
■数据分片:
简单来讲就是咱们在ES中所有数据的文件块,也是数据的最小单元块,整个ES集群的核心就是对所有分片的分布、索引、负载、路由等达到惊人的速度。
实列场景:
假设 IndexA 有2个分片,我们向 IndexA 中插入10条数据 (10个文档),那么这10条数据会尽可能平均的分为5条存储在第一个分片,剩下的5条会存储在另一个分片中。说白了:数据分片其实类似主流关系型数据库的表分区(分表)的概念有点类似。这样的好处是可以把一个大的索引拆分成多个,分布到不同的节点上。构成分布式搜索要注意的是分片的数量只能在索引创建前指定,并且索引创建后不能更改。
分片数量设置计算公式:
分片个数是越多越好,还是越少越好了?根据整个索引的数据量来判断。SN(分片数) = IS(索引大小) / 30,当然也要根据能够给ES分配资源的实际情况而定夺。
■数据副本
副本是主分片的拷贝,es可以设置多个索引的副本,副本的作用一是提高系统的容错性,当某个节点某个分片损坏或丢失时可以从副本中恢复。二是提高es的查询效率,es会自动对搜索请求进行负载均衡。副本分片数,可以动态的修改。增加副本数,还可以在一定程度上提高服务的可用性(读取的吞吐)。
■设置分配,副本脚本代码
PUT /index { "settings":{ "number_of_shards" : 3, //指 这个index主分片分布在3个节点上 "number_of_replicas":1 //指 每一个主分片都有一个副本 } }■查询写法
es中的查询请求有两种方式,一种是简易版的查询,另外一种是使用JSON完整的请求体,叫做结构化查询(DSL)。由于DSL查询更为直观也更为简易,所以大都使用这种方式。DSL查询是POST过去一个json,由于post的请求是json格式的,所以存在很多灵活性,也有很多形式。
最基本的查询语句,查询所有数据值得注意的是,在请求之前一定确保它是正确的Json。
{ "query": { "match_all": {} }}查询过滤条件关键字
■查询关键字的用法match,term,wildcard,range....
1.match 通过单词字面意思理解是匹配的意思,顾名思义如果匹配到其中的任意字词就会命中,其实就是通过ES默认的ik分词器去做分词查询。
{ "query": { "match": { "name":软" } }}2.term 如果匹配到其中所有字词才会命中。
{ "query": { "match": { "name":"软" } }}3.wildcard 用法类似mysql的like,注意这里的通配符是*
{ "query": { "match": { "name":"*软*" } }}4.range 看到这个词就会想到区间,它的用法类似于mysql的between ..and ..
{ "query": { "range": { "height":{ "gt": "150", "lt": "170" } } }}update,delete语句
■ 根据ID进行单个更新
POST /index/type/_id/_update{ "doc" : { "publish_date" :"2021-11-10", }}■ 根据ID进行单个删除
DELETE /index/type/_idElastic 有一条完整的产品线 ELK - Elasticsearch、Logstash、Kibana,前面说的三个就是常说的 ELK 技术栈(开源实时日志分析平台)。Logstash 的作用就是一个数据收集器,将各种格式各种渠道的数据通过它收集解析之后格式化输出到 Elastic Search ,最后再由 Kibana 提供的比较友好的 Web 界面进行汇总、分析、搜索。ELK 内部实际就是个管道结构,数据从Logstash 到 Elastic Search 再到 Kibana 做可视化展示。这三个组件各自也可以单独使用,比如 Logstash 不仅可以将数据输出到 Elastic Search ,也可以到数据库、缓存等。
关于ES的内容还有很多东西等着我们,搭建、分词器、集群、节点角色分配、冷热分离、读写分离等等,后续我们再输出相关详细内容。
Kibana
简介
Kibana 是 Elastic Stack 成员之一,它是一个基于 Node.js 的 Elasticsearch 索引库数据统计工具,可以利用 Elasticsearch 的聚合功能,生成各种图表,如柱形图,线状图,饼;而且还提供了操作 Elasticsearch 索引数据的控制台,并且提供了一定的 API 提示。您可以使用 Kibana 对 Elasticsearch 索引中的数据进行搜索、查看、交互操作。您可以很方便地利用图表、表格及地图对数据进行多元化的分析和呈现。
Kibana 可以使大数据通俗易懂。它很简单,基于浏览器的界面便于您快速创建和分享动态数据仪表板来追踪 Elasticsearch 的实时数据变化。
搭建
搭建 Kibana 非常简单。可以分分钟完成 Kibana 的安装并开始探索 Elasticsearch 的索引数据 ——— 没有代码、不需要额外的基础设施。当前我们公司使用的版本是 5.5.1。
常用模块
■ Discover
Discover 主要是做索引查询,功能非常强大。从发现页可以交互地探索ES的数据。可以访问与所选索引模式相匹配的每一个索引中的每一个文档。可以提交搜索查询、筛选搜索结果和查看文档数据。还可以看到匹配搜索查询和获取字段值统计的文档的数量。如果一个时间字段被配置为所选择的索引模式,则文档的分布随着时间的推移显示在页面顶部的直方图中。
■ Visualize
视图展示,支持许多风格。可视化能使你创造你的 Elasticsearch 指标数据的可视化。然后你可以建立仪表板显示相关的可视化。Kibana 的可视化是基于 Elasticsearch 查询。通过一系列的 Elasticsearch聚合提取和处理您的数据,您可以创建图表显示你需要知道的关于趋势,峰值和骤降。您可以从搜索保存的搜索中创建可视化或从一个新的搜索查询开始。
■ Dashboard
图表展示,一个仪表板显示Kibana保存的一系列可视化。你可以 根据需要安排和调整可视化,并保存仪表盘,可以被加载和共享。
■ Timelion
Timelion 是一个时间序列数据的可视化功能,可以结合在一个单一的可视化完全独立的数据源。它是由一个简单的表达式语言驱动的,你用来检索时间序列数据,进行计算,找出复杂的问题的答案,并可视化的结果。这个功能由一系列的功能函数组成,同样的查询的结果,也可以通过 Dashboard 显示查看。
■ Dev Tools
其实就是一个控制台,可以直接使用 DSL语法来直接操作es中的数据,使用户方便地通过浏览器直接与 Elasticsearch 进行交互。
使用
■ 搜索、查看并可视化 Elasticsearch 中所索引的数据,并通过创建柱状图、饼状图、表格、直方图和地图对数据进行分析。仪表板视图能将这些可视化元素集中到一起,然后通过浏览器加以分享,以提供有关海量数据的实时分析视图,为下列用例提供支持:
a:日志处理和分析
b:基础设施指标和容器监测
c:应用程序性能监测 (APM)
d:地理空间数据分析和可视化
e:安全分析
f:业务分析
■ 借助网络界面来监测和管理 Elastic Stack 实例并确保实例的安全。
■ 针对基于 Elastic Stack 开发的内置解决方案(面向可观测性、安全和企业搜索应用程序),将其访问权限集中到一起
如何使用
使用 Discover 搜索栏进行搜索。使用 Dev Tools 的 Console 直接与 Elastcsearch 进行交互 。DSL语法
■ 查询所有
■ 查询特定的字段,按照指定字段排序
■ 查询指定字段的日志
■ 分页查询所有的日志
本人就职于公司大数据组,正好近期我在公司分享了关于ES、Kiban和机器学习的一些知识,总结出本文献给大家。
-
2022-02-07 14:57:45
奇迹!绝杀!女足亚洲杯逆转夺冠!<
刚刚,中国女足上演逆转绝杀奇迹!她们在亚洲杯决赛中3:2力克韩国队,时隔16年再夺亚洲杯冠军!
-
2022-02-07 14:57:45
中国政府与阿根廷共和国政府签署共建“一带一路”谅解备忘录<
新华社北京2月6日电(记者安蓓)国家发展改革委6日称,国家发展改革委主任何立峰与阿根廷外交、国际贸易和宗教事
-
2022-02-07 14:57:43
中华人民共和国和阿根廷共和国关于深化中阿全面战略伙伴关系的联合声明(全文)<
新华社北京2月6日电中华人民共和国和阿根廷共和国关于深化中阿全面战略伙伴关系的联合声明一、应中方邀请,阿根廷
-
2022-02-07 14:57:40
春节假期国内旅游出游2.51亿人次<
春节遇冬奥,旅游年味浓。根据文化和旅游部数据中心测算,2022年春节假期7天,全国国内旅游出游2 51亿人次,同比
-
2022-02-07 14:57:40
中吉签署关于经典著作互译出版的备忘录 开启两国人文交流互鉴新阶段<
新华社北京2月6日电(记者史竞男)国家主席习近平6日会见来华出席北京2022年冬奥会开幕式的吉尔吉斯斯坦总统扎帕
-
2023-02-23 16:05:21
天天快资讯:【ES三周年】高效搜索引擎ElasticSearch介绍
官网:https: www elastic co cn products elasticsearch
-
2023-02-23 14:06:50
【世界独家】湖人对阵勇士 詹姆斯和戴维斯被列为大概率出战
湖人对阵勇士詹姆斯和戴维斯被列为大概率出战,湖人,勇士,中国篮球,台湾篮球,勒布朗詹姆斯,安东尼·戴维斯,勒布朗-詹姆斯,勒布朗·詹姆斯,戴...
-
2023-02-23 11:43:10
【当前热闻】医保政策进机关 惠民服务零距离——通州区医保局举办“六走进”之进机关宣讲活动
医保政策进机关惠民服务零距离——通州区医保局举办“六走进”之进机关宣讲活动为进一步加大医保政策的宣传力度,提升通州区机关干部对医保...
-
2023-02-23 10:05:06
世界快播:李荣浩的《乌梅子酱》,真的俗不可耐吗?
最近,李荣浩的这首《乌梅子酱》太火了。截至2月21日,这首歌霸榜了QQ音乐、网易云WtnfIk音乐的热歌榜和热搜第一位,其中QQ音乐同时收听人数超
-
2023-02-23 08:00:15
通讯!南麂岛风景区天气预报-南麂岛风景区
1、南麂岛为南麂列岛的主岛,是南麂列岛52个岛屿中最大的岛屿,外形似麂,头朝西北,尾向东南,四周有龙嘴头等5个呷角和国姓岙、马祖岙、火昆
-
2023-02-23 03:55:09
全球热文:易俊_对于易俊简单介绍
1、易俊。2、河南省工商联办公室二级主任科员。文章到此就分享结束,希望对大家有所帮助。
-
2023-02-22 22:40:13
当前讯息:办的笔顺规则的近义词
一、办的笔顺规则的部首1、部首:力2、笔画:43、繁体:辦4、五笔:LWI二、办的笔顺规则的笔顺5、办的笔顺规则的笔顺:
-
2023-02-22 19:58:26
热资讯!余仲君被林妙雪拿下,太牵强,《风雨送春归》与《蜗居》差距明显
在这部电视剧当中,林妙雪有着穷困的家庭,这是她转变成为反派角色的前提条件之一,但并非是唯一条件。所以,在并非原配这件事情上,即便是余
-
2023-02-22 17:53:51
世界快看点丨特朗普:世界已处三战边缘事件简单介绍
1、综合报道,特朗普21日称,我们“从未像现在这样接近第三次世界大战”。2、并称这一切罪魁祸首是以美国总统拜登为首的“腐
-
2023-02-22 15:58:24
今日热门!公开原谅老公出轨,支持小三复出,这位女巨星真是越活越飒!
“前任”跟“小三”这两个词,好像总不容易放过明星们。最近在接受记者采访的郑秀文,就被问道,“如何看待黄心颖情人节发新歌,宣布复出这...
-
2023-02-22 11:29:40
当前短讯!财政部两期国债中标结果出炉(02-22)
财政部两期国债中标结果出炉。
-
2023-02-22 07:48:03
全球即时:「私募调研记录」泰旸资产调研汤姆猫
根据市场公开信息及2月21日披露的机构调研信息,知名私募泰旸资产近期对1家上市公司进行了调研,相关名单如下:1)汤姆猫(
-
2023-02-22 03:59:51
全球快播:中小学点读笔什么牌子好_点读笔什么牌子好
1、点读笔是我们妈妈非常希望我们测评的一类产品,首先要说的是,点读笔之类的产品不能作为亲子共读的替代品,不能依赖这类产品
-
2023-02-21 22:58:28
头条:方晓斌前往马涧派出所检查指导工作
方晓斌前往马涧派出所检查指导工作2月14日下午,兰溪市公安局党委委员、交警大队长方晓斌前往马涧派出所检查指导工作。阅读隐藏边栏发布日期:
-
2023-02-21 18:11:05
天天讯息:河北乐亭:不负好春光 志愿服务助春耕
乐亭县志愿服务总队志愿者走进村民的温室大棚给黄瓜秧摘心。张俊丽摄眼下正值春耕备耕关键时节,随着气温回升,乐亭县马头营镇
-
2023-02-21 16:15:42
观焦点:大宗交易:诚达药业成交772.2万元,折价1.49%(02-21)
2023年2月21日,诚达药业发生1笔大宗交易,总成交15万股,成交金额772 2万元,成交价51 48元,折价1 49%。
-
2023-02-21 15:06:25
天天精选!两副总被查,300亿白马股触及跌停!7万股东懵圈,和宝能系有关?
” 两位副总一并被查 在公告中,中炬高新表示,张卫华、朱洪滨被立案调查并实施留置的原因,均为涉嫌严重违法。“V观财报”致电中炬...
-
2023-02-21 12:59:24
天天快消息!黄忠字汉升南阳人也_黄忠字汉升南阳人
1、黄忠,字汉升,是南阳人。2、荆州牧刘表任命黄忠担任中郎将,跟刘表的侄子刘磐一起镇守长沙攸县。3、在曹操占领荆州之后,
-
2023-02-21 08:57:19
天天时讯:北京市曝光8起医美典型案例 “国卫医院”“正德堂医疗器械”发布违法广告被罚
北京市曝光8起医美典型案例“国卫医院”“正德堂医疗器械”发布违法广告被罚
-
2023-02-21 06:12:15
全球动态:网络连接不可用是怎么回事_解决方法有哪些
欢迎观看本篇文章,小升来为大家解答以上问题。网络连接不可用是怎么回事,解决方法有哪些很多人还不知道,现在让我们一起来看看
-
2023-02-21 01:03:03
每日速读!jk少女是什么意思?
1、JK为日语流行语,意为女高中生(じょしこうせい)。JK是来自于日本流行网络用语,意为女高中生,通常指日本女高中生。也
-
2023-02-20 21:59:38
世界微资讯!小规模纳税人减免增值税会计分录怎么做_小规模纳税人减免增值税会计分录
1、分录是这么做的本月收入借:现金贷:主营业务收入
-
2023-02-20 19:13:20
环球播报:创维官方网站商城_创维官方网站
1、有的机器本身不带浏览器的就不能看新闻等,自带浏览器的就可以,很简单可以区别。2、只要机器有智能平台就带浏览器,没有就
-
2023-02-20 17:02:42
当前速读:“应小微所需,解燃眉之急” 平安普惠助力小微更“融”易
急需20万元给工人发工资的付先生联系到平安普惠咨询顾问,了解到平安普惠产品可以进行线上申请,符合条件的当天借款就能到账的情况后,付先生
-
2023-02-20 14:56:04
每日精选:Mysteel:20省份发布碳达峰实施方案,鼓励电炉短流程炼钢
据Mysteel不完全统计,截至2023年2月20日,山东、四川、云南、贵州、安徽、吉林、上海、江西、湖南、江苏、重庆、河南、广东、广西、天津、内
-
2023-02-20 10:44:30
环球实时:芝加哥农产品期价17日涨跌不一
新华社芝加哥2月17日电芝加哥期货交易所玉米、小麦和大豆期价17日涨跌不一。当天,芝加哥期货交易所玉米市场交投最活跃的3
-
2023-02-20 09:10:29
天天关注:云是怎么形成的视频_云是怎么形成的
1、我们对云并不陌生,晴朗天空里那白白的,和阴雨天那乌黑的都称作云。2、它们让天空变化莫测。3、人们常常看到天空有时碧空
-
2023-02-20 06:46:49
全球视讯!为什么上海被称为魔都 上海被称为魔都的来源
1、因为魔都是上世纪二三十年代上海的别称之一,相对于西方人对上海TheGreatestCityoftheFarEast、ParisoftheOrient的称呼,魔都是当时日本人
-
2023-02-20 02:03:21
世界动态:角钢重量规格表_角钢管理论重量表大全
1、不等边角钢理论重量|不等边角钢理论重量表|不等边角钢重量表大全不等边角
-
2023-02-19 21:56:27
短讯!紫金矿业(02899)拟回购注销160.1 万股限制性股票
紫金矿业(02899)公布,公司2020 年限制性股票激励计划部分激励对象因离