Apache Solr

Apache Solr是一款搜索,可以将其部署到自己的应用或者是站点中,从而为用户提供更专业的搜索服务,软件提供全面搜索功能,所有类型的数据都可以搜索,也可以为站点内容建立索引,可以为目录建立索引,适合需要提供搜索服务的软件使用,直接将软件集成到自己的应用就可以获取搜索服务,让自己的软件基于Solr查询资源,快速搜索自己需要的数据,无论是内容检索还是为办公软件建立索引都可以通过这款软件部署相关的功能,Solr附带内置的Apache Tika,可轻松为诸如Adobe PDF,Micsoft Word等丰富的内容建立索引!

相关推荐 软件介绍 下载地址
Apache Solr官方版v8.8.0 ApacheSl是一款搜索,可以将其部署到自己的应用或者是站点中,从而为用户提供更专业的搜索服务,软件提供全面搜索功能,所有类型的数据都可以搜索,也可以为站点内容建立索引,可以为目录建立索引,适合需要提供搜索服务的软件使用,直接将软件集成到自己的应用… 点击查看
HUAWEI LiteOS Studio官方版v1.45.6 HUAWEILieOSSudi是一款编程软件,可以帮助用户在软件上设计物联网系统,用户可以通过这款软件开发物联网相关的程序,方便远程控制物联网设备,方便远程监控流量,远程读取数据,如果你需要开发华为HUAWEILieOS系统就可以下载这款软件编程,软件以该VisualS… 点击查看
正则表达式自动生成器v2.0 正则表达式自动生成器是一款简单易用的则表达式生成工具,该程序旨在帮助您将文件、网页作为源文本来快速生成正则表达式。软件具备了简单直观的作界面,导入文件或网页文件后,选择你要捕获的文本作为提取组,在组的前面、后面、里面选择限定词,随后即可一键生成。… 点击查看

Apache Solr软件功能

1、REST接口可轻松与任何语言集成。本机客户端也可用

2、按任意数量的字段和数字字段的复杂函数排序,缺少值的文档可以配置为最后(或第一个)排序

3、函数查询可根据您的数据提供强大的相关调整功能

4、先进的相关调整选项使应用程序可以微调结果以适应其苛刻的需求

5、Solr支持多种查询解析方法,可轻松查找数据

6、数十种查询类型(布尔,短语,术语,数字,字段等)在搜索时提供了强大的功能

7、开箱即用的默认默认设置可以轻松轻松获得出色的效果,而广泛的配置选项则可以轻松进行微调

8、可以轻松配置请求处理,以提供端控制并简化应用程序如何请求结果

9、广泛的过滤功能使应用程序可以控制搜索哪些内容以及何时搜索

10、多种评分(相似)方法可轻松进行实验和相关调整

11、可插拔的查询解析器意味着每个应用程序都可以提供对其用户有意义的查询接口

12、定义明确的API可捕获文档和收集级别的统计,从而轻松实现自定义相似模型

13、游标(也称为“深度分页”)启用了下一代NoSQL数据存储和分析选项

14、近实时(NRT)搜索允许几乎立即访问文档添加和更新

Apache Solr软件特色

先进的全文本搜索功能

由Lucene ™提供支持,Solr实现了强大的匹配功能,包括短语,通配符,联接,分组等等,跨任何数据类型

针对大流量进行了优化

Solr已在全球范围内得到广泛验证

基于标准的开放接口-XML,ON和HTTP

Solr使用您用来使应用程序构建快速的工具

全面的管理界面

Solr附带内置的响应式管理用户界面,可轻松控制您的Solr实例

易于监控

需要深入了解您的实例吗?Solr通过JMX发布负载数据

高度可扩展和容错

Solr建立在经过战斗测试的Apache Zookeeper之上,可轻松进行向上和向下扩展。Solr开箱即用地进行复制,分发,重新平衡和容错。

灵活且适应强,配置简单

Solr’s旨在满足您的所有需求,同时简化配置

近实时索引

想立即查看您的更新吗?Solr利用Lucene的近实时索引功能来确保您在看到内容时能够看到它

可扩展的插件架构

Solr发布了许多定义明确的扩展点,这些扩展点使插入索引和查询时间插件变得容易。当然,由于它是Apache许可的开源,因此您可以更改任何所需的代码!

需要时使用架构,不使用时使用无架构

在开始时使用Solr的数据驱动的无模式模式,在生产时将其锁定。

强大的扩展

Solr附带了可选插件,用于为丰富的内容编制索引(例如PDF,Word),语言检测,搜索结果聚类等

分面搜索和过滤

使用大量的构面算法对数据进行切片和切块

地理空间搜索

Solr内置的对空间搜索的支持使启用基于位置的搜索非常简单

先进的可配置文本分析

Solr附带了对世界上大多数广泛使用的语言(英语,中文,语,德语,法语等的支持)以及许多其他分析工具的支持,这些工具旨在使索引和查询内容尽可能地灵活

高度可配置和用户可扩展的缓存

Solr内置缓存上的细粒度控件使优化能变得容易

Apache Solr使用说明

基本搜寻

可以通过REST客户端,curl,wget,Chme POSTMAN等来查询Solr,也可以通过可用于多种编程语言的本机客户端来查询Solr。

管理员UI发送给Solr的L在上述屏幕截图的右上角附近以浅灰色显示。如果单击它,浏览器将显示原始响应。

要使用curl,请在浏览器中使用命令行中的引号提供相同的L:

curl “http://localhost:8983/solr/techpducts/select?indent=on&q=*:*”

这里发生的是我们正在使用Solr的查询参数(q)和特殊语法,该语法请求索引(*:*)中的所有文档。但是,由于存在名为的参数的默认值,因此不会将所有文档退还给我们,ws您可以在表格中看到10。您可以根据需要在用户界面或默认值中更改参数。

Solr具有非常强大的搜索选项,而本教程将无法涵盖所有这些选项。但是我们可以涵盖一些最常见的查询类型。

搜索一个词

要搜索术语,请q在“ Solr Admin UI查询”屏幕中将其输入为参数值,并替换*:*为要查找的术语。

输入“基”,再次单击“执行查询”。

如果您喜欢卷曲,请输入以下内容:

curl “http://localhost:8983/solr/techpducts/select?q=foundation”

您会看到以下内容:

响应表明有4个匹配(“numFound”:4)。我们仅在上面的示例输出中包含一个文档,但是由于4个匹配项低于ws要返回的参数默认值10,因此您应该看到所有这4个匹配项。

注意responseHeader文件之前。该标题将包含您为搜索设置的参数。默认情况下,它仅显示您为此查询设置的参数,在这种情况下,这仅是您的查询字词。

我们返回的文档包括每个已建立索引的文档的所有字段。同样,这是默认行为。如果要限制响应中的字段,则可以使用fl参数,该参数采用逗号分隔的字段名称列表。这是管理界面中查询表单上的可用字段之一。

在“ fl”框中输入“ id”(不带引号),再次单击“执行查询”。或者,使用curl指定它:

curl “http://localhost:8983/solr/techpducts/select?q=foundation&fl=id”

您应该只看到返回的匹配记录的ID。

现场搜索

所有Solr查询都使用某些字段来查找文档。通常,您想同时在多个字段中进行查询,而这是到目前为止我们对“基”查询所做的工作。这可以通过使用复制字段来实现,复制字段已通过此配置集进行了设置。在练习2中,我们将稍微介绍一下复制字段。

但是,有时您希望将查询限制为单个字段。这可以使您的查询更高效,并且结果与用户更相关。

我们的小型样本数据集中的许多数据与产品有关。假设我们要在索引中找到所有“电子”产品。在查询屏幕的q框中,输入“电子产品”(不带引号),点击执行查询。您应该得到14个结果,例如:

此搜索将在索引字段中的任何位置查找所有包含“电子”一词的文档。但是,我们可以从上面看到一个cat字段(“类别”)。如果我们仅限制搜索“电子”类别的文档,那么对于我们的用户而言,结果将更加准确。

q在管理界面的字段中更新您的查询,使其为cat:electnics。现在您将获得12个结果:

使用curl,该查询如下所示:

curl “http://localhost:8983/solr/techpducts/select?q=cat:electnics”

词组搜寻

要搜索多词组短语,请将其用双引号引起来:q=”multiple terms here”。例如,通过q在Admin UI框中的引号中输入该短语来搜索“ CAS延迟” 。

如果要跟随curl的注意,请注意,L中术语之间的空格必须转换为“ +”,如下所示:

curl “http://localhost:8983/solr/techpducts/select?q=”CAS+latency””

我们得到2个结果:

合并搜索

默认情况下,当您在单个查询中搜索多个术语和/或短语时,Solr仅要求存在其中的一个以使文档匹配。包含更多术语的文档将在结果列表中排名更高。

您可以要求在术语或短语前加上一个+;;相反,要禁止出现术语或短语,请在其前面加上-。

要查找同时包含术语“电子”和“音乐”的文档,请在“管理界面”“查询”标签+electnics +music中的q框中输入内容。

如果使用curl,则必须对+字符进行编码,因为它在L中具有保留的用途(对空格字符进行编码)。对于编码+是%2B如下所示:

curl “http://localhost:8983/solr/techpducts/select?q=%2Belectnics%20%2Bmusic”

您应该只会得到一个结果。

要搜索含有“电子”,但文件不包含术语“音乐”,进入+electnics -music在q在管理UI框。同样,对于curl,L编码+如下%2B:

curl “http://localhost:8983/solr/techpducts/select?q=%2Belectnics+-music”

这次您得到13个结果。

有关搜索的更多

我们只是简单介绍了Solr中可用的搜索选项。有关更多Solr搜索选项,请参阅“搜索”部分。

练习1总结

至此,您已经了解了Solr如何索引数据并完成了一些基本查询。您现在可以选择继续执行下一个示例,该示例将介绍更多Solr概念,例如构面结果和管理模式,或者您也可以自行删除。

如果您决定不继续本教程,那么到目前为止我们已建立索引的数据对您来说可能没有什么价值。您可以删除安装并重新开始,也可以使用bin/solr开始使用的脚本来删除此:

bin/solr -c techpducts

创建一个新:

bin/solr -c -s 2 -rf 2

要停止我们启动的两个Solr节点,请发出命令:

bin/solr stop -all

上一篇 2023-01-31

相关推荐

  • Apache Solr

    Apache Solr是一款搜索,可以将其部署到自己的应用或者是站点中,从而为用户提供更专业的搜索服务,软件提供全面搜索功能,所有类型的数据都可以搜索,也可以为站点内容建立索引...
正在提交中,请稍等片刻...

发表回复

请登录后评论...
登录后才能评论

评论列表 (0条)