后期補充:
為什么要用solr服務,為什么要用luncence?
問題提出:當我們訪問購物網站的時候,我們可以根據我們隨意所想的內容輸入關鍵字就可以查詢出相關的內容,這是怎么做到呢?這些隨意的數據不可能是根據數據庫的字段查詢的,那是怎么查詢出來的呢,為什么千奇百怪的關鍵字都可以查詢出來呢?
答案就是全文檢索工具的實現,luncence采用了詞元匹配和切分詞。舉個例子:北京天安門------luncence切分詞:北京 京天 天安 安門 等等這些分詞。所以我們搜索的時候都可以檢索到。
有一種分詞器就是ikanalyzer中文分詞器,它有細粒度切分和智能切分,即根據某種智能算法。
這就使用solr的最大的好處:檢索功能的實現。
使用步驟;
(1)solr服務器搭建,因為solr是用java5開發的,所以需要jdk和tomcat。搭建部署
(2)搭建完成后,我們需要將要展示的字段引入solr的庫中。配置spring與solr結合,工程啟動的時候啟動solr
(3)將數據庫中的查詢內容導入到solr索引庫,這里使用的是solrj的客戶端實現的。具體使用可以參考api
(4)建立搜索服務,供客戶端調用。調用solr,查詢內容,這中間有分頁功能的實現。solr高亮顯示的實現。
(5)客戶端接收頁面的請求參數,調用搜索服務,進行搜索。
業務字段判斷標準:
1、在搜索時是否需要在此字段上進行搜索。例如:商品名稱、商品的賣點、商品的描述
(這些相當于將標簽給了solr,導入商品數據后,solr對這些字段的對應的商品的具體內容進行分詞切分,然后,我們就可以搜索到相關內容了)
2、后續的業務是否需要用到此字段。例如:商品id。
需要用到的字段:
1、商品id
2、商品title
3、賣點
4、價格
5、商品圖片
6、商品分類名稱
7、商品描述
solr中的業務字段:
1、id——》商品id
其他的對應字段創建solr的字段。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
|
<field name= "item_title" type= "text_ik" indexed= "true" stored= "true" /> <field name= "item_sell_point" type= "text_ik" indexed= "true" stored= "true" /> <field name= "item_price" type= "long" indexed= "true" stored= "true" /> <field name= "item_image" type= "string" indexed= "false" stored= "true" /> <field name= "item_category_name" type= "string" indexed= "true" stored= "true" /> <field name= "item_desc" type= "text_ik" indexed= "true" stored= "false" /> <field name= "item_keywords" type= "text_ik" indexed= "true" stored= "false" multivalued= "true" /> <copyfield source= "item_title" dest= "item_keywords" /> <copyfield source= "item_sell_point" dest= "item_keywords" /> <copyfield source= "item_category_name" dest= "item_keywords" /> <copyfield source= "item_desc" dest= "item_keywords" /> |
重新啟動tomcat
solr 是apache下的一個頂級開源項目,采用java開發,它是基于lucene的全文搜索服務器。solr提供了比lucene更為豐富的查詢語言,同時實現了可配置、可擴展,并對索引、搜索性能進行了優化。
solr是一個全文檢索服務器,只需要進行配置就可以實現全文檢索服務。有效降低頻繁訪問數據庫對數據庫造成的壓力。
第一步:將solr部署在linux系統下。
第二步:solrj是solr的客戶端,使用它需要依賴solrj的jar包。
第三步:將數據庫的內容添加到solr的索引庫,這樣查詢就在索引庫查詢,而不是數據庫了。
controller層:
1
2
3
4
5
6
7
8
9
10
11
12
|
@controller @requestmapping ( "/manager" ) public class itemcontroller { @autowired private itemservice itemservice; @requestmapping ( "/importall" ) @responsebody public taotaoresult importallitem(){ taotaoresult result= itemservice.importallitem(); return result; } }<br>service層編寫:<br>多表查詢商品,顯示在頁面的邏輯編寫:<br>mapper.java |
1
2
3
4
5
6
7
8
9
10
|
package com.taotao.search.mapper; import java.util.list; import com.taotao.search.pojo.item; public interface itemmapper { list<item> getitemlist(); } |
mapper.xml
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
|
<?xml version= "1.0" encoding= "utf-8" ?> <!doctype mapper public "-//mybatis.org//dtd mapper 3.0//en" "http://mybatis.org/dtd/mybatis-3-mapper.dtd" > <mapper namespace= "com.taotao.search.mapper.itemmapper" > <select id= "getitemlist" resulttype= "com.taotao.search.pojo.item" > select a.id, a.title, a.sell_point, a.price, a.image, b. name category_name from tb_item a left join tb_item_cat b on a.cid = b.id </select> </mapper> |
第四步:從索引庫查詢的邏輯編寫:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
|
//從索引庫里面獲取商品信息,現在這個dao層是從索引庫獲取信息,因為之前的寫的邏輯是將db里面的數據導入到索引庫。后面的查詢都是從索引庫中進行,而不從數據庫了 @repository public class searchdaoimpl implements searchdao { @autowired private solrserver solrserver; @override public searchresult search(solrquery query) throws exception { //這是從索引庫里面,直接執行查詢 queryresponse response = solrserver.query(query); //獲取查詢的結果 solrdocumentlist documentlist= response.getresults(); searchresult result= new searchresult(); //這是獲取總記錄數 result.setrecordcount(documentlist.getnumfound()); list<item> itemlist= new arraylist<>(); //商品的高亮顯示,即當鼠標移到字上時,該字體變色,這是從queryresponse中獲取的 map<string, map<string, list<string>>> highlighting = response.gethighlighting(); for (solrdocument solrdocument : documentlist) { //每個solrdocument都是一個商品pojo的內容,所以這里要創建一個商品的pojo對象,來獲取詳細的字段 item item= new item(); item.setid((string) solrdocument.get( "id" )); //高亮顯示是title的高亮顯示 list<string> list = highlighting.get(solrdocument.get( "id" )).get( "item_title" ); string height="345" src="/uploads/allimg/210222/1143313629-1.jpg" width="764" />
延伸 · 閱讀
精彩推薦
|