超全面總結(jié)!搜索體系的建立與優(yōu)化

編者按:搜索體系由哪些元素組成?有哪些常見的功能模塊?如何建立和優(yōu)化搜索體系?這篇超全面的總結(jié)讓你系統(tǒng)認(rèn)識(shí)搜索體系。

看完本文你會(huì)學(xué)到

  • 搜索體系的組成。
  • 搜索功能常見的模塊。
  • 優(yōu)化的意義及思考。

寫在前面的話

一般來說,搜索功能按順序分三個(gè)階段:點(diǎn)擊搜索——跳轉(zhuǎn)搜索頁——搜索結(jié)果頁。

超全面總結(jié)!搜索體系的建立與優(yōu)化

接下來,我們按照流程順序一個(gè)個(gè)來說吧。

搜索前

超全面總結(jié)!搜索體系的建立與優(yōu)化

我們?cè)谑褂盟阉鞴δ芮埃紫纫业剿娜肟谠谀模栽O(shè)計(jì)一個(gè)明確,高效的入口是「登月第一步」。常見的移動(dòng)端搜索入口會(huì)放在頂部或底部,有些資訊、博客、工具類app也會(huì)出現(xiàn)懸浮按鈕式的搜索入口。

搜索中

點(diǎn)擊跳轉(zhuǎn)到搜索頁后,就可以進(jìn)行輸入了。搜索系統(tǒng)現(xiàn)分為「文本」、「圖片(掃碼)」、「音頻(識(shí)曲)」三種載體分別應(yīng)對(duì)不用場(chǎng)景下的搜索需求。頁面中會(huì)出現(xiàn)哪些模塊呢?

1. 熱詞搜索

超全面總結(jié)!搜索體系的建立與優(yōu)化

簡(jiǎn)稱熱搜,玩過微博的小伙伴們應(yīng)該對(duì)此非常了解,許許多多的流量「爆款」就產(chǎn)生在這里,這小小的方寸之間幾乎是大天朝輿論的風(fēng)向標(biāo)。

2. 關(guān)鍵詞聯(lián)想

超全面總結(jié)!搜索體系的建立與優(yōu)化

當(dāng)我們輸入某個(gè)詞或詞組時(shí),搜索系統(tǒng)往往會(huì)聯(lián)想出詞串組,幫助用戶節(jié)省輸入成本。當(dāng)然,有時(shí)候出現(xiàn)的可能是相關(guān)內(nèi)容的熱搜或是廣告投放。

3. 搜索歷史

超全面總結(jié)!搜索體系的建立與優(yōu)化

這個(gè)非常好理解,就是用戶曾經(jīng)搜索過的內(nèi)容。通常來說10條的展示量基本可以滿足用戶的使用需求,京東最多可以展示20條的搜索歷史。不過也有少的,微博只有區(qū)區(qū)兩條的展示量,估計(jì)是不想與下面熱搜入口的主要視覺區(qū)域?qū)_,稀釋流量吧。

4. 運(yùn)營(yíng)區(qū)

超全面總結(jié)!搜索體系的建立與優(yōu)化

這個(gè)模塊的名稱比較難定義,暫時(shí)叫運(yùn)營(yíng)區(qū)吧。此類模塊經(jīng)常出現(xiàn)在社交,泛娛樂類型的app中,搜索入口流量大,用戶操作密集,建立運(yùn)營(yíng)模塊/個(gè)性化定制模塊既能生產(chǎn)流量,又能導(dǎo)流。

5. 個(gè)性化內(nèi)容定制

超全面總結(jié)!搜索體系的建立與優(yōu)化

簡(jiǎn)單來說就是「猜你喜歡」,根據(jù)用戶平時(shí)產(chǎn)生的行為進(jìn)行個(gè)性化的推薦。「千人千面」就是說這樣的功能。

6. 分類

超全面總結(jié)!搜索體系的建立與優(yōu)化

通常會(huì)出現(xiàn)內(nèi)容載體/功能形式劃分比較清晰,統(tǒng)一的app中,類似于資訊類,閱讀類。有些app的分類是獨(dú)立的模塊或是一級(jí)導(dǎo)航,有些則會(huì)并入搜索中。

搜索結(jié)果

看到這里,我們來到了搜索過程的最后一步。在這個(gè)頁面上,我們通常可以看到大量的內(nèi)容按照特定的邏輯順序排列,有的順序用戶可以在篩選器中設(shè)置,比如電商app中的,按價(jià)格高低排序,銷量多少排序等等,有的則是根據(jù)業(yè)務(wù)原因排序,用戶不能改變,總體來說每個(gè)app都有自己特定的邏輯順序。在這個(gè)階段的搜索欄,通常的交互方式為上滑隱藏。當(dāng)搜索關(guān)鍵詞與搜索結(jié)果高度吻合的時(shí)候,會(huì)出現(xiàn)命定詞高顯模塊,來看下面的圖例吧。

超全面總結(jié)!搜索體系的建立與優(yōu)化

當(dāng)搜索結(jié)果出現(xiàn)異常的時(shí)候?會(huì)怎么樣呢?(不考慮404)

超全面總結(jié)!搜索體系的建立與優(yōu)化

  • 搜索結(jié)果零匹配,會(huì)出現(xiàn)一些相關(guān)詞組選項(xiàng),這些詞組通常是你給出的搜索內(nèi)容的分詞。
  • 當(dāng)你打錯(cuò)字的時(shí)候,結(jié)果頁優(yōu)先顯示正確詞組的匹配內(nèi)容。但有個(gè)前提是,其他字或詞要與相關(guān)內(nèi)容匹配度非常高,這樣才能被計(jì)算出來。

優(yōu)化思路

很多情況下用戶使用搜索功能的目的并不明確

隨著互聯(lián)網(wǎng)的高速發(fā)展,手機(jī)變得越來越「好玩」,功能很多時(shí)候就不再是簡(jiǎn)單的功能本身了。長(zhǎng)期刷微博的小伙伴們會(huì)發(fā)現(xiàn),「熱搜」模塊內(nèi)容的變更簡(jiǎn)直代表了時(shí)代的變化。從鹿晗關(guān)曉彤公開戀情,到pg one李小璐夜宿緋聞,到space x發(fā)射成功,熱搜就像是時(shí)代的風(fēng)向標(biāo),每個(gè)人都害怕錯(cuò)過熱點(diǎn),仿佛會(huì)被這個(gè)世界淘汰。在這種現(xiàn)象的背后,究竟是用戶「精神消費(fèi)」過剩?還是搜索機(jī)制的升級(jí)?我們習(xí)慣于把某個(gè)功能固定于在某個(gè)意義層面上而難以跳脫,設(shè)計(jì)搜索時(shí),我們假定用戶為「進(jìn)行帶有強(qiáng)烈目的性搜索行為」。但很多情況下,懵懵的,不曉得干什么的用戶數(shù)量也非常龐大。熱搜是一種非常棒的分流手段,我們也可以遞進(jìn)式拓展相關(guān)的模塊。比如,搜索欄下可以放置「經(jīng)常訪問博主/up/頭條號(hào)/專欄...」入口。往大膽了想,在電商app中,針對(duì)于經(jīng)常購買,瀏覽固定商家的用戶,則可以在搜索過程中變更某個(gè)固定模塊為「推送固定商家」、「類似在售商品」的信息,根據(jù)用戶的行為特點(diǎn),讓「內(nèi)容定制化」上升為「模塊定制化」,打破app模塊分配固定、難調(diào)配的局面。

搜索將會(huì)越來越智能,算法首當(dāng)其沖

首先介紹一下搜索的物理邏輯:用戶輸入信息,系統(tǒng)根據(jù)輸入的信息匹配相對(duì)應(yīng)的內(nèi)容,再按照特有的rank邏輯進(jìn)行排序展示。這個(gè)表述只是簡(jiǎn)單的介紹,如果想要知道具體的原理,還需要深入到搜索詞庫的建立。每個(gè)搜索系統(tǒng)都有一個(gè)詞庫和一個(gè)索引庫,他們之間是可以進(jìn)行快速的關(guān)聯(lián)匹配的,詞庫就好比一本書,索引庫就好比目錄,當(dāng)你心里有具體想翻閱的某個(gè)內(nèi)容時(shí),就可以根據(jù)目錄找到頁碼,匹配到相關(guān)內(nèi)容。實(shí)際上「查書」這樣的動(dòng)作就已經(jīng)構(gòu)成一個(gè)簡(jiǎn)單的搜索過程了。那么,機(jī)器檢索復(fù)雜在哪里?這邊要介紹一個(gè)新的概念:分詞。

超全面總結(jié)!搜索體系的建立與優(yōu)化

給大家看個(gè)幽默圖片輕松一下,這位老母親也是為自己的崽崽操碎了心。在圖片中,用戶輸入檢索內(nèi)容時(shí),你會(huì)發(fā)現(xiàn),這個(gè)文本結(jié)構(gòu)非常的口語化,「女兒高高胖胖穿什么好看」這更像是一個(gè)問句,很明顯用戶對(duì)于內(nèi)容沒有明確的預(yù)期。如果用這樣口語化的描述性文本在淘寶中進(jìn)行搜索,會(huì)出現(xiàn)什么樣的結(jié)果呢?結(jié)果將會(huì)是沒有匹配。

超全面總結(jié)!搜索體系的建立與優(yōu)化

既然這樣搜不到,那我們換個(gè)思路來吧,「女兒高高胖胖穿什么好看」,是不是可以換成「高個(gè)的女孩穿顯瘦服裝」這樣的文本進(jìn)行檢索呢?我們來試試看。

超全面總結(jié)!搜索體系的建立與優(yōu)化

咦,還是沒有,那我們干脆再簡(jiǎn)化字段擴(kuò)大搜索范圍吧,換成「高個(gè)女顯瘦」來搜索呢?

超全面總結(jié)!搜索體系的建立與優(yōu)化

結(jié)果匹配到了很多漂亮?xí)r尚的衣服,搜索完成。

回頭再梳理一遍過程,我們從「女兒高高胖胖穿什么好看」這樣的非結(jié)構(gòu)化文本到「高個(gè)的女孩穿顯瘦服裝」再到「高個(gè)女顯瘦」的簡(jiǎn)化過程,就是一次人工分詞操作。如果在足夠智能的搜索引擎上,這些都可以自動(dòng)完成。分詞,簡(jiǎn)單表述為:拆分濾用字符串。例如,三國(guó)的軍事家司馬懿。可以拆分為「三國(guó)」、「的」、「軍事家」、「司馬懿」這些詞組。那在分詞系統(tǒng)中,「的」、「是」、「在」是常見的停用詞,通常會(huì)被直接pass掉,詞組進(jìn)一步拆分為「三國(guó)」、「軍事家」、「司馬懿」。經(jīng)過這樣的處理,非結(jié)構(gòu)化的內(nèi)容就會(huì)轉(zhuǎn)化成結(jié)構(gòu)化的,可匹配度高的詞庫,可以輕易的匹配到想了解的內(nèi)容。說了 這么多搜索原理,那優(yōu)化思路在哪呢?這里說兩點(diǎn)自己的看法。

詞條歸一

這是針對(duì)詞庫的優(yōu)化,說到這個(gè),得介紹一下搜索系統(tǒng)匹配關(guān)鍵詞的規(guī)則「TF-IDF算法」。假如用戶在百度上搜索「蘋果」,那蘋果有很多相關(guān)的信息文檔,怎么才能準(zhǔn)確匹配呢?系統(tǒng)需要提取這些信息文檔的關(guān)鍵詞,感興趣的小伙伴可以百度公式。系統(tǒng)計(jì)算出文檔里每個(gè)詞的TF-IDF值后,然后按降序排列,取排在最前面的幾個(gè)詞與搜索詞匹配就可以得到準(zhǔn)確的匹配結(jié)果,不會(huì)出現(xiàn)我搜的是蘋果,出來的是青蘋果樂園。進(jìn)一步的還有Lucene的打分系統(tǒng),讓好的,召回率高的內(nèi)容優(yōu)先展示。說了這么多,詞條歸一到底是什么?其實(shí)就是將同一詞義的詞組歸為同一個(gè)詞,比如蘋果的別稱有「薔薇科蘋果屬果實(shí)」、「柰」、「滔婆」、「apple」、「りんごちゃん」等等,這些詞組說的都是同一個(gè)意思,所以詞條歸一就是將這些詞組歸為同一類別,擴(kuò)大匹配范圍,提高關(guān)鍵詞召回率。

更符合業(yè)務(wù)目標(biāo)的rank邏輯

我們?cè)谒阉魍瓿珊螅瑫?huì)看到搜索結(jié)果會(huì)按照特定的順序排序,再進(jìn)行展示。有些產(chǎn)品中,展示的順序是否能夠切合業(yè)務(wù)目標(biāo),會(huì)直接影響到產(chǎn)品的收益。所以,制定展示邏輯的算法要高度理解業(yè)務(wù)內(nèi)容,實(shí)時(shí)回歸業(yè)務(wù)進(jìn)行規(guī)則的更新。

歡迎關(guān)注作者的微信公眾號(hào):深知與灼見

超全面總結(jié)!搜索體系的建立與優(yōu)化

「搜索設(shè)計(jì)體驗(yàn)細(xì)節(jié)」

================明星欄目推薦================

優(yōu)優(yōu)教程網(wǎng) UiiiUiii.com 是優(yōu)設(shè)旗下優(yōu)質(zhì)中文教程網(wǎng)站,分享了大量PS、AE、AI、C4D等中文教程,為零基礎(chǔ)設(shè)計(jì)愛好者也準(zhǔn)備了貼心的知識(shí)樹專欄。開啟免費(fèi)自學(xué)新篇章,按照我們的專欄一步步學(xué)習(xí),一定可以迅速上手并制作出酷炫的視覺效果。

設(shè)計(jì)導(dǎo)航:國(guó)內(nèi)人氣最高的設(shè)計(jì)網(wǎng)址導(dǎo)航,設(shè)計(jì)師必備: http://hao.uisdc.com

收藏 10
點(diǎn)贊

復(fù)制本文鏈接 文章為作者獨(dú)立觀點(diǎn)不代表優(yōu)設(shè)網(wǎng)立場(chǎng),未經(jīng)允許不得轉(zhuǎn)載。