搜索產品和推薦產品一樣,是策略主導的產品類型,與功能型產品相比,前者更加注重背后邏輯策略的設計,但在用戶的需求和行為的把握方面,搜索產品,或者說任何產品,面臨的要求挑戰(zhàn)都是相同的。了解你的目標用戶,通過功能或者策滿足用戶需求,追求更好的用戶體驗,是產品設計的重要目標之一。
跟其他pm一樣,需求挖掘是策略產品經理的基本功,定性定量的用戶行為分析是需求挖掘的重要方法,也是數(shù)據(jù)分析的重要方法之一,這里分析的用戶行為指的是用戶使用搜索產品的最終訴求在于找到自己想要的商品或者信息。為滿足此需求,用戶會在搜索產品留下一系列的行為軌跡信息。我們都應該聽過“方案》數(shù)據(jù)》算法”的說法,很多例子都證明,方案層的優(yōu)化往往比一味的提高算法準確率對更加有效,我們要做的用戶分析、需求挖掘是一切方案的基礎。
搜索產品在進行用戶行為分析中常用的兩種分析方法:“query分析”,“session分析”。
一.query分析
概念:query即查詢的意思,query分析指的是通過對用戶查詢詞的拆解與分析,了解用戶意圖與需求。
query分析通常會從case的定性分析入手,然后結合數(shù)據(jù)進行定量分析,最終實現(xiàn)了解用戶目的。case抽樣中,采用隨機抽樣即可,筆者在進行一次完整分析時通常抽取數(shù)量500+或1000+。
第一步:數(shù)據(jù)分析過程中,在完成數(shù)據(jù)采集及清洗過后,將數(shù)據(jù)分類整理是重要的第一步。
1.query類型劃分:
query按照不同維度可以有多種分類方法,以電商產品為例。
按照query組成結構分類:
在分析組成結構的時候要注意分詞粒度,對于電商產品,可以以索引基本單元劃分,即term級。
例如“zara兒童包包”,可以分為zara/兒童/包包:三個term的類型分別為品牌,性別,類目,這個query的類型就是品牌+性別+類目。
按照query的精準程度分類:
“zara兒童包包”與“包”對比,前者的精準程度明顯大于后者,根據(jù)query精準程度的不同,可以劃分為“泛搜索詞”與“精準搜索詞”,劃分粒度根據(jù)需求決定。
按照query是否含有不明意圖修飾詞劃分:
例如“最好看的包包”,“最好看的”就是非明確意圖的修飾詞,一般這種類型的query在電商行業(yè)比重較小。
按query是否錯誤劃分:
同音字、錯別字、輸入法錯誤導致的query錯誤,也是一種類型。
2.query類型劃分的意義:
?2.1通過抽樣調查的結果,統(tǒng)計各個類型query所占比例,了解你的搜索產品用戶需求的分布,是策略設計的前提,同時也要注意,產品設計中考慮投入產出比,并不是所有的問題都需要解決,所有的點都需要優(yōu)化,哪些問題影響面廣,優(yōu)化覆蓋率高,各個類型的query比例是優(yōu)先級的依據(jù)。明確高頻詞(頭部)、低頻詞(長尾)組成,按照基本的二八原則,可以指導很多策略的確定。這里需要注意以上幾個分類并不是獨立的,不同分類維度不同,結果存在耦合。
?2.2query組成結構代表用戶的關注點,通常電商產品用戶一般關注品牌、類目、性別、有明確意圖的修飾詞,類似:顏色、款式等,不同垂直領域會有分布差別,了解用戶關注點,才能有的放矢的匹配用戶需求。
?2.3query精準程度、需求明確程度通常反應代表用戶的購買意圖,搜索“zara兒童包包”的用戶往往比搜索“zara”的用戶購買意愿更加強烈。
?2.4包含無明確意圖的修飾詞往往代表用戶是專業(yè)內新手,無法明確表達自己的需求,當此類query過多的時候,需要考慮更多的資訊類內容進行新手的教育。
?2.5query錯誤的時候,需要糾錯、改寫策略。
第二步,query分類后續(xù)分析。
通過query分析,我們通常能得到搜索產品的需求分布與比例,但query類型劃分并不是query分析的終點,而是分類查找問題的開始。
概念:
召回:搜索查詢返回物品的過程。
召回率:返回物品的數(shù)量/數(shù)據(jù)庫內應該被召回的物品的總量。
準確率:召回物品中準確的物品數(shù)量/召回物品的總量。
F1-sorce:是統(tǒng)計學中用來衡量二分類模型精確度的一種指標,它同時兼顧了分類模型的準確率和召回率。F1-sorce是模型準確率和召回率的一種加權平均,F(xiàn)1-sorce=2*p*r/(p+r),最大值是1,最小值是0
召回率、準確率以及F1-sorce是評估策略的重要指標。
示例一個簡單的query抽樣分析:

抽樣分類后仍然需要結合定量的數(shù)據(jù)統(tǒng)計,查看抽樣case暴露出來的問題總量。
可以思考以下問題
1.哪類query召回數(shù)量少?
是否資源過少無法滿足用戶需求?是否需要通過招商配合豐富商品?
2.哪類query的召回率低?
低的原因:商品信息填寫不全導致無法命中?部分信息未建索引導致無法命中?其他技術問題?
3.哪類query準確率低?
低的原因:商品信息填寫不準確導致誤召回?商家seo作弊?技術bug?
4.哪類query平均瀏覽結果數(shù)量少?
少的原因:排序不合理?商品數(shù)量過多降低瀏覽欲望?
5.哪類query點擊/購買數(shù)量少?
少的原因:缺乏優(yōu)質/新穎商品?未召回優(yōu)質商品?排序不合理無法迅速查找目標商品?價格太貴?
……
搜索結果頁的產品展示設計問題、信息整合問題、ui設計問題都可以此逐一分析。
具體問題解決環(huán)節(jié)要從占比大、程度重的解決。
二. session分析
query分析側重從用戶在搜索過程中留下的查詢詞入手,session分析則側重用戶從進入搜索到推出搜索的整個過程分析用戶行為。
概念:
session:即會話,是指在制定的時間段內在網站上發(fā)生的一系列互動,搜索的sesion分析指的是從點擊搜索輸入框/icon至離開搜索的一些列行為。
session分析:是一種專業(yè)的數(shù)據(jù)分析,把用戶單點行為串聯(lián)成一個整體,在此基礎上進行分析,解決用戶分析中的“線”型難題。
(以上定義參考神策-張喬的文章《數(shù)據(jù)分析方法論:你真的懂session(會話)分析嗎?》)
session切割時間:session切割一向是比較模糊的難題,有很多論文論述session切割標準與方法,筆者在做搜索session分析時通常采用“離開搜索30分鐘未返回”標準切割。
搜索中用戶單點行為包括:
?輸入查詢詞
?點擊查詢
?瀏覽結果
?點擊結果
?返回結果瀑布流
?更換搜索詞
?收藏商品
?加入購物車
?購買/下單商品
……
一個session中通常包含多個單點行為,同時每個單點行為通常帶有其他信息。
舉例筆者分析通過session分析查找用戶搜索后無點擊行為的例子。
通過數(shù)據(jù)分析,發(fā)現(xiàn)搜索后無點擊行為占比比較高,分析前先做調查,搜索后無點擊原因包含常規(guī)的原因,如用戶對商品不滿意,用戶對召回結果不滿意等原因,除此之外,用戶搜索心理對點擊的影響卻很難憑空猜測,通過session分析的方法,查找其原因,尤其是用戶自身原因。
第一步:采集數(shù)據(jù)與人工整理。
數(shù)據(jù)采集可以采用第三方數(shù)據(jù)平臺,例如神策,在埋點詳細的情況下,也可直接找研發(fā),好處是可以根據(jù)自己需要靈活提取詳細數(shù)據(jù)。
本次選取包含從輸入某查詢詞點擊查詢至改寫查詢詞或者離開搜索頁過程中,無點擊結果行為的100個搜索session。

第二步:將用戶搜索意圖根據(jù)需求程度大致分類。
電商行業(yè)區(qū)別于o2o行業(yè),用戶在沒有購買轉化意愿的時候也會常常使用產品,其目的是多樣的,且每一種目的比例都很可觀。結合線下訪談與平臺特性大致劃分以下三類。
1.了解認識:出于了解行業(yè)動向了解,“換季了,新出了什么衣服”,“聽說了兩個牌子,搜搜看什么風格”,或者無意義瀏覽,類似線下的無目標逛街,打發(fā)時間,標準的“瀏覽型”用戶。
2.關注偏好:用戶對某些品牌或者商品有特定愛好,會定期查詢了解相關動態(tài)。
3.準確意圖:有具體的商品目標,通常一定要找到該目標商品,可能加入購物車或者購買,也可能最終決定放棄。這一類是典型的“購買型”用戶。
出于不同搜索目的的用戶在搜索后無點擊行為的原因是不同的,例如:出于了解認識的用戶,搜索后無點擊行為,但是如果發(fā)生瀏覽行為仍然說明本次搜索滿足了用戶需求。而出于準確意圖的用戶,搜索后無點擊則說明搜索或者商品本身是存在需要解決的重大問題。
第三步,以上分類粒度是無法滿足定位具體原因目的的,需要將用戶搜索行為按照一定的標準歸入大類,并繼續(xù)劃分次級類型,并分析每種類型背后的原因。
如何將搜索行為歸納到以上類型,并繼續(xù)劃分次級類型,以下行為標準可以參考:
1.查詢次數(shù):一次完整的搜索session通常由多次查詢組成。
2.query類型:參照上面query分析里的分類,確定意圖。
3.查詢改寫的類型:?
用戶將查詢提交給搜索引擎,然后對搜索結果進行瀏覽,如果發(fā)現(xiàn)搜索結果不能完全解決用戶的信息需求,則會根據(jù)搜索結果的啟發(fā),改寫查詢,以便更精確地描述自己的信息需求,之后重新構造新的查詢請求,如此形成用戶和搜索引擎交互的閉合回路。后續(xù)的查詢改寫是用戶逐步澄清搜索需求的一個過程。
抽象化改寫:將原來的查詢進行語義抽象,比如由“zara兒童包包”經過抽象改寫為“zara包包”,后者在語義概念層次上要更加寬泛,包含了兒童包包這個概念,之所以要做這種類型的改寫,往往是因為原先查詢找到的東西太少了,通過概念泛化增加搜索的召回率,以此方法找到更多內容。
具體化改寫:具體化改寫與抽象化改寫相反,從寬泛的語義概念下行收窄,改寫后的查詢更加具體,這么做可以更加精準的的定位查找內容。
同義化改寫:此類型改寫則保持改寫前后的查詢含義不變,比如將“兒童”改寫為“小孩”,兩者代表的含義是相同的,用戶如此改寫往往是對原先查詢的搜索結果不滿意,所以換了一種同一說法來繼續(xù)搜索。
多類型改寫:用戶在目標明確且查找意愿非常強烈而返回結果不能讓其滿意的情況下,用戶會進行反復的查詢改寫,導致一次搜索session包含多次改寫,改寫類型也不相同。
其他關聯(lián)類型:即使用戶的查詢語義并無上述邏輯,通常也不代表前后查詢毫無關聯(lián),尤其是在電商行業(yè),依然可以根據(jù)查詢詞是否存在“品牌”“類目”“顏色”“款式”等內在相同點來判斷用戶意圖的相關性和連續(xù)性。這里還有一類隱藏較深的關聯(lián)關系,例如“Sandro”與“maje”兩個品牌類型查詢詞,看似無關,了解品牌的同學可能會知道這兩個品牌都是著名的少女風格時尚品牌,因此這次的查詢改寫仍然是有關聯(lián)的。
4.瀏覽行為與點擊行為:瀏覽的深度和是否發(fā)生點擊行為往往代表用戶是否找到滿意的商品。
5.切換排序方式:搜索的結果頁提供多種排序方式,默認-按照熱度-按照價格-按照銷量-按照時間,用戶在切換排序方式的時候反應影響查找商品決策的因素。
6.篩選行為:通過篩選,縮小查詢范圍。
7.加入購物車行為與購買行為:發(fā)生加入購物車或者購買行為代表用戶找到目標商品,目標信息與第一次查詢的偏移程度也可作為用戶行為分析的內容。
用戶搜索意圖是由整個session綜合分析得到,任何單一的行為都不能完整的代表用戶意圖。
最終可形成初步結果:

以上述表格中session為例進行分析。
session1:用戶第一次查詢詞“zara兒童包包”,召回結果數(shù)=瀏覽數(shù)量,點擊次數(shù)為0,無加入購物車以及購買行為,第二次查詢改寫為“zara包包”,為抽象化改寫,這次召回商品數(shù)量為5000,瀏覽數(shù)量1000,遠多于第一次,本次發(fā)生點擊行為,但點擊商品位置排名較后。
說明用戶有明確的商品目標,第一次“zara兒童包包”召回結果數(shù)過少,未包含用戶目標商品,進行抽象化改寫后,擴大搜索范圍,找到目標商品,發(fā)生點擊,猜測可能存在目標商品無法召回問題,需分析召回問題,點擊位置說明排序存在問題,有優(yōu)化空間。
session2:用戶第一次查詢詞“chanel”,瀏覽深度大于平時瀏覽平均深度,切換過“按價格排序”,第二次改寫查詢詞為“gucci”,瀏覽深度大于平時瀏覽平均深度,無其他行為,兩次搜索都無點擊行為。
分析“chanel”與“gucci”并無風格類似等內在聯(lián)系,但都為大家耳熟能詳?shù)臒衢T奢侈品品牌,同時用戶瀏覽深度較大,可判斷是出于了解認識目的,“線上逛街”,并無明顯的優(yōu)化點,可考慮增加更多資訊信息,以及信息組織形式,滿足瀏覽型用戶“逛”的需求,用戶切換過“按價格排序”,可能屬于價格敏感性用戶,可考慮增加優(yōu)惠信息,輔助激發(fā)購物欲望。
這里面的“行為原因”就是用戶出于不同目的引發(fā)的無點擊行為原因,據(jù)本次分析,包括“了解認識_正常瀏覽”“準確意圖_懶,首次查詢輸入信息不全”等多種原因。
第四步,從問題角度匯總整理。

這樣就能完成一次session分析查找無點擊行為總結。
最終根據(jù)整理的問題,按照優(yōu)先級依次解決。
蕭飯飯,搜索推薦產品經理,WX:xiao-xiao1991,歡迎大家一同探討,共同進步~