離開派代好久了,之前一直在忙其他的項目和幫京東搜索部門組建搜索反饋群的事情,一直也沒多少時間,很多人加我QQ咨詢一些問題,有時候因為時間的因素也沒有給予詳細的解答,心中有愧,趁著夜深人靜的時候整理下思緒,從淺到深的普及一下京東的搜索知識以及最近京東的一些變革。對一些基礎的小白問題,請允許我貼一些資料~最近的變革也會穿插其中。

  一、最常問的搜索多久更新?很多人搞不明白,下面所說的情況不包含系統故障。

  搜索上更新分為兩部分:增量更新和全量更新(兩者不沖突)。

  增量更新:商品組及時將消息發送到搜索,搜索將接受到的消息更新。一般10-30分鐘內即可被搜索到。

  全量更新:搜索每天都會對搜索的數據庫重新建索引,保證在數據庫中的數據都更新(下午6點離線(不影響線上)開始生成數據,再推送到線上,期間時間較長,第二天PC、列表、其它所有客戶端9點前都會基本完成更新)。

  A:

  1. 上架成功后,一般是半個小時內(沒有勾選“上柜不展示”,去除此勾選是第二天被索引,若在18點后去除則是第三天被索引)即可被索引到,最遲第二天被索引(增量沒接到消息時通過全量更新)。

  2. 下架成功后,立刻--10分鐘后不再被搜索到

  3. 庫存變更后,立刻—30分鐘可以被搜索識別到新庫存

  4. 價格變動后,立刻—10分鐘可以被搜索識別到新價格

  5. 銷量、金額,搜索反饋等第二天更新

  6. 配送區域、限購區域等第二天更新

  7. 圖片、屬性區(品牌等)、標簽第二天更新

  8. 店鋪內的分類第二天更新。

  9. 基礎廣告詞第二天更新(最好白天更新,因廣告詞單獨邏輯,每天都是晚上讀數據庫)。

  10. 價格模型數據每周更新一次(搜索頁周二/列表頁周一更新),品牌模型數據(依賴于商品表和訂單表)每天更新。

  二、Q:不同顏色、不同尺寸的SKU都可以搜索到嗎?

  A:

  1、 SKU只有顏色時,所有顏色的SKU都可以搜索到

  2、 SKU有顏色和尺碼時,同顏色可以搜到一個尺碼,是15日銷量最大且有庫存的,其他尺碼也可索引,但前端展示還是銷量最大且有庫存的。

  3、 SKU顏色為空,只有尺碼時,所有尺碼都可以被搜索到。

  備注:

  1、此處“庫存”數據第二天更新

  2、上架當天同顏色不同尺碼全部能搜索到,當全量更新后識別同顏色不同尺碼中有庫存且銷量最大的。

  3、同一個商品的相同顏色只能索引一個顏色。

  三、Q:商品的哪些信息可以被搜索到?

  A:搜索首先需文本匹配,而不是商品所有信息的文本都可被搜索,不同品類被索引的字段不同,如下:

  3C和日百品類:商品名稱、品牌、同義詞、三級分類(AB、A/B分類不索引如奶瓶奶嘴、戒指/耳飾)、擴展屬性、基礎廣告詞、店鋪名稱、店鋪ID、顏色、尺碼(3C顏色和尺碼除外)、3C規格參數(型號|顏色|操作系統|網卡|核心數|推薦用途|適用機型|適用型號|打印機類型|聲道系統|定頻/變頻|自動化程度|類別|主板兼容|適用范圍|接口類型|散熱器類型|核心|攝像頭|CPU核數|CPU型號|CPU類型)、送禮搜索、大家說。

  圖書音像品類:

  圖書商品系列名稱、圖書商品出版商、圖書商品作者、圖書商品譯者、圖書商品外文名稱、圖書商品編輯、圖書商品美編、同義詞字段、店鋪名稱、擴展屬性、書寫、高級關鍵詞、二級分類名(后續會替換成三級分類)、ISBN。

  音像商品系列名稱、音像商品導演、音像商品演員、音像商品外文名稱、音像商品出版社、音像商品演唱者、音像商品表演者、音像商品錄制者、同義詞字段、二級分類名稱、店鋪名稱、擴展屬性、產品評級、廠牌、發行公司、介質、作詞、作曲、編劇、指揮、知名樂團、演奏、又名、高級關鍵詞。

  行動建議:在不影響現有的正確搜索結果,采銷若需添加新的索引字段,請提供相關的數據給搜索評估(依據:對現有搜索結果帶來正向影響)。

  四、Q:為什么我關心的商品沒被搜索到?

  A:

  1、 新品上架最遲第二天才能被索引到,請先確認是否上架成功,另外是否后臺設置了上架不展示(圖書分類無上柜不展示)。

  2、 確認搜索的關鍵詞,在商品已被索引的字段中包含。

  3、 用商品的全稱(標題所有文本)去搜索,看是否可以搜出來。因有時短詞搜索你關注的商品可能因銷量等數據很少而排在后面,不容易被發現。

  4、 同顏色不同尺碼只索引銷量最大且有庫存的SKU,其他SKU的文本也可被索引,但展示的是銷量最大且有庫存的SKU;

  5、 被識別品牌作弊的SKU,在搜索品牌庫中的品牌詞時被過濾;

  6、商品需正確綁定品牌;

  7、“送XX禮物”、“XX禮物”等搜索詞會觸發搜索送禮邏輯,反饋中有這些字段(即評價中出現2次以上)的才會被索引(只在標題等含有這些字段是不行的)。

  8. 店鋪內分類綁定需再第二天才能被索引;

  9. 搜索結果超3W會被截斷(文本+商品質量分),但搜索頁數只展示100頁(解決點擊篩選后頁數變多的體驗問題)。

  五、 Q:為什么我關心的商品排名突然下降很大?

  A:

  1. 先確保用商品全稱是否搜索到(單純修改詳情頁不會影響排名);

  2. 當前用戶所在城市無庫存的商品降權,請先查看當前訪問jd.com的用戶所在地,確認該商品在本地區是否有貨

  3. 搜索規則是根據各個因子的數據來綜合排名,若數據發生變化,排名也會變化:如搜索計算的是3日和15日完成銷量數據,若計算周期內商品銷量數據已不再像前一天那么高則排名自然會受到影響;若在前一天計算權重時,與競爭對手銷量差不多,但轉換率和好評率競爭對手有量變到質變的提高,則商品排名也會受影響。(排除搜索系統異常)

  4. 作弊商品會被降權;

  5. 價格模型對商品排名也有影響。(價格模型每周二晚更新,周三排名有可能下降)

  6. 店鋪穿插會使某些店鋪的展示數有所下降,但是會提升前幾頁的資源分配。

  7. 商品的上下架有時也會影響當天的排名(商品質量分,此權重在下午2-4點計算,若在此時間段上下架,會計算不到當天的商品質量分,但取不到商品質量分時,搜索會默認為是新品賦予一個權重值=3),第二天會恢復正常。

  8. 若修改了商品銷售屬性(如A商品無尺碼,商家增加B商品時,給A商品多添加了尺碼)導致SKUID變化會影響排名(不管修改什么屬性,只要SKUID不變,商品排名就不會受太大影響,除非商品更換分類)。

  9.最近正在分批上線的品牌模型和人氣模型,以及京東系統AB,不包含系統故障因素。

  ======================================================

  以上是針對最近提問一些比較多的基礎的問題,下面說下京東搜索優化的一些重要知識點。

  1、高相關分類:我們大家都知道京東的搜索是有高相關分類一說的,高相關分類顧名思義就是和搜索關鍵詞相關性最高的三級類目,此三級類目會在搜索的時候優先展現,這個是系統根據很多緯度的數據計算出來的,并不是人為的。

  以關鍵詞“紅豆”為例,紅豆是一種食材,同時這個詞也是一個男裝品牌的名稱,那么在京東搜索的時候會優先什么類目呢,大家可以自己搜索下試試。系統判斷“米面雜糧”類目更適合展現給消費者,對平臺的GMV更有利,所以會優先展示米面雜糧類目的產品,而不展示男裝類目。關于這塊,可以使用第三方工具“老板通”查詢。

  2、文本相關性:京東會對平臺產品建立索引,然后當消費者搜索的時候,系統就會根據索引進行召回,并根據文本相關性得分進行排序,這是整個搜索系統工作的大概流程。那么系統會索引產品的那些屬性呢?給大家總結下:

  a、標題

  b、副標題廣告詞

  c、品牌

  d、商品屬性

  e、銷售屬性

  f、詳情文字

  g、評價內容及標簽

  h、店鋪名稱

  

  大家可以根據以上總結的點來對自己的產品和店鋪來進行針對性的優化,思考怎么讓系統在消費者進行搜索的時候會對你的信息進行召回。

  那怎么知道消費者會對哪些詞進行搜索呢,可以參考一些行業數據,比如數據羅盤的熱搜詞或者老板通的關鍵詞以及類目數據查詢,可以直接看到類目或者指定關鍵詞每天的成交單數,這個數據是過濾之后的,可以以此推算某個關鍵詞對應位置的所需的刷單單量。

  前八的坑位平均所需單量計算公式:單天整詞訂單量*0.9*0.4/8

  0.9為第一頁成交單量占比,0.4為前八成交量在第一頁的占比,8為坑位數

  這個系數是全平臺平均,某些類目可能有偏差,但誤差不大。

  建議可以把行業數據全部拉出來,做成表格,包含搜索量、成交量、客單、在競商品數、前八所需單量等多列對比緯度,來對關鍵詞進行判斷,以達到減少投入增大效果的目的。

  

  3、價格模型:京東于九月份基本全類目上線了價格模型,目前是第一階段的價格模型,二階段的多區間帶價格模型預計明年才能和大家見面了,先說一階段價格模型,這個是比較簡單的,就是如果你的產品售價在系統給予的高權重價格區間內,你的產品就可以獲得加權,只要在區間內,不分價格高低,權重都一樣,在區間內再進行分段就是二階段價格模型了。京東明年的方向會主抓品牌這塊,整個平臺會對優質的產品進行資源傾斜,其中在搜索這塊,能體現產品優質的一個系統判別緯度就是高價,那么這塊就很容易做了。

  可以不斷的給自己的產品加價,然后刷新看排名,自己把握這個度,別一雙襪子都加到一百多,排名上去了也賣不掉,這種情況是真是出現過。價格模型是每周二進行更新,周期7天。

  4、標題優化:標題優化說幾點技巧

  a、標題內的括號“()”內的內容是不計入標題長度的,一些不重要的說明信息可以寫在里面

  b、副標題可以被索引,可以展示在搜索結果頁,優惠信息等可以寫在這,并且可以展現在搜索頁

  c、標題越短越好是沒錯的,權重高是一個,第二是搜索可以看到副標題,空格是不計入長度的,但如果想做完全匹配的詞,建議加空格,比如“風衣 女”,消費者喜歡加空格搜索或者搜索下拉框就是帶空格的,那么建議加空格,因為系統優先召回完全匹配

  d、同義詞縮減,比如“女士”和“女”在京東系統眼里,他倆是一樣的,沒區別,可以直接寫成“女”以縮短標題。

  e、最好不要堆砌關鍵詞,標題長權重低不說,被抓到要扣分,雖然被抓的比較小,建議把所有想做的詞拉出來之后,進行拼裝縮減,詳情見我以前寫的帖子(半途而廢了,不好意思)。

  5、流量入口概況:目前京東的流量入口分兩大塊

  PC:搜索+類目列表頁

  移動端:APP+M端+微信+手Q

  搜索成交訂單量在這兩大端口的成交量都在一半以上。說兩點關于這塊的事情:

  a、移動端的微信和手Q的類目列表頁其實不是和APP一樣的,他們的類目頁其實是某些關鍵詞的搜索頁,大家可以自己試試,如果拿到這些詞在PC的排名,相當于微信和手Q的類目也拿到了。(目前是這樣)

  b、移動端和PC端的排名正在進行拆分,已經有個別類目拆分完成了,還有正在進行測試的,數據源用的還是一樣的,但是應用模型不一樣,以后大家做排名可能就要分開做了。

  

  6、人氣模型:人氣模型原本計劃Q3全品類上線,目前還沒有做到,但也差不多覆蓋一半的類目了。人氣模型上線后和之前的商品質量得分還是比較大的,主要體現在:

  a、周期評論增加數替代總評論數計算權重

  b、刪除提換貨率、跳失率和訪問時間

  c、新增緯度關注數、加入購物車和訪問深度

  7、品牌模型:品牌模型已于618之前上線,這就是為什么有些類目,某些評論很少的產品可以排在最前面,就是品牌模型在起作用。品牌模型主要考核的一些點有:

  a、擴展區點擊量

  b、搜索量

  c、GMV

  d、銷量

  e、單價

  8、店鋪模型:店鋪模型的主要作用是進行資源平均,避免一個店鋪的產品扎堆顯示,造成消費者的選擇疲勞,同一個店鋪的產品會被系統強制穿插,意思就是原則同一個店鋪有兩個產品可以排在第一和第二的,店鋪模型應用后,只能是第一和第五。

  9、個性化搜索:這個還在開發。。。不知道什么時候上線,不過已經應用在一些推薦位了,例如感興趣,最佳組合等。

  10、新品模型:顧名思義,新品有加權周期30天,搜索新品加權相同。

  11、季節模型

  太晚了,就到這了,后面再接著寫,關于最新反作弊這塊的。