阿里云飛天大數(shù)據(jù)產(chǎn)品價(jià)值解讀,阿里云上海飛天大數(shù)據(jù)平臺(tái)阿里云飛天大數(shù)據(jù)產(chǎn)品價(jià)值解讀演講嘉賓簡(jiǎn)介:阿里云智能高級(jí)產(chǎn)品專家——吳世龍(染天)以下內(nèi)容根據(jù)演講視頻以及PPT整理而成。觀看回放:https://yq.aliyun.com/live/43343本次分享主要圍繞以下三個(gè)方面:一、如何評(píng)估搜索質(zhì)量、體驗(yàn)與業(yè)務(wù)價(jià)值二、......
演講嘉賓簡(jiǎn)介:阿里云智能高級(jí)產(chǎn)品專家——吳世龍(染天)
以下內(nèi)容根據(jù)演講視頻以及PPT整理而成。
觀看回放:https://yq.aliyun.com/live/43343
本次分享主要圍繞以下三個(gè)方面:
一、如何評(píng)估搜索質(zhì)量、體驗(yàn)與業(yè)務(wù)價(jià)值
二、OpenSearch背景與核心能力介紹
三、典型案例
一、如何評(píng)估搜索質(zhì)量、體驗(yàn)與業(yè)務(wù)價(jià)值
1.搜索無(wú)處不在
生活中多種不同場(chǎng)景需要進(jìn)行搜索,在企業(yè)內(nèi)部產(chǎn)品中也需要使用多種搜索功能,方便用戶快捷地獲取企業(yè)相關(guān)商品、服務(wù)、內(nèi)容等信息。搜索在不同的企業(yè)業(yè)務(wù)中的角色可能有所不同。如下圖所示,搜索在電商行業(yè)是十分重要的業(yè)務(wù)流量轉(zhuǎn)化入口,在其他領(lǐng)域也必不可少。
搜索是用戶獲取信息的基礎(chǔ)手段與能力,如果搜索不好用,用戶信任度必會(huì)降低。如果搜索在某業(yè)務(wù)場(chǎng)景中使用不多,建議衡量業(yè)務(wù)的全站流量結(jié)構(gòu)。
2.評(píng)估搜索質(zhì)量、體驗(yàn)與業(yè)務(wù)價(jià)值
六成左右客戶不清楚如何評(píng)估搜索質(zhì)量、體驗(yàn)與業(yè)務(wù)價(jià)值,那么引出以下問(wèn)題。
搜索的業(yè)務(wù)價(jià)值驅(qū)動(dòng)力是什么搜索在企業(yè)內(nèi)部的業(yè)務(wù)價(jià)值驅(qū)動(dòng)一般依靠被動(dòng)的Bad case、KPI或業(yè)務(wù)需求。依靠Bad case驅(qū)動(dòng),搜索結(jié)果具有隨機(jī)性,不固定時(shí)間地點(diǎn)場(chǎng)合,搜索體驗(yàn)差。KPI指標(biāo)判斷,容易片面和不知所以然。依靠業(yè)務(wù)需求指業(yè)務(wù)方或運(yùn)營(yíng)指明將某些搜索結(jié)果置于前排,意味著結(jié)果排序相關(guān)性勢(shì)必會(huì)完全依賴于業(yè)務(wù)方經(jīng)驗(yàn)而無(wú)法客觀的保障用戶的體驗(yàn)與業(yè)務(wù)轉(zhuǎn)化,不具備可控性。以上三種業(yè)務(wù)價(jià)值驅(qū)動(dòng)方式都存在較大問(wèn)題。
目前許多企業(yè)的做法是根據(jù)上述所謂的內(nèi)部搜索業(yè)務(wù)價(jià)值驅(qū)動(dòng)力,做召回、排序、業(yè)務(wù)需求以及擴(kuò)展搜索歷史等功能。
如何衡量主觀客觀如果明確了搜索的業(yè)務(wù)價(jià)值驅(qū)動(dòng)力,如何衡量驅(qū)動(dòng)效果,即業(yè)務(wù)價(jià)值具有客觀的體系化衡量手段才有可能實(shí)現(xiàn)客觀的判斷。
下圖所列舉為一套以淘寶內(nèi)部為典型的搜索上線流程。首先需要有監(jiān)控/評(píng)估搜索用戶體驗(yàn)的方法,周期性評(píng)測(cè)用戶體驗(yàn)。通過(guò)監(jiān)控/評(píng)估明確迭代/專項(xiàng)。在上線前做一些A/B Test或灰度測(cè)試,如果沒(méi)有問(wèn)題可全量上線,并監(jiān)控線上效果。例如翻頁(yè)率下降,說(shuō)明用戶以往搜索10頁(yè)才能找到的內(nèi)容現(xiàn)在1、2頁(yè)就可以找到,搜索體驗(yàn)提升。
該鏈路是主動(dòng)監(jiān)控、評(píng)估搜索業(yè)務(wù)價(jià)值的,好的驅(qū)動(dòng)力應(yīng)該是高效的體系化的持續(xù)化的實(shí)現(xiàn)交付價(jià)值。
那么如何衡量搜索業(yè)務(wù)價(jià)值該鏈路源頭是監(jiān)控/評(píng)估能力,需要有體系化、專業(yè)的報(bào)表與評(píng)估服務(wù)。報(bào)表是客觀性數(shù)據(jù),只能反映果而不能體現(xiàn)因,評(píng)估服務(wù)是人工主觀評(píng)估服務(wù)。監(jiān)控/評(píng)估取代了所謂Bad case、KPI、業(yè)務(wù)需求,更加體系化地衡量搜索體驗(yàn)。
如下圖所示,OpenSearch報(bào)表評(píng)估提供5大維度的30+指標(biāo)。報(bào)表只能體現(xiàn)整體結(jié)果,而局部效果的評(píng)估可以根據(jù)大量指標(biāo)從不同視角得出不同結(jié)論。五大維度分為流量指標(biāo)、點(diǎn)擊類指標(biāo)、用戶分析類指標(biāo)、Query分析類指標(biāo)、成交指標(biāo),核心指標(biāo)由其提煉而來(lái)。
以往每天上班第一件事是查看關(guān)鍵指標(biāo),如發(fā)現(xiàn)可能存在問(wèn)題,需要檢查連帶影響,確保報(bào)表各項(xiàng)核心指標(biāo)正常后才會(huì)展開(kāi)其他工作。因此該體系化、專業(yè)的報(bào)表與評(píng)估服務(wù)不僅帶給客戶一種技術(shù)能力,更使客戶能夠在平臺(tái)上完整落地、驅(qū)動(dòng)搜索業(yè)務(wù)。
如何高效、可持續(xù)、體系化地交付搜索價(jià)值搜索的相關(guān)市場(chǎng)、場(chǎng)景、用戶、文化一直處于變化中,明確搜索業(yè)務(wù)價(jià)值驅(qū)動(dòng)力、衡量方式后,如何高效、可持續(xù)、體系化地交付搜索價(jià)值
與一般開(kāi)源不同,OpenSearch提供的不是需要客戶自行拼搭開(kāi)發(fā)的零散工具,而是一套完整服務(wù),一切皆為提升業(yè)務(wù)價(jià)值、體現(xiàn)大家的專業(yè)能力。OpenSearch服務(wù)主要有以下四個(gè)特點(diǎn)。第一,免運(yùn)維,客戶只需要提供數(shù)據(jù)并配置滿足自身業(yè)務(wù)訴求的策略。第二,開(kāi)箱即用,只需提供數(shù)據(jù)與配置策略,操作便捷。第三,一站式,提供搜索核心功能、擴(kuò)展功能。第四,高搜索質(zhì)量。
下圖所示為搜索上線流程,創(chuàng)建應(yīng)用、上傳數(shù)據(jù)并進(jìn)行簡(jiǎn)單調(diào)試后即可發(fā)布上線。若過(guò)程順利半天即可完成。
二、OpenSearch背景與核心能力介紹
OpenSearch是阿里巴巴自研的搜索引擎,過(guò)去一直支持并服務(wù)阿里內(nèi)部應(yīng)用,經(jīng)過(guò)千錘百煉才沉淀到可以賦能市場(chǎng)上其他企業(yè)。
搜索的核心是做召回、排序、業(yè)務(wù)需求以及功能擴(kuò)展,投入重、依賴多、周期長(zhǎng),一般企業(yè)難以投入大規(guī)模人力與資源。因此開(kāi)發(fā)性能與體驗(yàn)優(yōu)秀的搜索引擎并非易事。
召回核心模塊為分析器與查詢分析。中文博大精深,易生歧義,分詞效果至關(guān)重要。召回內(nèi)置多種分析器,分析語(yǔ)言意圖。查詢分析提供同義詞、糾錯(cuò)、詞權(quán)重、實(shí)體識(shí)別、停用詞分析等必備功能。
排序方面支持二次排序,是大數(shù)據(jù)量召回的有效解決方式。還支持類目預(yù)測(cè)、人氣模型,支持表達(dá)式以及Cava排序定制。
根據(jù)業(yè)務(wù)需求需要支持混排、打散、詞典管理等功能實(shí)現(xiàn)?;炫胖冈谒阉髡倩亟Y(jié)果中根據(jù)業(yè)務(wù)需求相應(yīng)展示視頻、文字、圖片等不同媒體類型結(jié)果。例如在淘寶搜索結(jié)果中,打散指品牌、價(jià)格等打散展示。
擴(kuò)展即功能性擴(kuò)展,如A/B Test、搜索框下拉提示、熱搜底紋(默認(rèn)搜索詞)、飄紅、Debug工具等。
召回、排序、業(yè)務(wù)、擴(kuò)展都是為了服務(wù)客戶,使客戶能以最小成本、最短時(shí)間交付高質(zhì)量業(yè)務(wù)價(jià)值而提供的能力。
1.分析器
分析器是影響搜索效果的基礎(chǔ)模塊,不同業(yè)務(wù)場(chǎng)景需要使用不同分析器,需要用戶結(jié)合自身業(yè)務(wù)場(chǎng)景自行選擇。目前OpenSearch集成了12種分析器供用戶選擇,用戶也可上傳自己的分詞詞條個(gè)性化定制分析器。
下圖所示為阿里OpenSearch電商分析器與開(kāi)源IK分析器對(duì)比數(shù)據(jù),可見(jiàn)OpenSearch分析器的分詞效果相對(duì)優(yōu)于IK開(kāi)源分析器。該對(duì)比隨機(jī)抽取100個(gè)電商類Query,下圖列舉部分結(jié)果。例如925銀耳飾,開(kāi)源IK分析器分詞有“銀耳”一項(xiàng),OpenSearch電商分詞理解顯然更優(yōu)。
2.類目預(yù)測(cè)
用戶搜索意圖可分為精搜、泛搜,類目預(yù)測(cè)即預(yù)測(cè)用戶搜索某一Query時(shí)目標(biāo)類目的結(jié)果。類目預(yù)測(cè)并非依靠個(gè)人體感,而需要符合市場(chǎng)需求,根據(jù)行為數(shù)據(jù)盡可能快速滿足用戶需求。
如下圖所示,使用類目預(yù)測(cè)前在淘寶搜索光明,可能出現(xiàn)米、面、奶等多種相關(guān)商品。而根據(jù)用戶點(diǎn)擊行為數(shù)據(jù),100個(gè)用戶搜索光明,絕大多數(shù)點(diǎn)擊的商品是光明牛奶,意味著用戶搜索光明通常是搜索光明牛奶,因此使用類目預(yù)測(cè)后前排推薦商品變化為光明牛奶。
類目預(yù)測(cè)也可使用純文本方式。
案例——雙面膠:多數(shù)時(shí)候搜索雙面膠指辦公用品,然而一段時(shí)間內(nèi)電視劇《雙面膠》很熱,出現(xiàn)了許多相關(guān)周邊產(chǎn)品。那么用戶在該階段搜索雙面膠想要的商品或許會(huì)發(fā)生變化,可通過(guò)用戶行為數(shù)據(jù)進(jìn)行類目預(yù)測(cè)。
案例——播、海賊王、柯南:“播”是一個(gè)服裝品牌,多數(shù)時(shí)候需要召回的內(nèi)容為該品牌服裝。海賊王、柯南等Query,需要根據(jù)市場(chǎng)需求,通過(guò)類目預(yù)測(cè)提供更合適的結(jié)果。
3.人氣模型
淘寶早期搜索結(jié)果排序方式非常簡(jiǎn)單,寶貝發(fā)布后上架試7天,剩余下架時(shí)間越短排序越靠前,所有賣家都有相同的機(jī)會(huì)獲得流量,對(duì)賣家、買家都相對(duì)公平。然而該模式無(wú)法將價(jià)值最大化,并不經(jīng)濟(jì)。
因此淘寶很早發(fā)布了人氣模型,盡可能與市場(chǎng)趨勢(shì)匹配,使用戶更加滿意,從而轉(zhuǎn)化為最大價(jià)值。用戶體驗(yàn)好,對(duì)優(yōu)質(zhì)賣家、商品也更公平,是當(dāng)前默認(rèn)模型。
4.熱搜底紋
三、典型案例
1.召回
下圖所示站點(diǎn)是以UGC內(nèi)容為主的論壇。由于站內(nèi)搜索用戶地域表達(dá)與文化習(xí)慣差異大,易生歧義,導(dǎo)致搜索體驗(yàn)差。因此該類搜索場(chǎng)景要求搜索引擎具備較強(qiáng)的語(yǔ)義理解能力,根據(jù)搜索和文檔的真實(shí)語(yǔ)義進(jìn)行智能匹配。
詞權(quán)重分析:如下圖所示,搜索問(wèn)題為“胎停有什么癥狀”,基于優(yōu)秀的召回質(zhì)量,通過(guò)詞權(quán)重分析能夠給出較好的結(jié)果排序。
拼寫糾錯(cuò)、同義詞擴(kuò)大召回:如下圖所示,由于用戶方言習(xí)慣等問(wèn)題,搜索關(guān)鍵詞時(shí)將“剖腹產(chǎn)”誤輸入為“拋婦產(chǎn)”,通過(guò)拼寫糾錯(cuò)等功能,仍然可以正確識(shí)別用戶意圖,提供相關(guān)內(nèi)容。
**客戶評(píng)價(jià):簡(jiǎn)單無(wú)門檻,連不懂技術(shù)的產(chǎn)品經(jīng)理都可以使用OpenSearch對(duì)業(yè)務(wù)進(jìn)行迭代,大大縮短了項(xiàng)目的迭代周期。
客戶評(píng)價(jià)2:提高效率,目前技術(shù)團(tuán)隊(duì)沒(méi)有專職優(yōu)化搜索的技術(shù)人員,只是根據(jù)項(xiàng)目需求做臨時(shí)優(yōu)化即可,省力省心。**
2.技術(shù)類內(nèi)容社區(qū)
某國(guó)內(nèi)最大的中文IT內(nèi)容社區(qū),涉及眾多業(yè)務(wù)場(chǎng)景,由于是技術(shù)類內(nèi)容社區(qū),需要提供強(qiáng)大、優(yōu)秀的搜索服務(wù)。
該社區(qū)花一年時(shí)間基于開(kāi)源自建搜索服務(wù),效果不佳。因此該社區(qū)試行OpenSearch。
下圖所示為基于開(kāi)源自建搜索服務(wù)與基于OpenSearch服務(wù)的搜索效果對(duì)比。搜索同一關(guān)鍵詞Win10重裝,可見(jiàn)基于OpenSearch服務(wù)的搜索語(yǔ)義理解更優(yōu),提供的搜索結(jié)果相關(guān)性更高。
由于該社區(qū)搜索詞專業(yè)垂直度高,通用分詞不足以支持,需要自定義詞典,并結(jié)合了阿里NLP通用Query智能分析+人氣模型。
效果:對(duì)比基于開(kāi)源自建的搜索服務(wù)CTR提升80%+,對(duì)比友商CTR提升3%。
特別聲明:以上文章內(nèi)容僅代表作者本人觀點(diǎn),不代表ESG跨境電商觀點(diǎn)或立場(chǎng)。如有關(guān)于作品內(nèi)容、版權(quán)或其它問(wèn)題請(qǐng)于作品發(fā)表后的30日內(nèi)與ESG跨境電商聯(lián)系。
二維碼加載中...
使用微信掃一掃登錄
使用賬號(hào)密碼登錄
平臺(tái)顧問(wèn)
微信掃一掃
馬上聯(lián)系在線顧問(wèn)
小程序
ESG跨境小程序
手機(jī)入駐更便捷
返回頂部