在互聯(lián)網步入大數(shù)據(jù)時代后,用戶行為給企業(yè)的產品和服務帶來了一系列的改變和重塑,其中最大的變化在于,用戶的一切行為在企業(yè)面前是可“追溯”“分析”的。企業(yè)內保存了大量的原始數(shù)據(jù)和各種業(yè)務數(shù)據(jù),這是企業(yè)經營活動的真實記錄。如何更加有效地利用這些數(shù)據(jù)進行分析和評估,成為企業(yè)基于更大數(shù)據(jù)量背景的問題所在。
隨著大數(shù)據(jù)技術的深入研究與應用,企業(yè)的關注點日益聚焦在如何利用大數(shù)據(jù)來為精細化運營和精準營銷服務上,但要做精細化運營,首先要建立本企業(yè)的用戶畫像。
大數(shù)據(jù)如何給用戶畫像?
要實現(xiàn)給用戶畫像,首先得知道用戶畫像是什么?
用戶畫像實際上就是把用戶信息標簽化,通過收集用戶的社會屬性、消費習慣、偏好特征等各個維度的數(shù)據(jù),進而對用戶或者產品特征屬性進行刻畫,并對這些特征進行分析、統(tǒng)計,挖掘潛在價值信息,從而抽象出用戶的信息全貌。
大數(shù)據(jù)已經興起多年,其對于互聯(lián)網公司的應用來說已經如水、電、空氣;對于人們的生活來說,也成為不可或缺的重要組成部分。從基礎設施建設到應用層面,主要有數(shù)據(jù)平臺搭建及運維管理、數(shù)據(jù)倉庫開發(fā)、上層應用的統(tǒng)計分析、報表生成及可視化、用戶畫像建模、個性化推薦與精準營銷等應用方向。
很多公司在大數(shù)據(jù)基礎建設上投入很多,也做了不少報表,但業(yè)務部門覺得大數(shù)據(jù)和傳統(tǒng)報表沒什么區(qū)別,也沒能體會到大數(shù)據(jù)對業(yè)務有什么幫助和價值。究其原因,其實是“數(shù)據(jù)靜止在數(shù)據(jù)倉庫,是死的”。
而用戶畫像正好可以幫助大數(shù)據(jù)“走出”數(shù)據(jù)倉庫,針對用戶進行個性化推薦、精準營銷、個性化服務等多樣化服務,為數(shù)據(jù)驅動運營奠定了基礎。
其次我們需要給用戶畫像建模,其實就是給用戶“打標簽”。結合數(shù)據(jù)應用體系的層級劃分(如圖1),以及給用戶打標簽的方式來看,用戶畫像一般有3種標簽類型:統(tǒng)計類標簽、規(guī)則類標簽、機器學習挖掘類標簽。
1. 統(tǒng)計類標簽
這類標簽是最基礎、常見的標簽類型。例如,對于某個用戶來說,其性別、年齡、城市、星座、近7日活躍時長、近7日活躍天數(shù)、近7日活躍次數(shù)等字段,可以從用戶注冊數(shù)據(jù)、用戶訪問、消費數(shù)據(jù)中統(tǒng)計得出。
2. 規(guī)則類標簽
這類標簽基于用戶行為及確定的規(guī)則產生。例如,對平臺上“消費活躍”用戶可以定義為“近30天交易次數(shù)≥2”。在實際開發(fā)畫像的過程中,由于運營人員對業(yè)務更為熟悉,而數(shù)據(jù)人員對數(shù)據(jù)的結構、分布、特征更為熟悉,因此規(guī)則類標簽的規(guī)則一般由運營人員和數(shù)據(jù)人員共同協(xié)商確定。
3. 機器學習挖掘類標簽
這類標簽是通過機器學習挖掘產生,用于對用戶的某些屬性或某些行為進行預測判斷。例如,根據(jù)一個用戶的行為習慣,判斷該用戶是男性還是女性;根據(jù)一個用戶的消費習慣,判斷其對某商品的偏好程度。該類標簽需要通過算法挖掘產生。
在項目工程實踐中,一般統(tǒng)計類和規(guī)則類的標簽就可以滿足應用需求,在開發(fā)中占有較大比例。機器學習挖掘類標簽多用于預測場景,如判斷用戶性別、用戶購買商品偏好、用戶流失意向等。一般情況下,機器學習標簽開發(fā)周期較長,開發(fā)成本較高,因此其開發(fā)所占比例也比較小。
用戶畫像有哪些模塊?
借助用戶畫像,我們可以對商品的銷量進行分析。比如說可以快速定位到爆款品類,進一步分析購買爆款品類的用戶在各個維度上的特征。
比如,運營人員在分析用戶購買記錄時,可以直觀地看出產品品類的銷量情況。如果運營人員想進一步了解用戶的其他特征,我們可以搭建一套完整的用戶畫像系統(tǒng),以便進行精準營銷。
一般來說,一套用戶畫像方案需要考慮8個模塊的建設(如圖2)。
用戶畫像基礎:需要了解、明確用戶畫像是什么,包含哪些模塊,數(shù)據(jù)倉庫架構是什么樣子,開發(fā)流程,表結構設計,ETL設計等。這些都是框架,大方向的規(guī)劃,只有明確了方向,后續(xù)才能做好項目的排期和人員投入預算。這對于評估每個開發(fā)階段重要指標和關鍵產出都非常重要。
數(shù)據(jù)指標體系:根據(jù)業(yè)務線梳理,包括用戶屬性、用戶行為、用戶消費、風險控制等維度的指標體系。
標簽數(shù)據(jù)存儲:標簽相關數(shù)據(jù)可存儲在Hive、MySQL、HBase、Elasticsearch等數(shù)據(jù)庫中,不同存儲方式適用于不同的應用場景。
標簽數(shù)據(jù)開發(fā):這是用戶畫像工程化的重點模塊,包含統(tǒng)計類、規(guī)則類、挖掘類、流式計算類標簽的開發(fā),以及人群計算功能的開發(fā),可有效打通畫像數(shù)據(jù)和各業(yè)務系統(tǒng)之間的通路,提供接口服務等開發(fā)內容。
開發(fā)性能調優(yōu):標簽加工、人群計算等腳本上線調度后,為了縮短調度時間、保障數(shù)據(jù)的穩(wěn)定性等,需要對開發(fā)的腳本進行迭代重構、調優(yōu)。
作業(yè)流程調度:標簽加工、人群計算、同步數(shù)據(jù)到業(yè)務系統(tǒng)、數(shù)據(jù)監(jiān)控預警等腳本開發(fā)完成后,需要調度工具把整套流程調度起來。
用戶畫像產品化:為了能讓用戶數(shù)據(jù)更好地服務于業(yè)務方,需要以產品化的形態(tài)應用在業(yè)務上。產品化的模塊主要包括標簽視圖、用戶標簽查詢、用戶分群、透視分析等。
用戶畫像應用:畫像的應用場景包括用戶特征分析、短信、郵件、站內信、Push消息的精準推送、客服針對用戶的不同話術、針對高價值用戶的極速退貨退款等VIP服務應用。
這些模塊可以有利于幫助我們更清楚地了解用戶畫像是如何從0到1搭建起來的,并以此作為提供服務、驅動用戶、將用戶畫像產品化的基礎。
怎樣做一款用戶畫像產品?
我們開發(fā)出畫像的標簽數(shù)據(jù)、搭建起畫像的整體模塊之后,如果只是“躺在”數(shù)據(jù)倉庫中,并不能發(fā)揮更大的業(yè)務價值。只有將畫像數(shù)據(jù)產品化才能更方便業(yè)務方使用,比如用戶畫像產品主要可能涵蓋到的功能模塊,以及這些功能模塊的應用場景。
畫像產品按常見的功能來看,主要包括標簽視圖與即時查詢,用戶分群,用戶人群透視分析,對用戶從事件、留存、漏斗、分布等多維度展開的深入交互式分析等模塊。下面我們詳細介紹一下畫像的產品形態(tài)。
1. 標簽視圖與查詢
標簽視圖與查詢功能主要面向業(yè)務人員使用,如圖3所示。
在平臺標簽視圖板塊中,層級化地展示了目前已經上線使用的全部用戶標簽。用戶可以層級化地通過點擊標簽,查看每個標簽的詳細介紹。
當點擊圖中“用戶屬性”這個一級類目,可進入到“自然性別”“購物性別”“用戶價值”等二級類目;點擊“自然性別”二級類目,可看到展開的“男性”“女性”三級標簽;進一步點擊三級標簽“男性”或是“女性”,可以進入查看該標簽的詳細介紹,如圖4所示。
在該標簽詳情頁中,可以查看人口屬性這一個類目下面的各個標簽覆蓋用戶量情況。
每天通過對標簽的覆蓋用戶量進行監(jiān)控,可以作為預警使用。例如:某天某個標簽的覆蓋用戶量與前一天相比出現(xiàn)了很大比例的波動,這時就需要排查該標簽當日ETL作業(yè)是否出現(xiàn)異常,或是否因業(yè)務上的操作導致標簽量級的波動。
在標簽查詢模塊中,通過輸入用戶對應的userid或CookieID,可以查看該用戶的屬性信息、行為信息、風控屬性等多維度的信息,從多方位了解一個用戶的特征。
2. 用戶分群功能
用戶分群功能主要面向業(yè)務人員使用。產品經理、運營、客服等業(yè)務人員在應用標簽時,可能不僅僅只查看某一個標簽對應的人群情況,更多地需要組合多個標簽來滿足其在業(yè)務上對人群的定義。
例如,組合“近30日購買次數(shù)”大于3次和“高活躍”“女性”用戶這3個標簽進行定義目標人群,查看該類人群覆蓋的用戶量,以及該部分人群的各維度特征。在“用戶分群”板塊下,點擊“新建人群”或編輯之前已添加的分組(如圖5),進入詳情頁可自定義涵蓋某些標簽的人群。
在自定義編輯用戶分群時,對于有統(tǒng)計值類型的標簽,可以自定義篩選該標簽的取值范圍,如“近30日購買次數(shù)”的標簽,業(yè)務人員可篩選該標簽的數(shù)值。對于分類型標簽,(如圖4)中“活躍度”標簽,業(yè)務人員選中該標簽即可圈出包含該標簽的用戶。“人群名稱”和“人群描述”表單用于業(yè)務人員描述該人群在業(yè)務上的定義,方便后續(xù)繼續(xù)查看、應用該人群。
3. 人群分析功能
人群分析功能主要是面向業(yè)務人員、數(shù)據(jù)分析師、產品經理等人群使用。
人群分析是一個根據(jù)現(xiàn)有用戶標簽圈定用戶群的功能,方便業(yè)務方從多個維度(如地域、性別、年齡、消費水平等)進一步分析該批用戶群的特征,從而為精細化運營提供支持。和用戶人群功能相似,人群分析功能首先也需要組合標簽圈定用戶群體。不同之處在于多維透視分析功能支持從多個維度去分析圈定用戶群體的特征,而用戶分群功能側重的是將篩選出來的用戶群推送到各業(yè)務系統(tǒng)中,提供服務支持。
和用戶分群功能一樣,人群分析功能也需要組合標簽篩選出目標用戶群體,創(chuàng)建起需要分析的人群。然后,在“對比維度”選擇菜單中選擇需要分析該批用戶的維度,如下單次數(shù)、活躍度。“對比維度”列表中的可選標簽也是用戶屬性、用戶行為欄目中已經構建的標簽。這樣我們就可以看到剛才篩選出來的用戶群在活躍度和下單次數(shù)上的表現(xiàn)了。
除了能透視分析單個人群在多個維度上的特征,還可以支持同時分析多個人群在不同維度上的表現(xiàn)。業(yè)務人員可以根據(jù)不同業(yè)務規(guī)則同時創(chuàng)建兩個人群,然后篩選對比維度,從多個維度上對比分析這兩個人群的特征。
用戶畫像產品化只是把數(shù)據(jù)應用到業(yè)務服務中的一個重要出口,方便業(yè)務人員分析用戶群特征,將分析后的用戶群推送到對應業(yè)務系統(tǒng)中,更方便、快捷地將數(shù)據(jù)賦能到業(yè)務場景中去。企業(yè)想要在營銷和業(yè)務增量上有更大的突破,還需要在用戶畫像的基礎上,做更多產品策略性的思考。
評論
全部評論(1705)
-
最新最熱
行業(yè)資訊 -
訂閱欄目
效率閱讀 -
音頻新聞
通勤最愛