當前位置 > 首頁 > 會員服務 > CPDA數據分析師優秀原創文章:運用數據分析方法提升電信存量用戶捆綁率的研究

CPDA數據分析師優秀原創文章:運用數據分析方法提升電信存量用戶捆綁率的研究

來源:中國數據分析行業網 | 時間:2019-09-23 | 作者:數據委

作者:武漢 CPDA數據分析師:李毅、王月皎、李純、郭軼、劉莎、王荊

 

一、研究現狀和發展趨勢

存量用戶價值問題已越來越受到電信運營商的重視。隨著移動通信與其相關行業互相融合,利用新技術、新項目以及應用需求滿足當前人們的生活需求,人們享受到互聯網時代移動通信技術發展帶來的優質用戶體驗。在新的5G時代,客戶價值將成為競爭焦點,對存量價值客戶的爭奪將成為新賽場。

 

二、大數據時代存量用戶價值提升的方式

(一)存量經營的涵義

存量經營囊括了運營商除拓展新客戶外的大部分經營活動,除了前端的市場活動,還包括后端的支撐活動(如網建、網優、IT系統完善等)。表現為運營商針對現有客戶,以提升客戶忠誠度、釋放客戶價值為目的的一系列經營方針和策略,主要是通過客戶信息挖掘、精細化管理、差異化服務來實現客戶保有和價值提升,體現出運營商對流失率的控制,除了要留住客戶,還要對客戶的價值進行挖掘和提升。隨著用戶市場日趨飽和,用戶增量市場的空間不斷減少、增速日益放緩,運營商對存量市場的依賴程度將不斷增加。

 

(二)精準營銷流程

精準營銷不但提高了營銷的準確率和命中率,同時也提高了服務水平。基于運營商的用戶大數據,通過大數據挖掘、機器學習等方式進行數據價值的獲取,具體營銷流程見下圖。

圖1:精準營銷流程

 

三、基于聚類分析的客戶細分模型建立與評估

細分客戶可以幫助運營商更加精準的了解客戶的消費行為,了解客戶的特征。對客戶按照一定的標準進行劃分,實現對市場精準的分割,實現精準營銷。

 

(一)提取用戶畫像

用戶畫像即商業目的下用戶標簽的集合。運營商制定自有的標簽體系,并對用戶的語音和流量使用情況進行數據統計和分析,從而確定用戶所匹配的相應標簽。用戶標簽可以分為兩部分,一是自然標簽,包括用戶的基礎信息、性別、年齡、家庭住址等,二是用根據用戶的基礎信息和行為數據的歸納和分析而來的特征標簽,如最常用的APP、最喜歡的電商網站等等。根據用戶的基礎信息和行為信息,對用戶進行360度的屬性特征和行為偏好畫像。用戶標簽產品能全方位的了解用戶行為特征,為鎖定潛在目標用戶群、營銷決策等提供數據支撐基礎。

 

(二)數據維度與樣本量的確定

本文所用實驗取公司數據服務支撐平臺的用戶數據為樣本。根據電信用戶特點,針對性的選取了用戶屬性,剔除了無效的屬性,因數據維度較低,無需對數據做降維處理。根據電信業務經營的常識,結合本次實驗的需要,在數據選取時將遵從以下兩條原則:

 

1.在不損壞數據完整性的情況下,合并意義相近或相同的字段;

2.與本實驗無關的字段進行剔除,裁剪掉無效的字段。

 

本實驗將隨機抽取100000戶樣本用戶(在網6個月以上),剔除無效的或缺省值較多的字段,有效數據占樣本整體量的98.05%,最后得到98050戶數據作為樣本參與客戶細分模型建立。

 

(三)用戶分類

用戶中包含兩部分,一部分是訂閱過流量包的用戶,一類是非訂閱用戶,計算二者比例。

擬符合流量包訂購條件樣本62950戶,另4770戶已為冰激凌套餐,10327戶近半年無流量需求。

 

流量包 層級 國內 贈送省內 樣本數 備注
半年包 40半年包 - 3G 14504
流量月包 10元 100M - 18300 流量1元卡(OCS)12戶、ARPU值小于等于10元8戶
20元 300M - 13005
30元 500M 1000M+2G省內*12個月促銷 9700
50元 1G 5G 4652
70元 2G 10G 2599 騰訊大王卡等2I資費35戶,其中ARPU值小于60元的30戶。
100元 3G 15G 190

 

(四)數據建模

根據數據字段及樣本的選取規則,從上述的98050個數據中篩選過濾,得到下面部分字段的客戶數據信息。有部分字段在系統中直接提取出來是無法使用的,經過轉化求和等方式進行了加工,才得到以下內容,主要字段列舉如下:

 

表1:客戶畫像數據字段

字段名 數據類型 說明
用戶識別號 Text 用戶唯一識別碼
用戶號碼 Text 用戶服務號碼
在網時長 Number 用戶在網時長
用戶產品名稱 Text 用戶產品名稱
是否訂購流量包 Text 用戶是否訂購流量包
使用網絡類型 Number 用戶使用網絡類型
手機上網費 Number 用戶6個月平均上網費用
ARPU值 Number 用戶6個月平均ARPU值
國內語音時長 Number 用戶6個月國內語音平均時長
國內流量 Number 用戶6個月平均國內流量

剔除存在缺失值、空值樣本后,選取有通信行為的客戶數據98050條作為聚類目標對象集,部分客戶數據如下表所示(本文涉及的數據均經過特殊加工處理)

 

表2客戶使用行為數據表

用戶標識 在網時長 產品名稱 流量包 使用網絡 上網費(元) ARPU值 國內語音時長 國內流量(MB)
155**588 99 2 1 2G 0 9.65 10 0
130**362 148 4 1 3G 0 140 24 0
131**856 5 4 0 3G 3.75 53.1 57 1.1
130**912 37 3 0 4G 34 120.5 0 1899
156**872 42 1 1 2G 13.6 30.5 138 707
131**949 46 4 0 4G 0 10.5 63 267
155**603 75 2 1 4G 86 100.2 294 4300
186**686 42 1 1 4G 170 230.2 217 8905
155**690 89 3 1 3G 6 138.1 23 6.3
131**698 24 2 0 2G 0 36.8 31 0

 

(五)客戶細分模型建立與評估

使用datahoop平臺,將套餐名稱、網齡、ARPU值?? 、國內語音(分鐘)、月均國內流量(G)、age、月均消費、免費流量、收費流量、收費和流量費等變量都放在X軸導入系統進行分析。

 

使用“異常值分析”,有39個異常值占比不高,可不做處理。

 

使用“相關系數矩陣”工具計算相關性,可知免費流量和收費流量系數大于0.9,屬于強相關,其他均小于0.7,因此將免費流量和收費流量的比值 作為新的變量,與網齡、ARPU值、月均國內語音(分鐘)、月均國內流量(G)一起作為變量進行下一步建模。

 

將上述五個變量再次導入datahoop平臺進行“相關系數矩陣”。結果顯示其相關性均小于0.8,不存在強相關,可以使用聚類分析來對這些用戶進行分類。

 

使用聚類中的K-means計算方法,在datahoop平臺中建立數據流,將聚類系數分別設定為3、4、5,來檢測何種分類下情況最佳。

結果顯示,在聚類系數為4時,平均輪廓系數為0.6537,此時分類效果最佳。

k-value silhouette coefficient
3 0.4539
4 0.6537
5 0.6497

圖1:各種分類下的輪廓系數結果

 

 

 

???????

(0為不常使用用戶;1為中端日常用戶;2為中端商務用戶;3為高端商務用戶)

 

類別 ARPU值(Y) Domestic Voice(S) Domestic flows(M) Network age(M) 客戶分類
0 19.62 58 1.13 6 不常使用用戶
1 45.72 1823 325.72 15 中端日常用戶
2 98.9 6582 4321.69 18 中端商務用戶
3 135.5 31257 10732.78 8 高端商務用戶

 

通過聚類模型分析結果如下:

0類用戶為不常使用用戶,可以嘗試推薦10元100M-30元500M流量包,培養用戶使用流量習慣,提高用戶在網時長,目的在于挽留用戶繼續使用。

 

1類用戶為中端日常用戶,適合推薦存費送電子劵產品預存120元贈送240元,12個月。

 

2類用戶為中端商務用戶,適合推薦存費送電子劵產品預存240元贈送480元,12個月。

 

3類用戶為高端商務用戶, 適合推薦用戶遷轉為暢越冰激凌套餐。

 

通過聚類分析后得到的分類結果,還是比較符合用戶實際使用情況的。接下來就運用這種分類方式對我們將要推薦業務的用戶數據進行分類并進行實踐。

 

四、存量用戶價值提升實證分析及研究

取出一批待維系的用戶數據,提取他們的屬性,即建模過程張選取的屬性,將這些數據導入datahoop平臺,使用聚類k-means算法進行分類。按照分類的結果對不同類的用戶進行不同產品的推薦。

 

建模目標在于,確定用戶的個人屬性和消費能力對其訂購相應業務的影響力大小,以便于對其他非訂購用戶進行業務適配,并進行相應推薦。

 

由于研究能提供的觸點渠道存在局限性,本次采用了電話營銷的傳統方式進行渠道觸達。電話營銷方式的客戶感知是遠低于通過APP或網上營業廳等渠道的客戶主動行為轉化的感知。據統計,前期存費送電子券、套餐遷轉和流量包訂購為1.3%,通過大數據精準營銷轉化率達到了2.3%,提升了個1個PP。從實證結果來看,模型的運行結果實際可行,可以運用于日常工作中。

 

五、結束語

通過參加中國數據分析專業委員會數據分析師(CPDA)培訓并獲得認證,使我們建立了數據分析思維、熟悉了數據分析流程、掌握了數據分析方法和技能,并結合工作需求進行實際應用的研究,但由于資源條件、設備工具和水平所限,本文在數據分析,模型選擇及描述等方面尚有很多不足,需要在未來研究中進一步驗證價值,提升研究的有效性和科學性及工作實際應用性。通過數據分析方法,在一定程度上拓展相關領域的分析視角和方法,充分挖掘數據價值,產生數據效益,促進行業的發展。

?

 

 

 

 

重庆市时时开奖结果