午夜视频在线网站,日韩视频精品在线,中文字幕精品一区二区三区在线,在线播放精品,1024你懂我懂的旧版人,欧美日韩一级黄色片,一区二区三区在线观看视频

分享

IDMer (數(shù)據(jù)挖掘者)

 涵靈韻清揚(yáng) 2011-08-03
這個(gè)帖子是我在數(shù)據(jù)挖掘研究院上的一篇回貼,原貼我也放在本文的下方:

我曾經(jīng)看過所謂預(yù)警模型,只是對(duì)一些指標(biāo)設(shè)定閾值,然后多個(gè)指標(biāo)加權(quán)評(píng)分之后,得到總預(yù)警評(píng)分,若超過閾值,則提出預(yù)警。
問題在于:這種思路有些一刀切,指標(biāo)的選取和閾值的設(shè)定都存在很大的人為性,也缺乏有效性評(píng)估,所以個(gè)人覺得沒有太大的實(shí)踐價(jià)值。

再談流失預(yù)測(cè)分析,業(yè)界普遍都是采用決策樹算法來建立模型。同意heilql的一些看法,包括挖掘流程的大致描述、指標(biāo)選擇是重點(diǎn)等。其實(shí)在我們以前所做的多個(gè)客戶流失預(yù)測(cè)項(xiàng)目中,更重要的還有:明確業(yè)務(wù)問題的定義和如何運(yùn)用挖掘結(jié)果來指導(dǎo)客戶挽留活動(dòng)。以下分別簡要說明:

① 明確業(yè)務(wù)問題定義
  我一直覺得數(shù)據(jù)挖掘就是個(gè)不斷嘗試的過程,沒有定式。也許挖掘人員掌握了一些套路,但是在你明白要做什么以及數(shù)據(jù)的情況到底如何之前,其實(shí)你是不能給客戶任何保證的。業(yè)務(wù)問題定義類似于需求分析,只有明確了業(yè)務(wù)問題才能避免多走彎路,浪費(fèi)人力物力。
  對(duì)于客戶流失預(yù)測(cè)來說,一般要明確這幾個(gè)問題:
  -什么叫做流失?什么叫做正常?(嚴(yán)格定義好0和1)
  -要分析哪些客戶?(比如在移動(dòng)通信行業(yè),很可能要對(duì)簽約客戶和卡類客戶分開建模,還需要排除員工號(hào)碼、公免號(hào)碼等等)
  -分析窗口和預(yù)測(cè)窗口各為多大?(用以前多久范圍的數(shù)據(jù)來預(yù)測(cè)客戶在以后多久范圍內(nèi)可能流失)

② 變量選取、數(shù)據(jù)探索和多次建模
  這個(gè)類似于heilql所提到的指標(biāo)選擇,也許變量是更常用的說法;) 電信業(yè)的絕大多數(shù)數(shù)據(jù)都可能被探查并用于建模過程。一般我們分為如下幾類:
  -客戶基本信息(年齡、性別、在網(wǎng)時(shí)長、當(dāng)前狀態(tài)。。。)
  -客戶賬單信息(賬單金額、優(yōu)惠金額、明細(xì)賬單金額。。。)
  -客戶繳費(fèi)信息(繳費(fèi)次數(shù)、繳費(fèi)金額、欠費(fèi)次數(shù)、欠費(fèi)金額。。。)
  -客戶通話信息(通話次數(shù)、通話時(shí)長、短信次數(shù)、呼轉(zhuǎn)次數(shù)、漫游次數(shù)。。。)
  -客戶聯(lián)絡(luò)信息(投訴次數(shù)、抱怨次數(shù)。。。)
  這些變量的數(shù)目很多,而且還會(huì)根據(jù)需要派生出很多新變量,比如近一月賬單金額和近三月賬單金額的比例(用于反映消費(fèi)行為的變動(dòng))。

  建議挖掘人員把所有能拿到數(shù)據(jù)都探索一遍,然后逐步明確哪些變量是有用的。而對(duì)于一個(gè)公司來說,事先能給出一份比較全面的變量列表,也正體現(xiàn)了他們?cè)谶@方面的經(jīng)驗(yàn)。對(duì)于挖掘新手來說,多思考,多嘗試,也會(huì)逐漸總結(jié)出來。

③ 對(duì)業(yè)務(wù)的指導(dǎo)(模型的發(fā)布及評(píng)估反饋)
  挖掘人員常常是技術(shù)導(dǎo)向的,一旦建立好流失預(yù)測(cè)模型并給出預(yù)測(cè)名單之后,常常覺得萬事大吉,可以交差了。但是對(duì)于客戶來說,這遠(yuǎn)遠(yuǎn)不夠。一般來說,客戶投資一個(gè)項(xiàng)目,總希望能從中獲益,因此在驗(yàn)收時(shí)領(lǐng)導(dǎo)最關(guān)注的問題可能是:數(shù)據(jù)挖掘?qū)ξ业腞OI有什么提升?
  要給客戶創(chuàng)造價(jià)值,就需要通過業(yè)務(wù)上的行動(dòng)來實(shí)現(xiàn)。No Action, No Value。這種行動(dòng)可能是幫助客戶改善挽留流程,制定有針對(duì)性的挽留策略,明白哪些客戶是最值得被挽留的,計(jì)算挽留的成本以及挽留成功后可能帶來的收益。以上這些方面需要挖掘人員不僅僅是技術(shù)專家,還需要是業(yè)務(wù)專家,是Business Consultant。

===========================
[heilql的原貼 2005年07月01日 23:30]

理論背景
    客戶流失分析或客戶流失預(yù)測(cè):通過離網(wǎng)調(diào)研和數(shù)據(jù)挖掘,捕捉客戶離網(wǎng)前的特征,預(yù)測(cè)客戶流失的概率。這對(duì)于優(yōu)質(zhì)客戶的保護(hù)是十分重要和有效的分析手段。對(duì)于客戶流失預(yù)測(cè),從兩個(gè)方面來看:一個(gè)是客戶流失預(yù)警,一個(gè)是流失客戶特征分析。

    客戶流失預(yù)警:定義統(tǒng)一的預(yù)警模型,根據(jù)預(yù)警模型,客戶話單數(shù)據(jù)中自動(dòng)匹配預(yù)警數(shù)據(jù),預(yù)警模型可以按如下規(guī)則定義,并且可以靈活擴(kuò)展。

    流失客戶特征分析:通過決策數(shù)算法,分析流失客戶特征,然后通過這些特征得到當(dāng)前在網(wǎng)客戶中匹配流失概率高的客戶數(shù)據(jù)。

    通過客戶流失分析獲得流失客戶數(shù)據(jù)和潛在流失客戶數(shù)據(jù),從而將這些數(shù)據(jù)分配給客戶服務(wù)部門,整合銷售服務(wù)資源,根據(jù)客戶的需求,設(shè)計(jì)個(gè)性化的營銷策略,快速反應(yīng),以此達(dá)到召回流失客戶,挽留流失概率高的客戶,實(shí)現(xiàn)對(duì)客戶的守護(hù)。(摘自人民郵電報(bào))

現(xiàn)實(shí)背景
   隨著電信行業(yè)競爭的加劇,客戶流失的規(guī)模越來越大,周期越來越短;電信業(yè)新增客戶和客戶流失模式,就猶如往沒有底的水桶中倒水。

分析方法
客戶流失分析的流程到處都在講,不外乎是:
1. 分析主題確定及數(shù)據(jù)指標(biāo)的選擇;
2. 數(shù)據(jù)倉庫數(shù)據(jù)提取及清洗;
3. 不相關(guān)指標(biāo)剔除;
4. 用訓(xùn)練數(shù)據(jù)建立模型;
5. 用測(cè)試數(shù)據(jù)檢驗(yàn)?zāi)P停?br>6. 預(yù)測(cè)新的流失用戶,并提取用戶名單;

為了引起更多的這方面的探討,本人有的一些想法,先現(xiàn)世:
其實(shí)本人認(rèn)為關(guān)鍵是指標(biāo)的選擇,以及模型建立前的資料的分類,這樣將增加模型的準(zhǔn)確性,后面的步驟都是水到渠成,但有關(guān)這方面的探討確實(shí)很少,應(yīng)用的實(shí)例就更少了。

一般電信運(yùn)營商客戶資料主要包括:
1.客戶背景資料:年齡、性別、收入。。。
2.客戶消費(fèi)行為:是否欠費(fèi),流失前半年平均消費(fèi)額\消費(fèi)趨勢(shì),話費(fèi)構(gòu)成...
3.其他:交費(fèi)方式,設(shè)備使用類別..

其實(shí)能夠想到的指標(biāo)都可以放上去,然后從定性和定量的角度考慮剔除

大家想到有什么新的指標(biāo)都可以跟帖

 

閱讀全文(6066) | 回復(fù)(8) | 編輯 | 精華
回復(fù):關(guān)于“電信業(yè)客戶流失預(yù)測(cè)”
yixinist(游客)發(fā)表評(píng)論于2008-1-22 17:09:33
你好,用戶流失最重要的進(jìn)行用戶分類,只有有效用戶細(xì)分才能找到高流失用戶群體,我們對(duì)全網(wǎng)用戶進(jìn)行過分析,最終分成12-18類用戶,每類用戶群從1萬-5萬戶,結(jié)果發(fā)現(xiàn)補(bǔ)貼用戶流失率遠(yuǎn)低于未補(bǔ)貼用戶.......
個(gè)人主頁 | 引用回復(fù) | 主人回復(fù) | 返回 | 編輯 | 刪除
回復(fù):關(guān)于“電信業(yè)客戶流失預(yù)測(cè)”
conjurer(游客)發(fā)表評(píng)論于2006-8-21 18:00:58
我覺得你已經(jīng)通過外呼,或者客戶經(jīng)理的方式對(duì)客戶進(jìn)行了挽留,那這里面是不是會(huì)因?yàn)橥炝粽叩暮脡?使我無法準(zhǔn)確估計(jì)我所做模型的好壞程度.我傾向于預(yù)測(cè),再把預(yù)測(cè)的結(jié)果分成兩部分,一部分讓他繼續(xù)自然發(fā)展,最后看他與我預(yù)測(cè)結(jié)果的差別.另一部分進(jìn)行挽留,這樣這部分既可以看挽留效果,又可以我預(yù)測(cè)出來的流失客戶,是否已經(jīng)沒有了挽留期(這個(gè)很多情況是因?yàn)榭蛻舻臋C(jī)卡已經(jīng)分離了).
個(gè)人主頁 | 引用回復(fù) | 主人回復(fù) | 返回 | 編輯 | 刪除
回復(fù):關(guān)于“電信業(yè)客戶流失預(yù)測(cè)”
loafer(游客)發(fā)表評(píng)論于2005-8-31 10:33:03
這個(gè)事情基本上算是告一段落了。 1、分類結(jié)塊的現(xiàn)象我的看法是不去解決它了。其實(shí)我已經(jīng)找到了方法去解決它,但是結(jié)果失去了作用。比如用sigmoid的方式去將數(shù)據(jù)先做變換,但是類之間的差異非常不明顯。雖然各個(gè)群的大小差不多,但這樣的結(jié)果已近沒有意義了。 2、根據(jù)SH博士的建議,分類前先用因子分析的方法把變量歸類了一下。可是歸出來的變量,實(shí)在難以解釋他的意義。因此最后也放棄了這個(gè)思路。現(xiàn)在市場(chǎng)人員對(duì)有針對(duì)性地制定相應(yīng)的政策還是很有把握的,下個(gè)月看看挽留的結(jié)果如何,等待時(shí)間來驗(yàn)證。
個(gè)人主頁 | 引用回復(fù) | 主人回復(fù) | 返回 | 編輯 | 刪除
回復(fù):關(guān)于“電信業(yè)客戶流失預(yù)測(cè)”
lazycat(游客)發(fā)表評(píng)論于2005-8-25 10:29:06
email :cao_liwei[at]hotmail.com 謝謝 各位了 搞這個(gè)東西好頭疼啊 自己研究
個(gè)人主頁 | 引用回復(fù) | 主人回復(fù) | 返回 | 編輯 | 刪除
回復(fù):關(guān)于“電信業(yè)客戶流失預(yù)測(cè)”
lazycat(游客)發(fā)表評(píng)論于2005-8-25 10:27:48
老大 能不能提供一點(diǎn)項(xiàng)目資料啊 也許能起到剔糊灌頂?shù)淖饔冒?老大們  幫忙啊
個(gè)人主頁 | 引用回復(fù) | 主人回復(fù) | 返回 | 編輯 | 刪除
回復(fù):關(guān)于“電信業(yè)客戶流失預(yù)測(cè)”
數(shù)據(jù)挖掘者發(fā)表評(píng)論于2005-8-7 11:05:15
梳理一下思路:正如loafer所說的,對(duì)于客戶流失預(yù)測(cè)和客戶挽留這個(gè)專題分析來說,客戶更需要的是能夠采取恰當(dāng)行動(dòng)的完整方案,而非僅僅一個(gè)名單。那么這個(gè)解決方案可以劃分為四部分:發(fā)現(xiàn)挽留機(jī)會(huì)→制訂挽留策略→實(shí)施挽留行動(dòng),收集客戶反饋→評(píng)估挽留效果并調(diào)整模型和策略。 ①發(fā)現(xiàn)挽留機(jī)會(huì):最基本的做法是建立客戶流失預(yù)測(cè)模型(用決策樹或?qū)?shù)回歸),然后對(duì)在網(wǎng)客戶進(jìn)行流失傾向的評(píng)分,按傾向高低判別。但此處最好結(jié)合對(duì)全體客戶的分群來識(shí)別出真正的挽留機(jī)會(huì),并非流失傾向越高就越值得挽留。比如可以按照客戶價(jià)值進(jìn)行分群,優(yōu)先考慮對(duì)中高價(jià)值客戶的挽留;同時(shí)根據(jù)客戶行為分群,判別出哪些客戶可能已經(jīng)用了競爭對(duì)手的服務(wù),或者屬于欺詐類型的客戶,對(duì)這批客戶的挽留可能是沒有成效的,不應(yīng)視為挽留機(jī)會(huì)。 ②制訂挽留策略:經(jīng)過第一個(gè)步驟,我們已經(jīng)從預(yù)測(cè)名單中圈定了值得挽留的客戶。但是一般來說,這批客戶依然數(shù)目較大,難以逐個(gè)分析,決定采取何種挽留策略。(這也是一些廠商宣傳的一對(duì)一營銷,想法雖好,可是未必可行)此時(shí)可以對(duì)圈定的客戶進(jìn)一步進(jìn)行分群,將他們劃分為幾種類型,當(dāng)然此時(shí)最好在分群模型中放入行為、人口統(tǒng)計(jì)學(xué)、地域等屬性,然后基于這幾群客戶逐群制訂有針對(duì)的挽留策略。比如有的群組是屬于夜間通話多(和總體的均值相比)的客戶,那么針對(duì)他們的挽留策略可能是推薦一些夜間通話優(yōu)惠的資費(fèi)方案。 ③實(shí)施挽留行動(dòng)、收集客戶反饋:這里其實(shí)最好有類似操作型CRM的系統(tǒng)來支撐。將上述兩步驟給出的挽留機(jī)會(huì)和挽留策略分配給相應(yīng)的實(shí)施人員(可能是客戶經(jīng)理、Call Center等),由他們進(jìn)行實(shí)施,并收集客戶反饋(最簡單的客戶反饋是響應(yīng)或不響應(yīng),復(fù)雜些的可以包含對(duì)客戶流失傾向的認(rèn)定、客戶流失原因的了解、挽留策略是否適合該客戶等等) ④評(píng)估挽留效果:在客戶流失預(yù)測(cè)專題分析的試運(yùn)行階段,由于對(duì)模型預(yù)測(cè)的效果、挽留機(jī)會(huì)的識(shí)別是否準(zhǔn)確、挽留策略的制訂是否合適等方面尚未得到確認(rèn),常常會(huì)將預(yù)測(cè)名單中圈定的客戶劃分為兩組——實(shí)施組和對(duì)照組。對(duì)前者展開挽留,對(duì)后者不采取任何行動(dòng),根據(jù)兩組的流失情況來評(píng)估模型的預(yù)測(cè)效果和挽留效果。當(dāng)專題分析已經(jīng)基本穩(wěn)定后,對(duì)照組會(huì)被取消,那么對(duì)挽留效果的評(píng)估主要依賴于客戶的反饋、客戶隨后是否在網(wǎng)以及其用量的變化等來評(píng)估。   分群中的結(jié)塊問題的確比較麻煩,我覺得還是從變量的歸一化入手。因?yàn)樵谶M(jìn)行聚類之前,一般要對(duì)變量進(jìn)行歸一化以消除量綱不同造成的影響,但如果采取了不合適的歸一化方法,會(huì)導(dǎo)致大量客戶聚集在中位數(shù)附近(因?yàn)榇蠖鄶?shù)變量都會(huì)滿足正態(tài)分布)。此時(shí)我們要做的是盡量將他們之間的距離拉開。首先在歸一化之前將孤立點(diǎn)拿出來,避免它們對(duì)歸一化的結(jié)果造成較大影響;然后選擇合適的歸一化方法(例如對(duì)數(shù)變換,bin code,zscore,sigmoid等,最好多嘗試一下它們的組合;另外可以問問Ann,她們對(duì)此有些心得)。
個(gè)人主頁 | 引用回復(fù) | 主人回復(fù) | 返回 | 編輯 | 刪除
回復(fù):關(guān)于“電信業(yè)客戶流失預(yù)測(cè)”
loafer(游客|218.12.2.210)發(fā)表評(píng)論于2005-7-26 17:45:37
其實(shí)現(xiàn)在碰到的最大的問題是給出流失名單之后,客戶很難利用這些名單。傳統(tǒng)意義上的講法是說,可以通過外呼或者大客戶經(jīng)理的方式去挽留名單上的用戶,但實(shí)際操作中,客服的人員和大客戶經(jīng)理不知道怎么去跟客戶講。因此,感覺在名單給出的時(shí)候需要通過一定的方式去描述它。不知道你有什么好的建議。目前我的思路是說通過簡單的分群的方法找到用戶的一些特點(diǎn),然后請(qǐng)市場(chǎng)人員針對(duì)每類用戶制定相應(yīng)的策略,然后去跟客戶講?,F(xiàn)在在很多個(gè)site上都出現(xiàn)了這樣的問題,客戶希望得到的是更加細(xì)致完整的解決方案,而不是僅僅是一個(gè)名單。另外,對(duì)所有的用戶來進(jìn)行Cluster還是對(duì)預(yù)測(cè)為流失的用戶進(jìn)行Cluster,現(xiàn)在還沒有想太清楚。我覺得兩者的側(cè)重點(diǎn)不同,作用可能也不一樣。都說客戶分群是做其他事情的前提,現(xiàn)在看起來似乎也有那么一點(diǎn)點(diǎn)道理。另外,分群的時(shí)候結(jié)塊的問題怎么解決?目前我碰到的問題就是有個(gè)群最大,但是它也最沒有特點(diǎn),在我們所采集到的任何變量上都沒有特點(diǎn)。頭疼?。?!

    本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶 評(píng)論公約

    類似文章 更多