對(duì)于企業(yè)來說,數(shù)據(jù)來源網(wǎng)站、企業(yè)應(yīng)用、社交媒體、物聯(lián)網(wǎng)以及網(wǎng)聯(lián)網(wǎng)產(chǎn)生的越來越多的數(shù)據(jù),而數(shù)據(jù)挖掘就是數(shù)據(jù)分析中的重要環(huán)節(jié)之一。 數(shù)據(jù)挖掘是指通過算法搜索從大量數(shù)據(jù)中隱藏信息的過程。通過數(shù)據(jù)分析確定趨勢(shì)和模式,建立關(guān)系,從而解決業(yè)務(wù)問題。換句話說,數(shù)據(jù)挖掘是從大量、不完整的、噪音的、模糊的、隨機(jī)的數(shù)據(jù)中提取出來的。而人們事先不知道的是一種潛在有用的數(shù)據(jù)和知識(shí)過程。與以觀察數(shù)據(jù)為重點(diǎn)的數(shù)據(jù)分析不同,數(shù)據(jù)挖掘的重點(diǎn)是從數(shù)據(jù)中發(fā)現(xiàn)知識(shí)規(guī)則數(shù)據(jù)分析得出結(jié)論,應(yīng)用是人類的智力活動(dòng),而數(shù)據(jù)挖掘發(fā)現(xiàn)的知識(shí)規(guī)則可以直接應(yīng)用于預(yù)測(cè)。 數(shù)據(jù)挖掘的基本步驟 1)數(shù)據(jù)清理:消除噪聲和不一致數(shù)據(jù); 2)數(shù)據(jù)集成:不同來源與格式的數(shù)據(jù)組合到一起; 3)數(shù)據(jù)選擇:挖掘所需的數(shù)據(jù); 4)數(shù)據(jù)變換:數(shù)據(jù)變換成適合挖掘的形式,如匯總,聚集操作; 5)數(shù)據(jù)挖掘:方法,建模; 6)模式評(píng)估:結(jié)果模型; 7)知識(shí)表示:可視化。 數(shù)據(jù)挖掘應(yīng)用價(jià)值:為企業(yè)生產(chǎn)銷售做預(yù)測(cè) 數(shù)據(jù)挖掘的真正價(jià)值在于可以以數(shù)據(jù)中的模式和關(guān)系的形式挖掘隱藏的寶石,可以用來預(yù)測(cè)對(duì)企業(yè)的重大影響。比如一個(gè)公司確定某個(gè)特定的營銷活動(dòng),導(dǎo)致某個(gè)特定型號(hào)的產(chǎn)品在國內(nèi)某些地區(qū)銷量很高,但在其他地區(qū)沒有,那么以后可以重新調(diào)整廣告活動(dòng),實(shí)現(xiàn)最大回報(bào)。 該技術(shù)的好處可能會(huì)因業(yè)務(wù)類型和目標(biāo)而異。例如,零售業(yè)的銷售和營銷經(jīng)理可能用不同的方式挖掘客戶信息以提高轉(zhuǎn)化率,這種提高轉(zhuǎn)化率的方式迥異于航空公司或金融服務(wù)業(yè)。 不管是什么行業(yè),過去應(yīng)用于銷售模式和客戶行為的數(shù)據(jù)挖掘都可用于創(chuàng)建預(yù)測(cè)未來銷售和行為的模型。數(shù)據(jù)挖掘也有助于取消可能損害企業(yè)的活動(dòng)。例如,你可以使用數(shù)據(jù)挖掘來提高產(chǎn)品的安全性,或檢測(cè)保險(xiǎn)和金融服務(wù)交易中的欺詐活動(dòng)。 |
|