在大數(shù)據(jù)漫天飛舞的時(shí)代,作為專業(yè)的質(zhì)量從業(yè)人員您是否會(huì)數(shù)據(jù)分析與統(tǒng)計(jì)呢?完成數(shù)據(jù)分析的第一步,您必須掌握描述性統(tǒng)計(jì)(Descriptive
Statistic)分析。 數(shù)據(jù)統(tǒng)計(jì)分析 也許很多人會(huì)疑惑:我每天用Excel都會(huì)做數(shù)據(jù)分析,諸如直方圖、餅圖、柏拉圖,過程能力分析Cpk等,質(zhì)量管理中的數(shù)據(jù)統(tǒng)計(jì)還有什么新花樣呢?今天讓我們回歸統(tǒng)計(jì)學(xué)的基礎(chǔ),系統(tǒng)性的看看描述性統(tǒng)計(jì)是怎么回事。先讓我們看看數(shù)據(jù)統(tǒng)計(jì)的分類。統(tǒng)計(jì)進(jìn)一步分為兩種類型:描述性統(tǒng)計(jì)和推斷性統(tǒng)計(jì)。今天,我們來看看描述性統(tǒng)計(jì),包括定義、描述性統(tǒng)計(jì)的類型以及描述性統(tǒng)計(jì)和推斷性統(tǒng)計(jì)之間的區(qū)別。什么是描述性統(tǒng)計(jì) 描述性統(tǒng)計(jì)描述、顯示和總結(jié)抽樣(samples)或總體(population)測量的數(shù)據(jù)的基本特征,以描述這些測量數(shù)據(jù)的摘要匯總。它可以幫助分析人員更好地理解數(shù)據(jù)。描述性統(tǒng)計(jì)分析被分解為測量對(duì)象的集中趨勢(位置或中心)的度量和變異性(波動(dòng)或分布)的度量。集中趨勢的度量包括均值、中位數(shù)和眾數(shù),而變異性的度量包括標(biāo)準(zhǔn)差、方差、極差、峰度和偏度。讓我們用一組簡單的數(shù)據(jù)(4、6、7、8、8、9、10)來看這些基本概念:除了上述度量被測量對(duì)象的中心位置和波動(dòng)的特征以外,還有關(guān)于數(shù)據(jù)分布的偏度(Skewed)和峰度、對(duì)稱性等。正態(tài)分布 許多連續(xù)隨機(jī)變量具有鐘形或某種程度的對(duì)稱分布。這是一個(gè)正態(tài)分布。換句話說,其相對(duì)頻率直方圖的概率分布遵循正態(tài)曲線。該曲線呈鐘形,關(guān)于均值對(duì)稱,由 μ
和 σ(均值和標(biāo)準(zhǔn)差)定義。正態(tài)分布 峰度和偏度是幫助您了解數(shù)據(jù)分布的一般屬性的兩種度量。這些度量將您的分布形狀與對(duì)稱分布和正態(tài)分布進(jìn)行比較。當(dāng)峰度或偏度顯著偏離零時(shí),可能表明您的數(shù)據(jù)不服從正態(tài)分布。但是,請(qǐng)使用正態(tài)性檢驗(yàn)或正態(tài)分布圖來做出該決定。偏態(tài)和對(duì)稱分布的圖示 偏度 偏度表示數(shù)據(jù)分布的對(duì)稱性。傾斜的數(shù)據(jù)是不對(duì)稱的。術(shù)語右偏和左偏表示長尾在分布曲線上指向的方向。使用Minitab和Excel軟件的案例分析 可能很多同學(xué),看到這兒就開始疑惑,描述性統(tǒng)計(jì)和我有什么關(guān)系。接下來讓我們分析一個(gè)具體的案例。某知名的整車廠,向兩家供應(yīng)商采購?fù)馆嗇S(Cam Shaft),在整車的裝配線上,有一個(gè)長期慢性的問題是凸輪軸的長度偶爾會(huì)超出設(shè)定的公差范圍。這將會(huì)導(dǎo)致生產(chǎn)線較差的適配性組裝,從而有很高的報(bào)廢和返工率。該整車廠組裝線有四個(gè)班,經(jīng)過小組討論決定每班每次測量五個(gè)凸輪軸并使得每天有總共二十個(gè)樣本。連續(xù)5天抽樣取得每家供應(yīng)商各有100個(gè)數(shù)據(jù)。而產(chǎn)品的公差設(shè)計(jì)范圍是:600 mm±2mm。讓我們分別用Minitab和Excel來做描述性統(tǒng)計(jì)分析看看你會(huì)發(fā)現(xiàn)什么?Minitab 打開 Minitab 并在電子表格中輸入數(shù)據(jù)。您可以選擇“顯示描述性統(tǒng)計(jì)…”也可選擇“圖形化匯總…”,下面以后者為例進(jìn)行分析。通過分析兩家供應(yīng)商的分析結(jié)果如上。大家從左側(cè)的直方圖和右側(cè)的數(shù)據(jù)看到什么結(jié)論了嗎?您應(yīng)該對(duì)供應(yīng)商1和2分別采取什么管理策略呢?(參見文末的提示)Excel 很多同學(xué)說,我沒有Minitab。其實(shí)Excel同樣可以完成描述性分析。打開Excel 并在電子表格的第一列中輸入數(shù)據(jù)。選擇數(shù)據(jù)>數(shù)據(jù)分析>描述性統(tǒng)計(jì)?!咎崾荆喝绻?jì)算
Excel 描述性統(tǒng)計(jì)數(shù)據(jù),則必須在 Excel 中加載數(shù)據(jù)分析工具庫。單擊 Excel 中的“數(shù)據(jù)”選項(xiàng)卡。如果在工具欄右側(cè)沒有看到“數(shù)據(jù)分析”,則需要先加載工具庫。】接下來選擇數(shù)據(jù)>數(shù)據(jù)分析>直方圖,你同樣可以畫出類似于Minitab中的直方圖。描述性統(tǒng)計(jì)總結(jié)了您的數(shù)據(jù)集,繪制了其可視化的圖表。包括各種集中趨勢和變差的度量、分布屬性等信息。描述性統(tǒng)計(jì)與推斷性統(tǒng)計(jì) 描述性統(tǒng)計(jì)與推斷性統(tǒng)計(jì)具有不同的功能,推斷性統(tǒng)計(jì)是用于做出決策或?qū)⒁活惍a(chǎn)品的數(shù)據(jù)的特征(均值、標(biāo)準(zhǔn)差等)應(yīng)用于另一組產(chǎn)品的數(shù)據(jù)特性上。想象一下老干媽公司銷售辣醬的例子:公司收集的數(shù)據(jù)包括銷售額、每筆交易的平均購買數(shù)量以及一周中每天的平均銷售額。所有這些信息都是描述性的,因?yàn)樗v述了過去實(shí)際發(fā)生的事情。假設(shè)老干媽想要推出一種新的辣醬。它收集與上面相同的銷售數(shù)據(jù),但它對(duì)信息進(jìn)行加工以預(yù)測新辣醬的銷量。使用描述性統(tǒng)計(jì)并應(yīng)用于不同產(chǎn)品簇的行為使數(shù)據(jù)成為推斷性統(tǒng)計(jì)。我們不再簡單地匯總數(shù)據(jù);我們正在使用它來預(yù)測對(duì)于完全不同的數(shù)據(jù)(新的辣醬產(chǎn)品)會(huì)發(fā)生什么。結(jié)論 描述性統(tǒng)計(jì)可用于兩件事:1)
提供有關(guān)數(shù)據(jù)中變量的基本信息(單組數(shù)據(jù))和2)突出變量之間的潛在關(guān)系(兩組或多組數(shù)據(jù)用散點(diǎn)圖、相關(guān)性分析等)。描述性統(tǒng)計(jì)僅對(duì)用于計(jì)算它們的數(shù)據(jù)集做出陳述。關(guān)鍵要點(diǎn): 描述性統(tǒng)計(jì)總結(jié)或描述數(shù)據(jù)集的特性。 描述性統(tǒng)計(jì)包括三個(gè)基本類別的度量:集中趨勢度量、變異性(或分布)度量和頻率分布度量。 集中趨勢的度量描述了數(shù)據(jù)集的中心(均值、中位數(shù)、眾數(shù))。 可變性度量描述了數(shù)據(jù)集的分散(方差、標(biāo)準(zhǔn)差)。 頻率分布度量描述了數(shù)據(jù)集內(nèi)數(shù)據(jù)的出現(xiàn)(計(jì)數(shù)),最后通過峰度和偏度等體現(xiàn)出來。
【文中案例分析提示】: 1. 從Minitab或Excel的分析可以看出,供應(yīng)商1的P值為0.029小于0.05,顯示供應(yīng)商1的數(shù)據(jù)呈現(xiàn)非正態(tài)分布。 2. 供應(yīng)商1的標(biāo)準(zhǔn)差小于供應(yīng)商2,顯示其更加穩(wěn)定。供應(yīng)商1的峰度大于0,而供應(yīng)商2的峰度小于0也驗(yàn)證了此結(jié)論。 3.供應(yīng)商1的均值小于理論值600,偏左,其偏度為負(fù)值也驗(yàn)證此結(jié)論。 4.接下來你可以對(duì)兩家供應(yīng)商的產(chǎn)品做控制圖和過程能力的分析,進(jìn)一步診斷他們過程的穩(wěn)定性。但是最重要的,從兩供應(yīng)商目前的結(jié)果來看質(zhì)量都非常令人堪憂,您的團(tuán)隊(duì)必須深入供應(yīng)商車間現(xiàn)場完成根源分析RCA和持續(xù)改善。
|