過程能力分析02 Box-Cox變換:非正態資料能力分析的處理辦法

在上一文章

《過程能力分析01—不要忽略“穩定”》

中,我們強調了做過程能力分析之前需要穩定的過程,在本篇文章中我們來討論另外一個前提—

資料正態

。其中我們在之前的文章中對正態性問題已經有過一些討論,詳見

《資料非正態如何分析?您可能問了錯誤的問題!》

但是今天我們想進一步討論

非正態資料能力分析的處理辦法。

非正態解決方案

如果您使用為正態資料設計的能力分析,您的資料必須服從正態分佈。如果您的資料不是正態的,則分析結果可能不準確,但是我們可以透過以下方法來獲得準確描述生成非正態資料的過程的能力指數。

過程能力分析02 Box-Cox變換:非正態資料能力分析的處理辦法

正如你說看到的,解決方法有很多,當然方法選擇不同結果肯定是有差異的,那麼問題又來了,哪個方法是比較合適的呢?別急,我們可以先參考以下路徑圖幫助我們選擇。

過程能力分析02 Box-Cox變換:非正態資料能力分析的處理辦法

在這篇文章中,我們先來看看資料變換的方法-Box-Cox變換。為了說明資料變換方法,可以想象一下密碼員將文字變換為編碼訊息的方法。當密碼員對訊息加密時,他們不更改其含義,只更改其外觀。

過程能力分析02 Box-Cox變換:非正態資料能力分析的處理辦法

同樣,我們可以變換資料值,使資料外觀發生變化。數學變換提取資料集中的現有數字,將它們插入到函式中。變換不更改資料的物理含義,僅更改它們的值。如果能夠找到使非正態資料看上去像正態資料的變換,則可以使用早先了解的正態能力工具來計算過程資料的能力指數。

過程能力分析02 Box-Cox變換:非正態資料能力分析的處理辦法

案例背景

密封馬鈴薯片袋子。操作員將每個袋子插入到兩個金屬柱之間,其中一個金屬柱已加熱,用於將袋口密封。如果封口強度太弱,袋子在貨運過程中可能會開啟。如果封口強度太強,顧客可能很難開啟袋子。封口強度是開啟袋子所需的力量。為了研究過程,操作員從一個批次中隨機取樣了 250 個袋子,測量它們的封口強度。

過程能力分析02 Box-Cox變換:非正態資料能力分析的處理辦法

過程能力分析02 Box-Cox變換:非正態資料能力分析的處理辦法

對此列資料,我們先來一個圖形化彙總(統計-基本統計-圖形化彙總)。

過程能力分析02 Box-Cox變換:非正態資料能力分析的處理辦法

直方圖右側偏斜,Anderson-Darling 檢驗的 p 值小於 0。05,資料非正態,我們嘗試變換資料。

在嘗試變換之前,建議先執行“個體分佈標識”,因為並不是所有資料都可以變換成功。

過程能力分析02 Box-Cox變換:非正態資料能力分析的處理辦法

01

在嘗試變換之前,建議先執行“個體分佈標識”,因為並不是所有資料都可以變換成功。

過程能力分析02 Box-Cox變換:非正態資料能力分析的處理辦法

02

在個體分佈標識中包含:正態分佈+2種變換+13種其他分佈,一共16種選擇。

過程能力分析02 Box-Cox變換:非正態資料能力分析的處理辦法

03

從“擬合優度檢驗”的結果中可以看到,兩種變換都是可以的(P值大於0。05)。

Box-Cox變換

Box-Cox 變換是一種冪變換,其中,y是初始資料值,λ 是變換引數(-5≤λ≤5),y∗是變換後的資料。

變換的關鍵在於找到合適的變換引數λ,下面是一些常見的λ取值和對應的變換方式。

過程能力分析02 Box-Cox變換:非正態資料能力分析的處理辦法

變換的目標是找到將非正態資料變換為正態分佈資料的λ。最佳變換將生成變異性儘可能小的資料集。我們可以藉助Minitab來找到合適的λ。

過程能力分析02 Box-Cox變換:非正態資料能力分析的處理辦法

過程能力分析02 Box-Cox變換:非正態資料能力分析的處理辦法

過程能力分析02 Box-Cox變換:非正態資料能力分析的處理辦法

過程能力分析02 Box-Cox變換:非正態資料能力分析的處理辦法

從輸出的Box-Cox圖中,可以發現λ的估計值0。04可以最大程度地減小Y函式標準差。但在任何實際情況下,你可能需要一個對應於容易理解的變換的λ值,如平方根(λ 為 0。5)或自然對數(λ為0)。在此示例中,λ=0是一個合理的選擇,因為它處於 95% 置信區間內。因此,自然對數變換可能優先於 λ 的最佳估計值定義的變換。另外,如果選擇了“將變換後資料儲存在”,Minitab將會基於取整值自動幫助我們完成變換,並把資料儲存下來。

過程能力分析02 Box-Cox變換:非正態資料能力分析的處理辦法

C2列是透過對C1列取自然對數得到的(λ=0)。

過程能力分析02 Box-Cox變換:非正態資料能力分析的處理辦法

過程能力分析02 Box-Cox變換:非正態資料能力分析的處理辦法

我們再來對變換後資料來一次正態性檢驗(其實沒必要,這裡只是為了說明轉換成功與否)。

從上面結果中發現,資料已經變得正態了,Box-Cox變換成功,後面就是按照正態方法執行過程能力分析了,不再贅述。

總結

上面對Box-Cox變換做了一些介紹,其實它有很多應用方面,比如在DOE中也會用到。另外,如果是做過程能力分析,其實做Box-Cox變換有更簡單的操作:在“個體分佈標識”結果中,如果確定變換可行,則可以直接透過以下路徑完成能力分析。

過程能力分析02 Box-Cox變換:非正態資料能力分析的處理辦法

過程能力分析02 Box-Cox變換:非正態資料能力分析的處理辦法

過程能力分析02 Box-Cox變換:非正態資料能力分析的處理辦法