1. 首頁 > 新品推薦

    相關系數r(Excel數據分析-相關系數)

    相關系數,在統計過程中十分常用的一個概念,用來表示兩組數據之間的關聯程度

    之前在線性回歸里提過,這個數值的計算結果在-1到1之間,越是靠近0就表示沒有線性相關,而越靠近兩端的-1或者1表示線性關系越強

    但是它的應用卻不僅僅局限于線性回歸,雖然到底用途有多少我也不能完全歸納,不過這里還是可以舉個擬合問題以外的例子

    比方說我們有一份已經整理好格式的產品組件表格:

    相關系數r(Excel數據分析-相關系數)

    其中,每列表示一種產品,每種產品下方的數字表示做一個此種產品需要用到的組件數量,現在,我們想比較這些產品之間的異同

    相關系數在Excel中有現成的公式PEARSON,也就是說,假設我們先計算產品A和B之間的差異,可以把公式寫成:

    =PEARSON (產品A列:產品B列),計算結果為0.7833

    這里請注意我們在以前做線性擬合時用過的另一個公式RSQ,這個公式是相關系數的平方,也就是RSQ(x)= PEARSON(x)^2,想驗證的可以自行試試

    這似乎看起來不是很復雜的事情

    但是,當我們要比較的產品很多的時候,我們就會遇到一個小問題,那就是產品與產品之間是兩兩比較,想我們目前列出有四種不同產品時,比較結果就已經有3+2+1=6種

    這個配對比較會產生多少種結果,我們也有個另外的公式可以直接計算,那就是組合數公式COMBIN

    在我們當前這個例子中,組合數為:=COMBIN(4,2)=6,意思是在4個總體中每次抽取2個能得到的所有組合的數量

    而當我們增加產品種類的時候,比如增加到50個,就會發覺組合數猛增到了=COMBIN(50,2)=1225種

    這時我們再通過手工羅列出所有組合方式,并用公式兩兩計算的話就會顯得有點麻煩了,不是不能做,只是有現成的工具比這樣操作方便

    現成的相關系數工具還是在數據分析加載項里(我覺得自己快把這里面的東西都寫得差不多了):

    相關系數r(Excel數據分析-相關系數)

    打開后界面如下:

    相關系數r(Excel數據分析-相關系數)

    要填寫的內容比較少,我就不仔細解釋了,填好后確定

    輸出結果如下:

    相關系數r(Excel數據分析-相關系數)

    Excel輸出的這個格式看起來還挺齊整,除去1那個斜排,正好6個比較結果,其中越接近1的表示這兩種產品相似程度越高

    感覺這個思路用來做兩兩比較的計算挺好的,哪怕不是做相關系數計算,這個方法只是用來提取兩兩組合看起來也很方便

    正經內容就這些啦,最后增加一點小Tip,為啥R值的平方公式就那么簡潔(RSQ),不做平方公式名稱就那么長呢(PEARSON)??因為這是個叫皮爾森的歪果仁搞出來的數學公式啦,所以咱為了表達點尊重,還是注意點別把人家的名字拼錯了,畢竟拼錯了就算不出來了啦,嘻嘻嘻~~~~

    相關系數r(Excel數據分析-相關系數)

    原文標題:相關系數r(Excel數據分析-相關系數),如若轉載,請注明出處:http://www.pj0283.com/hwgg/459290.html
    免責聲明:此資訊系轉載自合作媒體或互聯網其它網站,「寶貝屋禮物網」登載此文出于傳遞更多信息之目的,并不意味著贊同其觀點或證實其描述,文章內容僅供參考。