鍍金池/ 教程/ 數(shù)據(jù)分析&挖掘/ R語言多元(多重)回歸
R語言列表
R語言隨機森林
R語言矩陣
R語言邏輯回歸
R語言數(shù)據(jù)幀
R語言數(shù)據(jù)重塑
R語言概述
R語言包
R語言字符串
R語言CSV文件
R語言運算符
為什么使用R語言做統(tǒng)計?
R語言Web數(shù)據(jù)
R語言二進制文件
R語言XML文件
R語言JSON文件
R語言因子
R語言容易學習嗎?
R語言基礎(chǔ)語法
R語言向量
R語言教程
R語言正態(tài)分布
R語言平均值,中位數(shù)和眾數(shù)
R語言變量
R語言條形圖
R語言決策樹
R語言開發(fā)環(huán)境安裝配置
R語言數(shù)組
R語言數(shù)據(jù)類型
R語言非線性最小二乘法
R語言直方圖
R語言卡方檢驗
R語言泊松回歸
R語言決策結(jié)構(gòu)
R語言盒形圖(箱形圖)
R語言協(xié)方差分析
R語言二項分布
R語言餅狀圖
R語言循環(huán)
R語言散點圖
R語言線性回歸
R語言時間序列分析
R語言線形圖
R語言在現(xiàn)實中的應用
R語言生存分析
R語言多元(多重)回歸
R語言函數(shù)
R語言Excel文件
R語言連接數(shù)據(jù)庫(MySQL)

R語言多元(多重)回歸

多元(多重)回歸是線性回歸擴展到兩個以上變量之間的關(guān)系。在簡單的線性關(guān)系中,我們有一個預測因子和一個響應變量,但在多元回歸中,可以有多個預測變量和一個響應變量。

多元回歸的一般數(shù)學方程為 -

y = a + b1x1 + b2x2 +...bnxn

以下是使用的參數(shù)的描述 -

  • y - 是響應變量。
  • a,b1,b2 … bn - 是系數(shù)。
  • x1,x2,… xn - 是預測變量。

我們使用R中的lm()函數(shù)創(chuàng)建回歸模型。該模型使用輸入數(shù)據(jù)確定系數(shù)的值。 接下來,可以使用這些系數(shù)來預測給定的一組預測變量的響應變量的值。

lm()函數(shù)

該函數(shù)創(chuàng)建預測變量與響應變量之間的關(guān)系模型。

語法

lm()函數(shù)在多元回歸中的基本語法是 -

lm(y ~ x1+x2+x3...,data)

以下是使用的參數(shù)的描述 -

  • formula - 即:y ~ x1+x2+x3...是呈現(xiàn)響應變量和預測變量之間關(guān)系的符號。
  • data - 是應用公式的向量。

示例

輸入數(shù)據(jù)

考慮R環(huán)境中可用的數(shù)據(jù)集mtcars,它比較不同的車型,每加侖里程(mpg),氣缸排量(disp),馬力(hp),汽車重量(wt)和一些更多的參數(shù)。

該模型的目標是建立“mpg”作為響應變量與“disp”“hp”“wt”之間的關(guān)系作為預測變量。為此,我們從mtcars數(shù)據(jù)集創(chuàng)建這些變量的子集。

input <- mtcars[,c("mpg","disp","hp","wt")]
print(head(input))

當我們執(zhí)行上述代碼時,會產(chǎn)生以下結(jié)果 -

                   mpg disp  hp    wt
Mazda RX4         21.0  160 110 2.620
Mazda RX4 Wag     21.0  160 110 2.875
Datsun 710        22.8  108  93 2.320
Hornet 4 Drive    21.4  258 110 3.215
Hornet Sportabout 18.7  360 175 3.440
Valiant           18.1  225 105 3.460

示例: 創(chuàng)建關(guān)系模型并得到系數(shù)

input <- mtcars[,c("mpg","disp","hp","wt")]

# Create the relationship model.
model <- lm(mpg~disp+hp+wt, data = input)

# Show the model.
print(model)

# Get the Intercept and coefficients as vector elements.
cat("# # # # The Coefficient Values # # # ","\n")

a <- coef(model)[1]
print(a)

Xdisp <- coef(model)[2]
Xhp <- coef(model)[3]
Xwt <- coef(model)[4]

print(Xdisp)
print(Xhp)
print(Xwt)

當我們執(zhí)行上述代碼時,會產(chǎn)生以下結(jié)果 -

Call:
lm(formula = mpg ~ disp + hp + wt, data = input)

Coefficients:
(Intercept)         disp           hp           wt  
  37.105505      -0.000937        -0.031157    -3.800891  

# # # # The Coefficient Values # # # 
(Intercept) 
   37.10551 
         disp 
-0.0009370091 
         hp 
-0.03115655 
       wt 
-3.800891

創(chuàng)建回歸模型方程

基于上述截距和系數(shù)值,我們創(chuàng)建了數(shù)學方程,如下所示 -

Y = a+Xdisp.x1+Xhp.x2+Xwt.x3
## 或者 
Y = 37.15+(-0.000937)*x1+(-0.0311)*x2+(-3.8008)*x3

應用公式來預測新值

當提供一組新的位移,馬力和重量值時,我們可以使用上面創(chuàng)建的回歸方程來預測里程。

對于具有disp = 221,hp = 102wt = 2.91的汽車,預計里程預測為 -

Y = 37.15+(-0.000937)*221+(-0.0311)*102+(-3.8008)*2.91 = 22.7104