Tuyến Tính Và Phi Tuyến

  -  
Chương 11 Hàm hồi quy phi tuyến

Cho mang đến tiếng ta mang định hàm hồi quy là tuyến tính, tức thị tsay đắm số nghiêng của hàm hồi quy là hằng số. Điều này hàm ý, tác động lên (Y) của một đơn vị chức năng biến hóa của (X) không nhờ vào vào quý hiếm của (X). Nếu tác động này thật sự phụ thuộc vào giá trị của (X), ta rất cần phải thực hiện hàm hồi quy phi tuyến.

Bạn đang xem: Tuyến tính và phi tuyến


# prepare the datadata(CASchools)CASchools$kích thước CASchools$students/CASchools$teachersCASchools$score (CASchools$read + CASchools$math) / 2cor(CASchools$income, CASchools$score)
## <1> 0.7124308Ta thấy tất cả sự đối sánh tương quan con đường tính dương ở nhì biến đổi này: các khoản thu nhập trên vừa phải thì điểm thi bên trên vừa đủ. Liệu hồi quy tuyến đường tính có ước chừng được quan hệ tình dục tài liệu.


# fit a simple linear modellinear_Model lm(score ~ income, data = CASchools)# plot the observationsplot(CASchools$income, CASchools$score, col = "steelblue", pch = 20, xlab = "District Income (thousands of dollars)", ylab = "Test Score", cex.main = 0.9, main = "Test Score vs. District Income và a Linear OLS Regression Function")# add the regression line to the plotabline(linear_model, col = "red", lwd = 2)

*

Ta thấy rằng khi thu nhập cao thì con đường hồi quy đã ước chừng “lố” quan hệ đúng dẫu vậy khi thu nhập cá nhân mức độ vừa phải thì mặt đường hồi quy lại ước chừng “không đủ”.

Ta chu đáo một mô hình bậc hai nhỏng sau.

< extĐiểm thi = eta_0 + eta_1 extThu nhập_i + eta_2 extThu nhập_i^2 + u_i>

lúc kia ( extThu nhập_i^2) được sử dụng nhỏng một thay đổi lý giải khác cho điểm thi. Ta lưu ý kết quả vào R nhỏng sau.

income3.851***
(0.268)
I(income2)-0.042***
(0.005)
Constant607.302***
(2.902)
Notes:***Significant at the 1 percent cấp độ.
**Significant at the 5 percent level.
*Significant at the 10 percent level.

Mô hình này chất nhận được ta kiểm định quan hệ tình dục giữa thu nhập với điểm thi là tuyến đường tính giỏi phi con đường bậc nhị. Nói cách khác:

<egincases H_0: eta_2 = 0 \ H_A: eta_2 e 0 endcases>

Ta thấy rằng (H_0) bị chưng vứt làm việc bất kỳ nút ý nghĩa thông thường nào, do đó ta kết luận dục tình thân nhị biến đổi là phi đường. Điều này cũng trùng khớp cùng với mẫu vẽ sau đây.


# draw a scatterplot of the observations for income & demo scoreplot(CASchools$income, CASchools$score, col = "steelblue", pch = trăng tròn, xlab = "District Income (thousands of dollars)", ylab = "Test Score", main = "Estimated Linear và Quadratic Regression Functions")# add a linear function to lớn the plotabline(linear_mã sản phẩm, col = "black", lwd = 2)# add quatratic function to lớn the plotorder_id order(CASchools$income)lines(x = CASchools$income, y = fitted(quadratic_model), col = "red", lwd = 2)

*


11.2 Hàm phi đường so với thay đổi solo nhất


11.2.1 Hàm nhiều thức

Từ ý tưởng phát minh hàm bậc nhì, ta rất có thể không ngừng mở rộng ra thành hàm nhiều thức tổng quát:

Trong R ta sử dụng hàm poly() để thể hiện số bậc mô hình. Chẳng hạn cùng với mô hình bậc 3 ta code nhỏng sau.


# estimate a cubic modelcubic_model lm(score ~ poly(income, degree = 3, raw = TRUE), data = CASchools)
Ta hoàn toàn có thể cần sử dụng kiểm nghiệm những thống kê (F) nhằm xác thực mô hình con đường tính hay phi tuyến đến bậc nào kia. Chẳng hạn, ta quyên tâm đến bậc 3 mô hình.


# kiểm tra the hypothesis of a linear Model against quadratic or polynomial# alternatives# phối up hypothesis matrixR rbind(c(0, 0, 1, 0), c(0, 0, 0, 1))# vày the testlinearHypothesis(cubic_mã sản phẩm, hypothesis.matrix = R, white.adj = "hc1")
## Linear hypothesis test## ## Hypothesis:## poly(income, degree = 3, raw = TRUE)2 = 0## poly(income, degree = 3, raw = TRUE)3 = 0## ## Model 1: restricted model## Model 2: score ~ poly(income, degree = 3, raw = TRUE)## ## Note: Coefficient covariance matrix supplied.## ## Res.Df Df F Pr(>F) ## 1 418 ## 2 416 2 37.691 9.043e-16 ***## ---## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1Ở phía trên ta đang chú ý giả ttiết (H_0: eta_2 = eta_3 = 0) bằng cách lợi dụng phép tân oán ma trận:

<eginaligned mathbfReta &= s \ eginpmatrix 0 và 0 và 1 và 0 \ 0 và 0 & 0 và 1 endpmatrix eginpmatrix eta_0 \ eta_1 \ eta_2 \ eta_3 endpmatrix &= eginpmatrix 0 \ 0 endpmatrix \ eginpmatrix eta_2 \ eta_3 endpmatrix &= eginpmatrix 0 \ 0 endpmatrix endaligned>

Bởi bởi vì hàm linearHypothesis() sử dụng những vector (0) nên việc dùng một ma trận (mathbfR) sẽ tinh giảm được đoạn code. Ta thấy (p)-value tương đối bé dại cùng vì thế ta chưng quăng quật (H_0).

Trong thực tế, nhằm xác định được bậc mô hình, ta đề nghị chu chỉnh (t) nhiều lần trường đoản cú một số trong những bậc lớn nhất làm sao đó (r). Ta rất có thể thấy trong khúc code sau đây.


summary(cubic_model)
## ## Call:## lm(formula = score ~ poly(income, degree = 3, raw = TRUE), data = CASchools)## ## Residuals:## Min 1Q Median 3Q Max ## -44.28 -9.21 0.trăng tròn 8.32 31.16 ## ## Coefficients:## Estimate Std. Error t value## (Intercept) 6.001e+02 5.830e+00 102.937## poly(income, degree = 3, raw = TRUE)1 5.019e+00 8.595e-01 5.839## poly(income, degree = 3, raw = TRUE)2 -9.581e-02 3.736e-02 -2.564## poly(income, degree = 3, raw = TRUE)3 6.855e-04 4.720e-04 1.452## Pr(>|t|) ## (Intercept)
# demo the hypothesis using robust standard errorscoeftest(cubic_mã sản phẩm, vcov. = vcovHC, type = "HC1")
## ## t thử nghiệm of coefficients:## ## Estimate Std. Error t value## (Intercept) 6.0008e+02 5.1021e+00 117.6150## poly(income, degree = 3, raw = TRUE)1 5.0187e+00 7.0735e-01 7.0950## poly(income, degree = 3, raw = TRUE)2 -9.5805e-02 2.8954e-02 -3.3089## poly(income, degree = 3, raw = TRUE)3 6.8549e-04 3.4706e-04 1.9751## Pr(>|t|) ## (Intercept) khi áp dụng khoảng chừng vững vàng, ta thấy kết quả có sự chuyển đổi ở tầm mức ý nghĩa sâu sắc của thông số biến chuyển bậc 3. Điều này có nghĩa ta bác bỏ mang tngày tiết (H_0) hàm hồi quy là bậc hai với (H_A) hàm hồi quy bậc cha trên nấc ý nghĩa sâu sắc (5\%).


11.2.2 Giải phù hợp thông số hồi quy

Chẳng hạn quy mô hồi quy gồm dạng

Vậy nên lúc tăng thu nhập cá nhân từ bỏ (10) lên (11) thì điểm thi tăng (2.96) điểm, nhưng lúc thu nhập tăng trường đoản cú (40) lên (41) thì điểm thi chỉ tăng (0.42). Cho thấy độ nghiêng của hàm hồi quy dốc hơn ở tầm mức thu nhập trung bình cùng thoải rộng ở tầm mức thu nhập cá nhân cao.


# compute and assign the quadratic modelquadriatic_model lm(score ~ income + I(income^2), data = CASchools)# mix up data for predictionnew_data data.frame(income = c(10, 11))# bởi the predictionY_hat predict(quadriatic_model, newdata = new_data)# compute the differencediff(Y_hat)
## 2 ## 2.962517

11.2.3 Hàm Logarithms

Một biện pháp khác để quy bí quyết hàm số phi con đường là sử dụng hàm lograthims lên phát triển thành (Y) hoặc/với (X). Chuyển hàm logarithms đổi khác các biến sang phần trăm chuyển đổi. Có các phương pháp để chế tạo quy mô Theo phong cách tiếp cận logarithm.

Trường thích hợp 1: logarithm (X)

Mô hình trsinh sống thành:


# estimate a level-log modelLinearLog_Model lm(score ~ log(income), data = CASchools)# compute robust summarycoeftest(LinearLog_Mã Sản Phẩm, vcov = vcovHC, type = "HC1")
## ## t demo of coefficients:## ## Estimate Std. Error t value Pr(>|t|) ## (Intercept) 557.8323 3.8399 145.271 Ta vẽ đường hồi quy hệt như sau.


# draw a scatterplotplot(score ~ income, col = "steelblue", pch = đôi mươi, data = CASchools, main = "Linear-Log Regression Line")# add the linear-log regression lineorder_id order(CASchools$income)lines(CASchools$income, fitted(LinearLog_model), col = "red", lwd = 2)

*

Ta hoàn toàn có thể giải thích (hateta_1) như sau. (1\%) lớn lên thu nhập thì điểm thi tăng (0.01 imes 36.42 = 0.36) điểm.

Trường hòa hợp 2: logarithm (Y)

Mô hình vào ngôi trường phù hợp nàgiống hệt như sau.


# estimate a log-linear model LogLinear_mã sản phẩm lm(log(score) ~ income, data = CASchools)# obtain a robust coefficient summarycoeftest(LogLinear_Model, vcov = vcovHC, type = "HC1")
## ## t test of coefficients:## ## Estimate Std. Error t value Pr(>|t|) ## (Intercept) 6.43936234 0.00289382 2225.210 lúc thu nhập cá nhân tăng 1 đơn vị chức năng các khoản thu nhập, điểm thi tăng ((100 imes 0.00284)\% = 0.284\%).

Khi cần sử dụng hàm chuyển dạng cho đổi thay (Y) ta nên cẩn trọng. Mô hình hồi quy đang đến ta ước chừng của (ln(Y)), một phương pháp thông thường, ta hoàn toàn có thể đưa về (hatY) bởi hàm exp(). lúc kia, quy mô gồm dạng:

Từ đó, ta có:

Vì (E(u_i|X_i)=0) đề nghị (E(e^u_i|X_i) = 1), nói theo một cách khác, (E(e^u_i|X_i) e 0). Do đó ước tính (hatY = e^hateta_0 + hateta_1X_i) sẽ bị thiên lệch vì thiếu mất thành tố (E(e^u_i|X_i)). Hình vẽ sau đây vẫn biểu thị sự thiên lệch này.


# draw a scatterplotorder_id order(CASchools$income)par(mfrow = c(1,2))plot(score ~ income, col = "steelblue", pch = 20, data = CASchools, main = "Regression Line with Log Transformation")abline(linear_mã sản phẩm, col = "black", lwd = 2)# add the linear-log regression linelines(CASchools$income, exp(fitted(LogLinear_model)), col = "red", lwd = 2)# draw with different y-axisplot(log(score) ~ income, col = "steelblue", pch = đôi mươi, data = CASchools, main = "Log-Linear Regression Function")lines(CASchools$income, fitted(LogLinear_model), col = "red", lwd = 2)

*

Một phương pháp giải quyết đó là cố gắng ước chừng thành tố thiếu (E(e^u_i|X_i)). Tuy nhiên ví như (u_i) bao gồm hiện tượng heteroskedasticity thì việc ước chừng càng phức hợp hơn.

Một bí quyết giải quyết không giống đó là không thay đổi (ln(Y)). Trong tài chính, vấn đề đó có thể gật đầu đồng ý được Lúc phân tích cốt truyện giá bán gia sản, tức thị phiên phiên bản (ln(Y)) tất cả ý nghĩa sâu sắc kinh tế tài chính.

Trường vừa lòng 2: logarithm (X) và (Y)

Hồi quy log-log gồm dạng nlỗi sau


# estimate the log-log modelLogLog_Model lm(log(score) ~ log(income), data = CASchools)# print robust coefficient summary khổng lồ the consolecoeftest(LogLog_Mã Sản Phẩm, vcov = vcovHC, type = "HC1")

# generate a scatterplotplot(log(score) ~ income, col = "steelblue", pch = trăng tròn, data = CASchools, main = "Log-Linear Regression Function")# add the log-linear regression lineorder_id order(CASchools$income)# add the log-log regression linelines(sort(CASchools$income), fitted(LogLog_model), col = "red", lwd = 2)

*

Ta có thể không ngừng mở rộng biến đổi logarithms bằng phương pháp kết phù hợp với nhiều thức, ta gồm hàm polylog, ví dụ như sau.

< extĐiểm thi_i = eta_0 + eta_1 ln( extThu nhập_i) + eta_2 ln( extThu nhập_i)^2 + eta_3 ln( extThu nhập_i)^3 + u_i>


# estimate the polylog modelpolyLog_Mã Sản Phẩm lm(score ~ log(income) + I(log(income)^2) + I(log(income)^3), data = CASchools)# print robust summary lớn the consolecoeftest(polyLog_model, vcov = vcovHC, type = "HC1")

# compute the adj. R^2 for the nonlinear modelsadj_R2 rbind("Quadratic" = summary(quadratic_model)$adj.r.squared, "Cubic" = summary(cubic_model)$adj.r.squared, "LinearLog" = summary(LinearLog_model)$adj.r.squared, "LogLinear" = summary(LogLinear_model)$adj.r.squared, "LogLog" = summary(LogLog_model)$adj.r.squared, "PolyLog" = summary(polyLog_model)$adj.r.squared)

Adjusted (R^2)
Quadratic0.5540444
Cubic0.5552279
LinearLog0.5614605
LogLinear0.4970106
LogLog0.5567251
PolyLog0.5599944
Ta thấy những hệ số (R^2) hiệu chỉnh sát giao động nhau. Ta có thể so sánh thứ thị của các mô hình này, chẳng hạn như sau.


# generate a scatterplotplot(score ~ income, data = CASchools, col = "steelblue", pch = trăng tròn, main = "Linear-Log and Cubic Regression Functions")# add the linear-log regression lineorder_id order(CASchools$income)lines(CASchools$income, fitted(LinearLog_model), col = "darkgreen", lwd = 2)# add the cubic regression linelines(x = CASchools$income, y = fitted(cubic_model), col = "darkred", lwd = 2)

*

Cả hai đường những ngay gần giống hệt. Tuy nhiên ta thấy mô hình linear-log được ưu tiên rộng vày ít tham số rộng, ta không cần những hàm bậc cao.


11.3 Sự liên hệ giữa những đổi thay độc lập

Có những sự việc trong thực tế liên quan đến tác động lên đổi mới (Y) của sự thay đổi một biến đổi (X_i) lại phụ thuộc vào vào quý giá của một thay đổi (X_j) ((j e i)) không giống. Chẳng hạn, liệu những Quanh Vùng những học sinh học giờ Anh có được lợi gì về khía cạnh điểm số ko từ những việc giảm đồ sộ lớp học. Tgiỏi bởi câu hỏi hồi quy thông thường: điểm số sẽ bị tác động ra sao giả dụ giảm bài bản lớp học. Để Review vụ việc này, ta buộc phải cung ứng quy mô một sự cửa hàng thân những vươn lên là (X).

Ta xét tía trường hợp:

sự cửa hàng giữa nhì phát triển thành nhị phân.sự liên tưởng thân một đổi thay nhị phân và một vươn lên là thường xuyên.sự địa chỉ thân nhì đổi mới liên tục.

Xem thêm: Trò Nuôi Mèo - Adorable Home


11.3.1 Sự liên quan thân hai biến chuyển nhị phân

Mô hình có dạng

Giả sử:

<eginaligned Y_i &= ln( extThu nhập)_i \ D_1i &= egincases 1 ext nếu như fan thứ i gồm bằng cao đẳng \ 0 endcases \ D_2i &= egincases 1 ext giả dụ tín đồ sản phẩm i là nữ \ 0 endcases endaligned>

Ta hiểu được (eta_1) giám sát và đo lường sự khác hoàn toàn trong logarithm các khoản thu nhập vừa phải thân hai nhóm người có bởi cao đẳng với tín đồ không, còn (eta_2) giám sát sự khác biệt vào logarithm thu nhập cá nhân mức độ vừa phải giữa nam cùng đàn bà. Tuy nhiên quy mô này không cho phép ta Review sự tác động của một người có Điểm lưu ý của tất cả (D_1) với (D_2). Do kia ta kiểm soát và điều chỉnh mô hình khuyến nghị thành:

(D_1i imes D_2i) được hotline là biến đổi tác động. Ta thấy:

<eginaligned &E(Y_i|D_1i = 0, D_2i= d_2) = eta_0 + eta_2 imes d_2 \ &E(Y_i|D_1i = 1, D_2i= d_2) = eta_0 +eta_1+eta_2 imes d_2 +eta_3 imes d_2 \&E(Y_i|D_1i = 1, D_2i= d_2) -E(Y_i|D_1i = 0, D_2i= d_2) = eta_1+eta_3 imes d_2 endaligned>

<eginaligned &E(Y_i|D_1i = d_1, D_2i= 0) = eta_0 + eta_1 imes d_1 \ &E(Y_i|D_1i = d_1, D_2i= 1) = eta_0 +eta_1 imes d_1+eta_2 +eta_3 imes d_1 \&E(Y_i|D_1i = d_1, D_2i= 1) -E(Y_i|D_1i = d_1, D_2i= 0) = eta_2+eta_3 imes d_1 endaligned>

Theo kia ta sẽ giải thích được ý nghĩa sâu sắc thông số (eta_3).

Trong R, ta điều tra khảo sát sự thúc đẩy giữa biến hóa STR cùng PctEL. Đặt:

<eginaligned &HiSTR = egincases 1 ext giả dụ STR ge trăng tròn \ 0 endcases \ &HiEL = egincases 1 ext giả dụ PctEL ge 10 \ 0 endcases endaligned>


# append HiSTR to CASchoolsCASchools$HiSTR as.numeric(CASchools$kích cỡ >= 20)# append HiEL to lớn CASchoolsCASchools$HiEL as.numeric(CASchools$english >= 10)
Ta ước tính mô hình.


# estimate the Mã Sản Phẩm with a binary interaction termbi_Model lm(score ~ HiSTR * HiEL, data = CASchools)# print a robust summary of the coefficientscoeftest(bi_model, vcov. = vcovHC, type = "HC1")
## ## t demo of coefficients:## ## Estimate Std. Error t value Pr(>|t|) ## (Intercept) 664.1433 1.3881 478.4589

11.3.2 Sự tương tác giữa một thay đổi liên tục và trở thành nhị phân

Đặt (X_i) diễn đạt số năm kinh nghiệm tay nghề của tín đồ máy (i), là vươn lên là bỗng nhiên liên tiếp. Ta biến đổi (D_1i) thành trở thành (D_i). Mô hình bắt đầu đề xuất:

Ta thêm vào tác động địa chỉ bằng cách thêm trở thành ((X_i imes D_i)) vào mô hình. Vấn đề này đang làm độ nghiêng mặt đường hồi quy dựa vào vào vươn lên là (D_i). Có bố trường hợp:

cùng độ nghiêng dẫu vậy khác intercept: (Y_i = eta_0 + eta_1 X_i + eta_2 D_i + u_i)thuộc intercept tuy thế khác độ nghiêng: (Y_i = eta_0 + eta_1 X_i + eta_2 (X_i imes D_i) + u_i)không giống intercept khác độ nghiêng: (Y_i = eta_0 + eta_1 X_i + eta_2 D_i + eta_3 (X_i imes D_i) u_i)

# generate artificial dataset.seed(1)X runif(200,0, 15)D sample(0:1, 200, replace = T)Y 450 + 150 * X + 500 * D + 50 * (X * D) + rnorm(200, sd = 300)# divide plotting area accordinglym rbind(c(1, 2), c(3, 0))graphics::layout(m)# estimate the models và plot the regression lines# 1. (baseline model)plot(X, log(Y), pch = đôi mươi, col = "steelblue", main = "Different Intercepts, Same Slope")mod1_coef lm(log(Y) ~ X + D)$coefficientsabline(coef = c(mod1_coef<1>, mod1_coef<2>), col = "red", lwd = 1.5)abline(coef = c(mod1_coef<1> + mod1_coef<3>, mod1_coef<2>), col = "green", lwd = 1.5) # 2. (baseline model + interaction term)plot(X, log(Y), pch = 20, col = "steelblue", main = "Different Intercepts, Different Slopes")mod2_coef lm(log(Y) ~ X + D + X:D)$coefficientsabline(coef = c(mod2_coef<1>, mod2_coef<2>), col = "red", lwd = 1.5)abline(coef = c(mod2_coef<1> + mod2_coef<3>, mod2_coef<2> + mod2_coef<4>), col = "green", lwd = 1.5)# 3. (omission of D as regressor + interaction term)plot(X, log(Y), pch = trăng tròn, col = "steelblue", main = "Same Intercept, Different Slopes")mod3_coef lm(log(Y) ~ X + X:D)$coefficientsabline(coef = c(mod3_coef<1>, mod3_coef<2>), col = "red", lwd = 1.5)abline(coef = c(mod3_coef<1>, mod3_coef<2> + mod3_coef<3>), col = "green", lwd = 1.5)

*

Ta áp dụng vào R bằng phương pháp nhận xét tác động giữa kích thước và HiEL theo phương thức trang bị cha.


# estimate the modelbci_Mã Sản Phẩm lm(score ~ form size + HiEL + form size * HiEL, data = CASchools)# print robust summary of coefficients to the consolecoeftest(bci_model, vcov. = vcovHC, type = "HC1")
# identify observations with PctEL >= 10id CASchools$english >= 10# plot observations with HiEL = 0 as red dotsplot(CASchools$size, CASchools$score, xlyên ổn = c(0, 27), yllặng = c(600, 720), pch = trăng tròn, col = "red", main = "", xlab = "Class Size", ylab = "Test Score")# plot observations with HiEL = 1 as green dotspoints(CASchools$size, CASchools$score, pch = đôi mươi, col = "green")# read out estimated coefficients of bci_modelcoefs bci_model$coefficients# draw the estimated regression line for HiEL = 0abline(coef = c(coefs<1>, coefs<2>), col = "red", lwd = 1.5)# draw the estimated regression line for HiEL = 1abline(coef = c(coefs<1> + coefs<3>, coefs<2> + coefs<4>), col = "green", lwd = 1.5 )# add a legend khổng lồ the plotlegend("topright", pch = c(trăng tròn, 20), col = c("red", "green"), legend = c("HiEL = 0", "HiEL = 1"))

*


11.3.3 Sự thúc đẩy thân nhị biến đổi liên tục

Sự liên tưởng giữa nhị biến hóa liên tiếp (X_1) với (X_2) được Reviews thông qua (X_1 imes X_2). Lúc kia, quy mô trngơi nghỉ thành:

Đánh giá bán đạo hàm theo (X_1) cùng (X_2) ta sẽ có:

Áp dụng trong R, ta Reviews size với english.


# estimate regression model including the interaction between 'PctEL' & 'size'cci_Mã Sản Phẩm lm(score ~ form size + english + english * form size, data = CASchools) # print a summary to the consolecoeftest(cci_Mã Sản Phẩm, vcov. = vcovHC, type = "HC1")
## ## t chạy thử of coefficients:## ## Estimate Std. Error t value Pr(>|t|) ## (Intercept) 686.3385268 11.7593466 58.3654

11.3.4 Phân tích tài liệu Cầu Economic Journals

Trong phần này, ta so với dữ liệu Journals trong package AER, bao gồm các quan tiền gần kề của 180 tập san kỹ thuật trong những năm 2000. Ta giám sát giá thành cho từng citation và tính tân oán tuổi của journal cùng con số cam kết tự cho từng journal.


data("Journals")# define và rename variablesJournals$PricePerCitation Journals$price/Journals$citationsJournals$Age 2000 - Journals$foundingyearJournals$Characters Journals$charpp * Journals$pages/10^6Journals$Subscriptions Journals$subs
Vùng quý hiếm của PricePerCitation khá rộng với trang trải.


# compute summary statistics for price per citationsummary(Journals$PricePerCitation)
(ln (Subscriptions_i) = eta_0 + eta_1 ln (PricePerCitation_i) + u_i)(ln (Subscription_i) = eta_0 +eta_1 ln(PricePerCitation_i) + eta_4ln(Age_i) + eta_6 ln(Characters_i) + u_i)(ln (Subscription_i) = eta_0 +eta_1 ln(PricePerCitation_i) + eta_2 ln(PricePerCitation_i)^2+eta_3 ln(PricePerCitation_i)^3 + eta_4ln(Age_i) + eta_5 + eta_6 ln(Characters_i) + u_i)(ln (Subscription_i) = eta_0 +eta_1 ln(PricePerCitation_i) + eta_4ln(Age_i) +eta_5+ eta_6 ln(Characters_i) + u_i)

# Estimate models (I) - (IV)Journals_mod1 lm(log(Subscriptions) ~ log(PricePerCitation), data = Journals)Journals_mod2 lm(log(Subscriptions) ~ log(PricePerCitation) + log(Age) + log(Characters), data = Journals)Journals_mod3 lm(log(Subscriptions) ~ log(PricePerCitation) + I(log(PricePerCitation)^2) + I(log(PricePerCitation)^3) + log(Age) + log(Age):log(PricePerCitation) + log(Characters), data = Journals)Journals_mod4 lm(log(Subscriptions) ~ log(PricePerCitation) + log(Age) + log(Age):log(PricePerCitation) + log(Characters), data = Journals)
Sử dụng summary() ta đạt được kết quả sau.

(ln (hatSubscriptions_i) = 4.77 - 0.53 ln (PricePerCitation_i))(eginalignedln (hatSubscriptions_i) = &3.21 - 0.41 ln(PricePerCitation_i) + 0.42ln(Age_i) \&+ 0.21 ln(Characters_i) endaligned)(eginalignedln (hatSubscriptions_i) = &3.41 -0.96 ln(PricePerCitation_i) + 0.02 ln(PricePerCitation_i)^2\&+0.004 ln(PricePerCitation_i)^3 + 0.37ln(Age_i) \&+ 0.16 + 0.23 ln(Characters_i)endaligned)(eginalignedln (hatSubscriptions_i) = &3.43 -0.90 ln(PricePerCitation_i) + 0.37ln(Age_i) \&+0.14+ 0.23 ln(Characters_i)endaligned)

Ta rất có thể sử dụng kiểm định (F) nhằm soát sổ quy cách polylog đối với đổi thay (ln(PricePerCitation_i)).


# F-Test for significance of cubic termslinearHypothesis(Journals_mod3, c("I(log(PricePerCitation)^2)=0", "I(log(PricePerCitation)^3)=0"), vcov. = vcovHC, type = "HC1")
## Linear hypothesis test## ## Hypothesis:## I(log(PricePerCitation)^2) = 0## I(log(PricePerCitation)^3) = 0## ## Model 1: restricted model## Model 2: log(Subscriptions) ~ log(PricePerCitation) + I(log(PricePerCitation)^2) + ## I(log(PricePerCitation)^3) + log(Age) + log(Age):log(PricePerCitation) + ## log(Characters)## ## Note: Coefficient covariance matrix supplied.## ## Res.Df Df F Pr(>F)## 1 175 ## 2 173 2 0.1943 0.8236Ta không thể bác quăng quật (H_0:eta_3 = eta_4 = 0) so với mô hình (III). Kết trái quy mô được trình bày vào bảng sau đây.

log(Subscriptions)
(I)(II)(III)(IV)
(1)(2)(3)(4)
log(PricePerCitation)-0.533***-0.408***-0.961***-0.899***
(0.034)(0.044)(0.160)(0.145)
I(log(PricePerCitation)2)0.017
(0.025)
I(log(PricePerCitation)3)0.004
(0.006)
log(Age)0.424***0.373***0.374***
(0.119)(0.118)(0.118)
log(Characters)0.206**0.235**0.229**
(0.098)(0.098)(0.096)
log(PricePerCitation):log(Age)0.156***0.141***
(0.052)(0.040)
Constant4.766***3.207***3.408***3.434***
(0.055)(0.380)(0.374)(0.367)
Observations180180180180
R20.5570.6130.6350.634
Adjusted R20.5550.6070.6220.626
Residual Std. Error0.750 (df = 178)0.705 (df = 176)0.691 (df = 173)0.688 (df = 175)
F Statistic224.037*** (df = 1; 178)93.009*** (df = 3; 176)50.149*** (df = 6; 173)75.749*** (df = 4; 175)
Notes:***Significant at the 1 percent level.
**Significant at the 5 percent màn chơi.
*Significant at the 10 percent cấp độ.

Hình hoạ những quy mô nlỗi sau.


# divide plotting aream rbind(c(1, 2), c(3, 0))graphics::layout(m)# scatterplotplot(Journals$PricePerCitation, Journals$Subscriptions, pch = trăng tròn, col = "steelblue", ylab = "Subscriptions", xlab = "ln(Price per ciation)", main = "(a)")# log-log scatterplot and estimated regression line (I)plot(log(Journals$PricePerCitation), log(Journals$Subscriptions), pch = đôi mươi, col = "steelblue", ylab = "ln(Subscriptions)", xlab = "ln(Price per ciation)", main = "(b)")abline(Journals_mod1, lwd = 1.5)# log-log scatterplot and regression lines (IV) for Age = 5 and Age = 80plot(log(Journals$PricePerCitation), log(Journals$Subscriptions), pch = đôi mươi, col = "steelblue", ylab = "ln(Subscriptions)", xlab = "ln(Price per ciation)", main = "(c)")JM4C $coefficients# Age = 80abline(coef = c(JM4C<1> + JM4C<3> * log(80), JM4C<2> + JM4C<5> * log(80)), col = "darkred", lwd = 1.5)# Age = 5abline(coef = c(JM4C<1> + JM4C<3> * log(5), JM4C<2> + JM4C<5> * log(5)), col = "darkgreen", lwd = 1.5)

*

Những Kết luận có thể được rút ra:

Cầu của tạp chí giãn nở những đối với những tạp chí tthấp tuổi.Việc ko bác bỏ vứt (H_0) của kiểm định (F) đối với quy mô (III) thống tuyệt nhất với quan hệ nam nữ tuyến tính thân log(subscriptions) và log(price).Cầu cao hơn đối với tập san những cam kết từ, với giá với tuổi ko đổi khác.

Cầu tạp chí phi co giãn cùng với giá: ta thấy quy mô (IV), kể cả tập san ttốt tuổi ((Age=5)) ta thấy ước chừng độ co và giãn giá chỉ (-0.899+0.374 imes ln(5)+ 0.141 imes approx -0.3), nghĩa là một trong những phần trăm tăng giá dẫn đến cầu bớt chỉ (0.3) Tỷ Lệ. Kết quả này không tồn tại gì quá bất ngờ bởi mối cung cấp tiêu thụ cổng output của những tập san hay là các thỏng viện.


11.4 Bài tập


11.4.1 Bài 1: Hệ số đối sánh cùng Phi con đường 1

Xem xét mô hình đối kháng giản:

cùng với (medv) là trung vị giá nhà với (lstat) là xác suất hộ mái ấm gia đình cùng với tình trạng kinh tế tài chính rẻ, trong bộ dữ liệu Boston.

Tính hệ số đối sánh thân (medv) cùng (lstat) với lưu vào vươn lên là corr.Đồ thị hoá medv và lstat với phân phối mặt đường hồi quy thủ thuật. Nhận xét.
eyJsYW5ndWFnZSI6InIiLCJzYW1wbGUiOiJkYXRhKFwiQm9zdG9uXCIpXG5tb2QgPC0gbG0obWVkdiB+IGxzdGF0ICwgZGF0YSA9IEJvc3RvbilcbiMgY29tcHV0ZSB0aGUgY29ycmVsYXRpb24gYmV0d2VlbiBtZWR2IGFuZCBsc3RhdFxuXG5cbiMgcGxvdCBtZWR2IGFnYWluc3QgbHN0YXQgYW5kIGFkZCB0aGUgcmVncmVzc2lvbiBsaW5lIiwic29sdXRpb24iOiIjIGNvbXB1dGUgdGhlIGNvcnJlbGF0aW9uIGJldHdlZW4gbWVkdiBhbmQgbHN0YXRcbmNvcnIgPC0gY29yKEJvc3RvbiRtZWR2LCBCb3N0b24kbHN0YXQpXG5cbiMgcGxvdCBtZWR2IGFnYWluc3QgbHN0YXQgYW5kIGFkZCB0aGUgcmVncmVzc2lvbiBsaW5lXG5wbG90KG1lZHYgfiBsc3RhdCwgZGF0YSA9IEJvc3RvbilcbmFibGluZShyZWcgPSBtb2QsIGNvbCA9IFwicmVkXCIpIn0=

11.4.2 Bài 2: Hệ số đối sánh cùng Phi tuyến đường 2

Ta cẩn thận mối quan hệ tiếp sau đây.

Thực hiện tại hồi quy cùng lưu trữ vào trở nên log_mod.Mô tả điểm rải cùng tiếp tế mặt đường hồi quy. So sánh cùng với tác dụng bài bác trước.
eyJsYW5ndWFnZSI6InIiLCJzYW1wbGUiOiIjIGNvbmR1Y3QgdGhlIHJlZ3Jlc3Npb24gYW5kIGFzc2lnbiBpdCB0byBtb2RfbG9nXG5cblxuIyBkcmF3IGEgc2NhdHRlcnBsb3QgYW5kIGFkZCB0aGUgcmVncmVzc2lvbiBsaW5lIiwic29sdXRpb24iOiIjIGNvbmR1Y3QgdGhlIHJlZ3Jlc3Npb24gYW5kIGFzc2lnbiBpdCB0byBtb2RfbG9nXG5tb2RfbG9nIDwtIGxtKG1lZHYgfiBsb2cobHN0YXQpLCBkYXRhID0gQm9zdG9uKVxuXG4jIGRyYXcgYSBzY2F0dGVycGxvdCBhbmQgYWRkIHRoZSByZWdyZXNzaW9uIGxpbmVcbnBsb3QobWVkdiB+IGxvZyhsc3RhdCksIGRhdGEgPSBCb3N0b24pXG5hYmxpbmUobW9kX2xvZywgY29sID0gXCJyZWRcIikifQ==

11.4.3 Bài 3: Bậc đa thức tối ưu

Ta thấy làm việc bài bác tập trước quy cách (medv_i = eta_0 + eta_1 imes log(lstat_i) + u_i) là một trong sự tuyển lựa hợp lí. Tuy nhiên, nhiều thức bậc cao so với (log(lstat_i)) rất có thể cân xứng hơn.

Giả sử bậc cao nhất xem xét là (r=4), sử dụng for() nhằm chọn ra bậc về tối ưu Theo phong cách tiếp sau đây.

Ước lượng quy mô, hack, ban đầu từ bỏ (r=4).Lưu biến hóa (p)-value vững vàng của các tmê man số tương quan cùng so sánh với mức ý nghĩa (0.05).Nếu chẳng thể bác bỏ vứt mô hình, tái diễn bước (i) và (ii) so với bậc thấp rộng.Dừng lại cho tới khi lựa chọn ra được bậc tối ưu.

Tính (R^2) của quy mô được lựa chọn với phân bổ vào R2.


eyJsYW5ndWFnZSI6InIiLCJzYW1wbGUiOiIjIGZpbmQgdGhlIG9wdGltYWwgcG9seW5vbWlhbCBvcmRlciBvZiB0aGUgcG9seWxvZyBtb2RlbFxuXG5cblxuXG5cblxuXG5cblxuIyBleHRyYWN0IHRoZSBSXjIgZnJvbSB0aGUgc2VsZWN0ZWQgbW9kZWwgYW5kIGFzc2lnbiBpdCB0byBSMiIsInNvbHV0aW9uIjoiIyBmaW5kIHRoZSBvcHRpbWFsIHBvbHlub21pYWwgb3JkZXIgb2YgdGhlIHBvbHlsb2cgbW9kZWxcbmZvcihpIGluIDQ6MSl7XG5tb2QgIDwtIGxtKG1lZHYgfiBwb2x5KGxvZyhsc3RhdCksIGksIHJhdyA9IFQpLCBkYXRhID0gQm9zdG9uKVxucHZhbCA8LSBjb2VmdGVzdChtb2QsIHZjb3YgPSB2Y292SEMpWyhpKzEpLCA0XVxuaWYocHZhbCA8IDAuMDUpe1xuICBwcmludChpKVxuICBicmVha1xuICB9XG59XG5cbiMgZXh0cmFjdCB0aGUgUl4yIGZyb20gdGhlIHNlbGVjdGVkIG1vZGVsIGFuZCBhc3NpZ24gaXQgdG8gUjJcblIyIDwtIHN1bW1hcnkobW9kKSRyLnNxdWFyZWQifQ==

11.4.4 Bài 4: Tương tác thân các đổi mới hòa bình 1

Xem mô hình hồi quy

trong số đó (chas_i) với (old_i) là các đổi thay giả. Đối cùng với đổi thay đầu, có giá trị (1) giả dụ sông Charles (một dòng sông cạnh bên Boston) đi ngang qua khu vực vự (i), phát triển thành sau có quý hiếm (1) nếu (age ge 95).

Tạo lập vươn lên là giả old.Thực hiện hồi quy trong mod_bb.Tổng vừa lòng hệ số hồi quy vững vàng.
eyJsYW5ndWFnZSI6InIiLCJzYW1wbGUiOiIjIGdlbmVyYXRlIHRoZSBiaW5hcnkgdmFyaWFibGUgYG9sZGAgYW5kIGFwcGVuZCBpdCB0byB0aGUgZGF0YXNldFxuXG5cbiMgY29uZHVjdCB0aGUgcmVncmVzc2lvbiBhbmQgYXNzaWduIGl0IHRvIGBtb2RfYmJgXG5cblxuIyBwcmludCBhIHJvYnVzdCBzdW1tYXJ5IHRvIHRoZSBjb25zb2xlIiwic29sdXRpb24iOiIjIGdlbmVyYXRlIHRoZSBiaW5hcnkgdmFyaWFibGUgYG9sZGAgYW5kIGFwcGVuZCBpdCB0byB0aGUgZGF0YXNldFxuQm9zdG9uJG9sZCA8LSBhcy5udW1lcmljKEJvc3RvbiRhZ2UgPj0gOTUpXG5cbiMgY29uZHVjdCB0aGUgcmVncmVzc2lvbiBhbmQgYXNzaWduIGl0IHRvIGBtb2RfYmJgXG5tb2RfYmIgPC0gbG0obWVkdiB+IGNoYXMqb2xkLCBkYXRhID0gQm9zdG9uKVxuXG4jIHByaW50IGEgcm9idXN0IHN1bW1hcnkgdG8gdGhlIGNvbnNvbGVcbmNvZWZ0ZXN0KG1vZF9iYiwgdmNvdi4gPSB2Y292SEMpIn0=

11.4.5 Bài 5: Tương tác thân những phát triển thành tự do 2

Bây tiếng chú ý mô hình hồi quy

Dùng ?Boston nhằm xem thêm ý nghĩa sâu sắc những phát triển thành vào quy mô. Biến old đã có được append vào cỗ tài liệu Boston.

Xem thêm: Tỷ Lệ Và Mức Đóng Bảo Hiểm Xã Hội 2016 Mới Nhất ( Bhxh, Bhyt, Bhtn, Kpcđ)

Ước lượng quy mô hồi quy với lưu vào biến chuyển mod_bc.Lấy những hệ số hồi quy lưu lại vào biến params.Vẽ mặt đường hồi quy medv với indus đến hai trường vừa lòng của old.
eyJsYW5ndWFnZSI6InIiLCJzYW1wbGUiOiIjIGNvbmR1Y3QgdGhlIHJlZ3Jlc3Npb24gYW5kIGFzc2lnbiBpdCB0byBtb2RfYmMuXG5cblxuIyBleHRyYWN0IHRoZSBlc3RpbWF0ZWQgbW9kZWwgY29lZmZpY2llbnRzIGFuZCBhc3NpZ24gdGhlbSB0byBwYXJhbXMuXG5cblxuIyBwbG90IG1lZHYgYWdhaW5zdCBpbmR1cyBhbmQgYWRkIHRoZSByZWdyZXNzaW9uIGxpbmVzLiIsInNvbHV0aW9uIjoiIyBjb25kdWN0IHRoZSByZWdyZXNzaW9uIGFuZCBhc3NpZ24gaXQgdG8gbW9kX2JjLlxubW9kX2JjIDwtIGxtKG1lZHYgfiBpbmR1cypvbGQsIGRhdGEgPSBCb3N0b24pXG5cbiMgZXh0cmFjdCB0aGUgZXN0aW1hdGVkIG1vZGVsIGNvZWZmaWNpZW50cyBhbmQgYXNzaWduIHRoZW0gdG8gcGFyYW1zLlxucGFyYW1zIDwtIGNvZWYobW9kX2JjKVxuXG4jIHBsb3QgbWVkdiBhZ2FpbnN0IGluZHVzIGFuZCBhZGQgdGhlIHJlZ3Jlc3Npb24gbGluZXMuXG5wbG90KG1lZHYgfiBpbmR1cywgZGF0YSA9IEJvc3RvbilcbmFibGluZShhID0gcGFyYW1zWzFdLCBiID0gcGFyYW1zWzJdLCBjb2wgPSBcInJlZFwiKVxuYWJsaW5lKGEgPSBwYXJhbXNbMV0gKyBwYXJhbXNbM10sIGIgPSBwYXJhbXNbMl0gKyBwYXJhbXNbNF0sIGNvbCA9IFwiZGFya2JsdWVcIikifQ==