중회귀 예제

이봐, 아주 좋은 기사. 그것은 내가 회귀 기술 (특별히 ElasticNet)에 대한 내 관점을 넓히는 데 도움이되었지만 여전히 l1과 l2 정규화 기술의 차이점을 해명하는 것이 좋을 것입니다. 이를 위해, http://www.quora.com/What-is-the-difference-between-L1-및-L2-정규화는 매우 도움이 될 것입니다. 그것은 새로운 기사에 통합 될 수 있지만 나는 생각한다. 위에서 언급했듯이 회귀 분석은 두 개 이상의 변수 간의 관계를 추정합니다. 쉬운 예로 이해해 봅시다: x의 변화가 y에 다소 선형적으로 영향을 미친다는 것도 알고 있습니다. 즉, 이러한 `x`s와 `y`s 및 그래프 플롯의 값을 취하면 다음과 같은 그래프를 얻을 수 있습니다. 정확히 동일하지는 않지만 이와 다소 비슷합니다. 이미지 코트시 — https://en.wikipedia.org/wiki/Linear_regression. 예상 회귀 방정식은 상단에 인쇄됩니다: 예측 CASES_18PK = 1,812 – 93.007*PRICE_18PK. 아래 회귀 요약 표에 나타나는 계수가 가격에서 판매를 예측하는 데 어떻게 사용되는지 보여 주며, 이 표는 다음과 같습니다. 이것은 가로채기가 1812 (PRICE_18PK가 0과 같고 실제로 는 결코 가까이 오지 않을 지점의 선의 높이)이며 – 93.007의 기울기를 가지는 직선의 방정식으로, 이는 모델이 93 개의 사례가 o 가치가 있음을 예측한다는 것을 의미합니다.

f 18 팩은 케이스 당 가격의 $ 1 증가 당 판매될 것입니다. 회귀 모델의 절편은 직접적인 경제적 또는 물리적 의미를 가진 숫자는 거의 없습니다. 회귀 모델에 대해 염두에 두어야 할 중요한 점은 회귀 선이 항상 데이터의 질량 중심, 즉 모든 변수가 평균 값과 같은 좌표 공간의 지점을 통과한다는 것입니다. 경사 계수는 독립 변수가 자신의 평균 값에서 멀어질 때 종속 변수의 예상 값이 평균 값에서 벗어나는 방법을 알려줍니다. desciptive 통계 테이블에서, 우리는이 회귀에 대한 데이터의 질량의 중심이 18 팩에 대한 케이스 당 가격이 $16.73이고 판매 된 케이스의 수는 257인 지점임을 알고 있습니다. 이 두 숫자를 아는 것만으로도 회귀 모델을 피팅한 결과에 관계없이 사례당 가격이 $16.73일 때 판매된 257건을 예측해야 한다는 것을 알 수 있습니다. GLM 절차는 예측 변수에 정량적 요인과 범주적 인 요인이 모두 포함된 경우에 유용합니다. 회귀 모델을 피팅할 때 지표면 및 등고선 플롯을 쉽게 작성할 수 있는 기능을 제공합니다. 회귀 방정식은 변수가 표준화되어 평균이 0이고 표준 편차가 1이되도록 하면 더 간단합니다.