1. 배경 Y가 연속형이 아닌 범주형일 때는 선형회귀와는 다른 방식으로 접근한다. 즉, 새로운 관측치가 왔을 때, 기존 범주 중 하나로 예측(분류 Classification) 선형회귀에서 배운 최소제곱법으로 추정하긴 어렵다. 선형회귀에선 에러가 정규분포를 따르는것과 같은 가정을 따르지 않기 때문이다. 여기서 파이(i)는 베르누이 분포에서 p(성공할 확률)로 생각하면 된다. 2. 로지스틱 회귀분석 알고리즘: Logistic(Sigmoid) 함수 단순 로지스틱 회귀모델: 입력변수 X가 1개인 로지스틱 회귀모델 하지만 여기서 B1의 해석이 중요한데 비선형결합이기 때문에 직관적이지 못하다. B1의 해석을 위해 승산(Odds)를 정의한다. 3. 승산(Odds) : 성공 확률을 p로 정의할 떄, 실패 대비 성공 확..
1. 개요 X와 Y의 관계 - 확정적 관계: X로 Y를 100% 설명 가능할 때 ex) F = ma - 확률적 관계: X와 오차항으로 Y를 설명해야 할 때 ex) 반도체 수율, 포도주 가격 선형 회귀 모델: 출력변수 Y를 X들의 선형결합으로 표현한 모델 - 선형결합: 변수들을 상수배와 더하기, 빼기로만 결합 목적 - X와 Y 사이의 관계를 수치로 설명 - 미래의 반응변수 Y를 예측 2. 모델 B0, B1, B2 등의 Parameter를 찾는 것이 주요 과정이다. 3. 파라미터 추정(최소제곱법) 일차선형회귀 직선에서 비용함수를 최소화 하는 Parameter를 찾아야 한다. 이때 찾는 일련의 Process를 알고리즘(Algorithm)이라고 한다. 비용함수는 다양한 형태가 있고 각각의 형태마다 Paramet..