R/R데이터분석기초(2)
-
단순선형회귀모형
관심변수와 설명변수관심변수(=반응변수,종속변수)- 예측의 대상이 되는 변수 설명변수(=독립변수)- 관심변수 속 차이를 설명할 수 있는 변수 선형 회귀 모형 표기법 정의설명변수(=독립변수)- Y : 수치형 관심변수- X : 수치형 설명변수 선형 회귀 모형의 개념단순선형회귀(simple linear regression) - 수치형 관심변수를 수치형 설명변수의 정비례로 설명하는 모형 - 설명변수 X와 회귀 계수를 활용해서 관심변수 Y를 예측가능 회귀 계수를 계산하고 예측에 활용하기결국은 산점도에 가장 합리적인 추세선(직선을) 구하는 것이다. 그 방법으로 최소 제곱법(least squares method)을 활용 ① X가 평균정도 일 때는 Y도 평균정도로 예측 :따라서 모든 회귀직선은 무게 중심()을 지남 추정..
2019.01.21 -
상관계수
R을 이용한 상관계수 및 산점도 그래프 그리기 연봉 데이터를이용하여 상관계수 및 산점도 그래프에 대한 내용을 정리해보자. 경력과 연봉의 데이터셋 경력 연봉 0 1700 1 2000 2 2400 3 2900 4 3500 5 4100 6 4500 7 5100 8.5700 106500 127500 147800 158000 산점도 그래프# 연봉 예측데이터 불러오기 data = read.csv('data/salary.csv', fileEncoding='UTF-8') # 경력 기준 정렬 data[order(data$experience),] # 산점도와 보조선 그리기 plot(data, pch=16, xlab="Experience", ylab="Salary", col="dodgerblue") # 평균선 그리기 abl..
2019.01.18