본문 바로가기
728x90
반응형

선형회귀4

선형회귀의 트렌드 직선과 PCA의 주성분은 서로 같을까? 주어진 데이터를 선형회귀법으로 분석하여 어떤 직선적인 경향을 따르는지, 또 주어진 데이터의 주성분을 분석하여 차원을 축소시켜 보는 방법들에 대해 다룬 바 있습니다. 선형회귀법은 트렌드 직선의 비밀(선형회귀), 트렌드 직선의 비밀(선형회귀) #2, 트렌드 직선의 비밀(선형회귀) #3 에 걸쳐서 소개한 바 있었습니다. PCA은 주성분 분석(Principal Component Analysis)이란?, 주성분 분석(PCA)의 수학적 접근, 주성분 분석(PCA)의 수학적 접근 #2에서 다룬 바 있었습니다. 관련글들을 읽다 보면 선형회귀 및 PCA를 활용한 예제들도 만나볼 수 있으니 참고해 보시기 바랍니다. 선형회귀와 PCA 접근법의 차이점은? 우선, 차이점은 선형회귀는 주어진 데이터를 잘 설명하는 일차 직선을 찾.. 2024. 4. 9.
트렌드 직선의 비밀(선형회귀) 엑셀실습 #1 이 글은 2022.05.12 - [수학의 재미] - 트렌드 직선의 비밀(선형회귀) #3 트렌드 직선의 비밀(선형회귀) #3 이 글은 2022.05.11 - [수학의 재미] - 트렌드 직선의 비밀(선형회귀) #2 트렌드 직선의 비밀(선형회귀) #2 이 글은 2022.05.10 - [수학의 재미] - 트렌드 직선의 비밀(선형회귀) 에서 이어집니다. $n$개의 데 sine-qua-none.tistory.com 에서 정리된 내용을 통하여 한 예제를 들어 엑셀로 직접 추세선을 그려보는 실습 내용입니다. 실습에 필요한 데이터는 이곳에서 예제로 들었던 데이터를 사용하겠습니다. 데이터는 다음과 같습니다. 가로축이 배달거리이고 세로축이 배달 시간입니다. 배달거리가 늘어날수로 시간이 증가하는 양의 관계가 있음을 알 수 있.. 2022. 5. 13.
트렌드 직선의 비밀(선형회귀) #2 이 글은 2022.05.10 - [수학의 재미] - 트렌드 직선의 비밀(선형회귀) 에서 이어집니다. $n$개의 데이터 $(x_1,y_1), (x_2,y_2),\cdot, (x_n,y_n)$ 이 있고, 이 데이터를 잘 설명하는 직선의 식을 $y=ax+b$라 할 때 우리의 목적은 $$f(a,b) = \sum_{i=1}^n (y_i -(ax_i+b))^2 $$ 를 최소로 하는 $a$와 $b$를 찾는 것입니다. 최솟값을 찾을 땐 보통 미분을 하여 미분값이 0이 되는 점을 찾습니다. 하지만 위의 식은 $a,b$ 이변수 함수인데도 가능할까요? 가능합니다. 대신 미분값이 성분이 2개인 벡터로 표시됩니다. 이를 gradient라 하고 다음처럼 정의합니다. $$\nabla f(a,b) = \Big( \frac{\part.. 2022. 5. 11.
트렌드 직선의 비밀(선형회귀) 데이터 분석을 할 때, 우리는 두 가지 종류의 데이터가 어떤 관계를 가지는지, 어떤 트렌드를 따라가는지를 알고 싶은 경우가 많습니다. 예를 들어, 초등학생의 키와 몸무게 간의 관계 몸무게와 100m 달리기 실력의 관계 집에서 음식점까지의 거리와 배달에 걸리는 시간과의 관계 KOSPI의 수익률과 우리나라 대표주자 삼성전자 수익률간의 관계 KOSPI의 수익률과 KOSPI인버스 ETF 수익률간와 관계 등, 직관적으로 봤을 때 같은 경향성을 가진 예제도 있고(1,3,4번) 반대의 경향성을 가진 예제(2,5번)도 있습니다. 두 데이터 사이의 어떤 관계가 있는지 간단하게 체크할 수 있는 수학적 방법이 있습니다. 바로 트렌드 직선을 이용한 방법인데요, 다른 용어로는 선형회귀법이라고도 합니다. 요즘 배달 문화가 핫하니.. 2022. 5. 10.
728x90
반응형