독서

데이터 분석의 힘

듬쑥영이 2018. 10. 18. 18:56

우리회사에는 데이터 분석 전문가가 없다. 아마도.

 

통계와 분석은 어떻게 하는 걸까? 이의문으로 이책을 읽는다.

 

언젠가 팀장이...

 

 

경제 성장률 전망 이런거는 어떻게 구하는지 궁금하다는 이야기를 했다.

 

단순한 % 수치이지만 그걸 계산하기 위한 수많은 Input 데이터 들이 있을것이다.

 

그런것에 비하면 우리가 분석하는 데이터의 복잡도는 아무것도 아닌거라도.

 

 

궁금하다.. 데이터 분석은 어떻게 하는것인지

 

http://book.daum.net/detail/book.do?bookid=KOR9791186560792

 

 

데이터 분석 기법의 종류

 

 1. RCT (최선의 데이터 분석법)

 2. RD 디자인 (급격한 변환의 경계선을 찾는 디자인)

 3. 집군분석 (계단식 변화가 있는곳)

 4. 패널데이터 분석 (시간의 흐름에 따른 데이터 분석 )

 

 

데이터 분석의 목적은 인과관계를 찾는것이다.

 

즉 A의 원인으로  B 현상이 나타났다 와 같은것.

 

하지만 사람들은 상관관계를 인과관계로 오해하는 경우로 인해 데이터 분석이 잘못되는 현상이 발생한다.

 

상관관계

 

A 가  B를 만든것이 아니다. (X) 이건 인과관계

 

B로 인해 A에 영향을 끼치고 , C에도 영향을 끼친것

 

EX) 수면중에 불을 켜서 아이가 근시가 되었다.

   

     부모가 근시일수록 아이가 잘때 불을 켜는경우에 영향을 끼친것일 뿐

 

 

인과관계와 상관관계를 구분하는 방법은??

 

잠복변수 V - 상관관계 , 를 모아 이를 배제한다? --> 한계존재

 

편향(bais) -> 분석으로 얻은 추정치의 치우침