코딩일기

The Actual Difference Between Statistics and Machine Learning(feat. statistics study) 본문

Code/머신러닝(ML)

The Actual Difference Between Statistics and Machine Learning(feat. statistics study)

daje 2021. 12. 2. 14:06
728x90
반응형

 

 

 

 

안녕하십니까 다제입니다. 

 

오늘은 전통 통계와 머신러닝의 차이점이 무엇인지에 대해서 생각해보았습니다. 

 

해당 포스팅은 towards blog post, cognitive class youtube 영상을 참고하여 작성되었습니다. 

 

 


 

 

◆ 결론

  -. 통계와 기계학습의 가장 큰 차이점은 설명 가능성입니다. 

  * 여기에서 말하는 설명 가능성이란, 수학적으로 증명이 가능하는 설명 가능성을 의미합니다. 

  -. 통계는 수학적으로 설명이 가능하나 기계학습은 아직 수학적으로 모든 것이 설명 가능하지 않습니다.

 

개요 

  -. 머신러닝 학습 중 통계를 배제하고 이야기할 수 없었습니다. 

  -. 이에, 각각의 차이점에 대해서 알아보는 시간을 갖고자 합니다. 

 

정의 

  -. 기계학습 : 표준 프로그래밍 방식에 의존하지 않고 데이터에서 학습할 수 있는 알고리즘

  -. 통계 : 결과를 예측하기 위해 변수 간의 관계를 찾는 것을 다루는 수학의 하위 필드 

 

◆ 특징 

구분 Statistics Machine Learning
Approach
Data Generating Process

Algoithmic Model
공통점(Focus)
예측
(Hypothesis Testing, Interpretability)

예측
(Predictive Accuracy)
차이점(Interpretability)
해석 가능성 High↑

해석 가능성 Low↓
Driver
Math, Theory

Fitting Data
Data size
Any Reasonable Set

Big data
Dimensions
Used Mostly for Low Dimensions

High Dimensions
Inference
Parameter Estimation, predictions,
Estimating Error Bars

Prediction
Model Choice
Parameter Significance, 
Insample Goodness of Fit 

Cross-validation 

 

 


 

 

이와 같이 통계와 기계학습에 대해서 알아보았습니다. 

 

앞으로 인공지능을 학습하실 때 조금이나마 도움이 되었으면 좋겠습니다. 

 

감사합니다. 

 

 

728x90
반응형