일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- bootcamp
- MYSQL
- 2021
- 열심히
- 기초통계
- 코드스테이츠
- leetcode
- 꾸준히
- yolo
- 자료구조
- Codestates
- 부트캠프
- 딥러닝
- pandas
- 독서
- 성실히
- selenium
- 파이썬
- python
- JavaScript
- 선형회귀
- 노마드코더
- 재미져
- 코딩테스트
- SQL
- Ai
- 주간보고
- 리뷰
- 매일매일
- 빅데이터
- Today
- Total
목록Code/머신러닝(ML) (31)
코딩일기
※ 출처 : 해당 내용은 유튜브의 todaycode님의 영상을 참고하였습니다. 더 자세한 내용은 유튜브를 참고 부탁드립니다. 데이터 EDA 연습3¶ ★개요★¶ 1. 머신러닝 실습 진행중 시각화 및 EDA를 진행할 때¶ 2. 미숙한 나의 모습을 발견하여 EDA에 대한 추가적인 공부가 필요하다고 생각하였다.¶ 3. 이에, 무작정 EDA를 100개만 따라해보기로 하였다.¶ 4. 오늘은 3개의 EDA를 따라한 실습내용을 포스팅하고자 합니다.¶ ★학습한 내용★¶ 표준화(standardization) : 데이터가 평균으로 부터 얼마나 떨어져 있는지 나타내는 값으로 변환 (Z-score 표준화) : (측정값 - 평균) / 표준편차 정규화(normalization) : 데이터의 상대적 크기에 대한 영향을 줄이기 위해 ..
안녕하십니까 다제입니다. 오늘은 선형변환에 대해서 알아보도록 하겠습니다. 먼저 변환이란? 입력을 받고 결과물을 반환하는 그 무엇을 변환이라고 합니다. 선형대수의 맥락에서 보자면 input vector를 넣으면 output vector나오지요 그러면 머하러 함수라는 말을 두고 변환이라는 말을 썼을까? 일단 시각적으로 볼때 변환이 선형적이다는 말을 두가지 속성을 의미한다. 1) 모든 선들은 변환 이후에도 휘지 않고 직선이어야 하며 2) 원점은 변환 이후에도 여전히 원점이여야 합니다. 3) 배수를 유지합니다. input vector가 output vector로 변화는지 알려면 두 개의 기저벡터가 어떻게 변하는지만 알면 해결이 됩니다. 선형방정식 계라는 말은 3x + 5y + 4z = 1 5x + 9y + 2z..
안녕하십니까 다제입니다. 오늘은 선형회귀의 중요한 키워드들을 공부해보고자 합니다. 백그라운드 개념으로 필수적이다고 생각되는 가설, 손실함수 & 경사하강법에 대해서 배워보도록 하겠습니다. 저는 경사하강법을 이해하기 위해 미분과 행렬을 배운다고 해도 과언이 아니라고 생각합니다. 1. 경사하강법 저희는 모델(함수)를 만들고 MSE or MAE라는 방법으로 성능을 평가합니다. MSE or MAE의 결과 값이 크면 성능이 안좋고 작으면 성능이 좋다는 걸 알 수 있습니다. 그렇다면 우리는 미분을 통해 특정 지점에서의 순간변화율이 0인 지점을 찾는다면 그 부분이 이 모델에서 성능이 가장 좋은 지점일 것이다. 미분이란? 즉, 우리의 모델과 라이브러리가 고차원의 DataFrame을 계속 미분해가면서 기울기가 가파르지 않..
※ 출처 -. 해당 내용은 유튜브의 todaycode님의 영상을 참고하였습니다. -. 더 자세한 내용은 유튜브를 참고 부탁드립니다. 데이터 EDA 연습1¶ ★개요★¶ 1. 머신러닝 실습 진행중 시각화 및 EDA를 진행할 때¶ 2. 미숙한 나의 모습을 발견하여 EDA에 대한 추가적인 공부가 필요하다고 생각하였다.¶ 3. 이에, 무작정 EDA를 100개만 따라해보기로 하였다.¶ 4. 오늘은 3개의 EDA를 따라한 실습내용을 포스팅하고자 합니다.¶ ★학습한 내용★¶ 그래프에서 단위차이가 날때 어떻게 처리해서 분석해야하는지를 배우게 되었다. In [1]: import pandas as pd import numpy as np import seaborn as sns import FinanceDataReader as..
※ 출처 : 해당 내용은 유튜브의 todaycode님의 영상을 참고하였습니다. 더 자세한 내용은 유튜브를 참고 부탁드립니다. 데이터 EDA 연습1¶ ★개요★¶ 1. 머신러닝 실습 진행중 시각화 및 EDA를 진행할 때¶ 2. 미숙한 나의 모습을 발견하여 EDA에 대한 추가적인 공부가 필요하다고 생각하였다.¶ 3. 이에, 무작정 EDA를 100개만 따라해보기로 하였다.¶ 4. 오늘은 13개의 EDA를 따라한 실습내용을 포스팅하고자 합니다.¶ ★학습한 내용★¶ 1. 금융데이터를 불러오는 라이브러리를 알게 되었다.¶ -. 설치방법 : !pip install -U finance-datareader -. 불러오는 방법 : import FinanceDataReader as fdr 2. 판다스에서 datetime에서 ..
안녕하십니까 다제 입니다. 저희는 머신러닝에 대해서 배우고 있습니다. 지금까지는 회귀에서 대해서 배웠습니다. 복습을 한번 해볼까요? 머신러닝은 지도학습과 비지도학습으로 나뉩니다. 지도학습은 회귀(연속적인 값 예측)와 분류(정해진 몇개의 값 중 예측)로 나눌 수 있습니다. 이제 분류에 대해서 배울 차례인데요 한가지 궁금증이 생깁니다. 선형회귀로는 분류를 하지 못하는 것인가? 정답~~~~? No! 할 수 있습니다. 그런데 권장하지 않습니다! 왜 그런지 한번 알아보도록 하겠습니다~ 예를 들어서 학생들의 학습한 시간을 기준으로 컴퓨터 시험 합격을 예측하는 모델을 만들고 이를 가지고 분류 작업을 해보겠습니다. (단, 성적은 학습 시간에 비례하며 만점은 50점이라고 가정합니다. ) 합격 커트라인 : 30점 지금 같..
안녕하십니까 다제입니다. 어제는 저희가 선형회귀(Linear regression)에 대해서 알아보았습니다. 그러나, 선형회귀는 feature(데이터의 column)를 하나만 사용하기 때문에 실생활에서 사용하기 부정확합니다. 그럼 어떻게 하면 성능을 높일 수 있을가요? 가장 먼저 생각나는 방법은 feature의 수를 늘리는 것입니다. 그럼~ 두 개이상의 feature를 사용하여 저희의 머신러닝의 성능을 높여보죠! ( 혹시 "feature의 수를 늘리는 것"이라는 말이 이해가 안돼시는 분는 접어진 글을 참고 부탁드립니다.) 더보기 오~ 접는 글을 여셨군요! 머신러닝에 관련된 글을 처음보시는 분들이라고 생각이 됩니다. 잘 오셨습니다~! 저는 최대한 머신러닝을 쉽게 말하고자 블로그를 운영하는 다제 입니다. 바로..
안녕하십니까 다제입니다. 오늘은 Linear regression에 대해서 공부를 진행해보도록 하겠습니다. 저는 선형회귀를 공부하는데 정말 많이 많이 많이 어려웠습니다. 그러나, 큰 그림을 잡고나서 다시 보니 생각보다 간단한 거구나? 하는 마음이 들었습니다. 이에, 학습하시는 자료와 데이터는 분명히 있을거라 생각하고 제가 이해한 선형회귀에 대한 큰 그림을 아래와 같이 설명드리겠습니다. 개요 -. Linear regression(선형회귀)은 무엇을 하는 것인가? -. Linear regression(선형회귀)을 위해 알아할 것들은 무엇이 있는가? -. OLS(최소승자법)는 왜 나온거에요? 그게 무엇이죠?? 1. Linear regression(선형회귀) is So What? 위 그림은 방수에 대한 집값을 점..
안녕하십니까 다제입니다. 오느은 선형 회귀의 clustering에 대해서 알아보도록 하겠습니다. 머신러닝 공부를 위해 맨처음 시작되는 글에 아래와 같은 도표를 보여드린 적이 있습니다. 앞에서 배운 차원축소는 지도학습에 해당됩니다. 이제 비지도학습의 대표주자인 k-means clustering에 대해 알아보도록 하겠습니다. (a) -> (f)로 갈수록 그룹화가 되어가는 모습을 보실 수 있습니다. k-means clustering은 정답이 없는데 컴퓨터 혼자서 학습을 하면서 위와 같이 비슷한 그룹이라 판단되는 것끼리 그룹화를 하는 메소드 입니다. Clustering의 목적 위에서도 언급하였듯 Clustering이 대답할수 있는 질문은 주어진 데이터들이 얼마나, 어떻게 유사한지 입니다. 그렇기 때문에 주어진 ..
안녕하세요 다제 입니다. 저는 지금 머신러닝을 배우기 위한 사전 통계적, 수학적 개념을 배우고 있는 중입니다. 그 중에서도 선형대수 & 선형회귀 파트를 공부중에 있습니다. 오늘은 선형 회귀분석 중에서도 차원축소에 대해서 알아보도록 하겠습니다. PCA하는 방법 -> PCA의 component를 구하는 방법 순으로 알아보겠습니다. 우리가 강아지를 알아맞추는 머신러닝을 만든다고 해볼게요 강아지를 나타내는 수 많은 특징들이 feature로 들어갈 수 있습니다. 이 모든 feature을 분석하여 머신러닝을 만든다면 강아지를 알아맞추는데 꽤 정확한 프로그램이 되는게 맞을까요? 실제로 테스트를 진행해보았을 때 일부 feature를 빼고해도 유사하거나 또는 성능이 더 좋게 나오는 경우도 있습니다. 왜냐하면 이 특징들 ..