일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- SQL
- python
- Ai
- 재미져
- selenium
- yolo
- Codestates
- 선형회귀
- 딥러닝
- MYSQL
- 성실히
- 코딩테스트
- 2021
- 매일매일
- 빅데이터
- bootcamp
- 꾸준히
- 파이썬
- 노마드코더
- 부트캠프
- pandas
- 독서
- 기초통계
- 리뷰
- 주간보고
- leetcode
- 코드스테이츠
- JavaScript
- 열심히
- 자료구조
- Today
- Total
목록분류 전체보기 (186)
코딩일기
안녕하십니까 다제입니다. 브루스테이트의 세븐랭귀지라는 책을 읽고자 하였으나, io, ruby, 스칼라 등 개발에 관련된 서적이였다. 처음 소개 받기로는 생각하는 폭을 넓힐 수 있다고 하여 선정했으나, 지금 당장 나에게 꼭 필요한 서적은 아니라고 생각되었다. 이에, CODE(하드웨어와 소프트웨어에 숨어 있는 언어)라는 책을 읽어보고자 한다. 총 25chapter로 구성었기에 하루에 1chapter씩 25일을 목표로 잡고 있다. 1. 읽게 된 계기 -. 노마드코더 니콜라스(니꼬)가 추천해서! -. 컴퓨터는 어떻게 0과 1로써 이렇게 다양한 일을 할 수 있는걸까? -. 과연 컴퓨터는 어떻게 데이터를 저장하는가? -. 어떻게 정보가 사람의 언어 -> 기계어 -> 사람의 언어로 전달이 될 수 있을까? ∴ 위와 같..
안녕하십니까 다제입니다. 오느은 선형 회귀의 clustering에 대해서 알아보도록 하겠습니다. 머신러닝 공부를 위해 맨처음 시작되는 글에 아래와 같은 도표를 보여드린 적이 있습니다. 앞에서 배운 차원축소는 지도학습에 해당됩니다. 이제 비지도학습의 대표주자인 k-means clustering에 대해 알아보도록 하겠습니다. (a) -> (f)로 갈수록 그룹화가 되어가는 모습을 보실 수 있습니다. k-means clustering은 정답이 없는데 컴퓨터 혼자서 학습을 하면서 위와 같이 비슷한 그룹이라 판단되는 것끼리 그룹화를 하는 메소드 입니다. Clustering의 목적 위에서도 언급하였듯 Clustering이 대답할수 있는 질문은 주어진 데이터들이 얼마나, 어떻게 유사한지 입니다. 그렇기 때문에 주어진 ..
안녕하세요 다제 입니다. 저는 지금 머신러닝을 배우기 위한 사전 통계적, 수학적 개념을 배우고 있는 중입니다. 그 중에서도 선형대수 & 선형회귀 파트를 공부중에 있습니다. 오늘은 선형 회귀분석 중에서도 차원축소에 대해서 알아보도록 하겠습니다. PCA하는 방법 -> PCA의 component를 구하는 방법 순으로 알아보겠습니다. 우리가 강아지를 알아맞추는 머신러닝을 만든다고 해볼게요 강아지를 나타내는 수 많은 특징들이 feature로 들어갈 수 있습니다. 이 모든 feature을 분석하여 머신러닝을 만든다면 강아지를 알아맞추는데 꽤 정확한 프로그램이 되는게 맞을까요? 실제로 테스트를 진행해보았을 때 일부 feature를 빼고해도 유사하거나 또는 성능이 더 좋게 나오는 경우도 있습니다. 왜냐하면 이 특징들 ..
안녕하세요 다제입니다. 요즘 부트캠프에서 수학, 통계 관련된 어려운 개념을 배우고 있습니다. 그러다보니 자연스럽게 제가 지향하는 코딩하는 거리가 점점 멀어지고 있습니다... 제가 지향하는 코딩에 대해서 모르시는 분들을 위해 간단히 기재하자면 "일상에 단순 반복되는 업무를 코딩(분석, 프로그래밍) 통해 개선하자" 입니다. Discord로 부트캠프를 진행하는데, 반복적인 공지들이 있더라구요 그런 의미에서 오늘은 Discord 알림(공지) 봇을 만들어 보겠습니다. [ 반복되는 공지들 ] (오전) 09시 - 로그인 하세요 (오후) 16시 30분 - 질문 제출하세요 (오후) 18시 - 로그아웃 하세요 (오후) 21시 - 과제 제출 시간이 종료되었습니다. 그런데 이걸 우리가 직접하고 있다면 시간도 뺏기고 저 공지를..
안녕하십니까 다제입니다. 오늘은 머신러닝을 위한 반드시 알아야할 미분에 대해서 알아보도록 하겠습니다. 먼저 미분이 왜 필요한지?? 미분은 무엇인지?? 에 대해 이야기를 해야할 거 같아요~ 머신러닝에서 미분의 필요성 우리는 머신러닝이 경험을 통해 특정 작업에 대한 성능이 좋아지는 프로그램이라는 것을 알고 있습니다. 그렇다면 해당 머신러닝의 성능이 좋은지 안좋은지를 어떻게 알 수 있을까요? 결론부터 말씀드리면, (미분)함수를 통해 해당 머신러닝의 성능평가를 진행하게 됩니다. 정말 단순화하여 설명드려보겠습니다. 위 2차 그래프에서 극소점으로 내려갈수록 성능이 좋아진다고 가정해보겠습니다. 그렇다면 현재 위치를 확인한 후 극소점이 있는 방향으로 가야겠지요? 이때 기울기를 가지고 덜 가파른 지점으로 이동을 하게 됩..
안녕하십니까 다제입니다. 오늘은 선형대수학에 대해서 공부를 해보고자 합니다. 우리는 앞에서 선형대수학은 일차식이나 일차 함수를 공부하는 학문이라고 정의하고 왔습니다. 그렇다면 일차식? 일차함수? 이런 용어부터 정의하고 넘어가야겠죠? 1. 일차식 vs 다항식 vs 일차함수의 개념 -. 일차식 : 가장 높은 차수가 1인 다항식 -. 다항식 : 단항식들의 덧셈과 뺄셈으로 이루어진 식 -. 일차함수 : 차수가 1차인 함수 2. 행렬과 백터 -. 원소 : 행렬의 숫자 한개 한개를 의미함 -. 행렬 : 수를 직사각형의 형태로 나열한 것 * 행 : 행렬의 가로줄 * 렬 : 행렬의 세로줄 * 행렬은 반드시 대문자로 작성하여 백터와 구분한다 -. 백터 : 일종의 행렬이나, 행이나 렬이 하나 밖에 없는 행렬을 뜻함 * 일..
안녕하세요 다제입니다. 오늘부터는 머신러닝에 대해서 배워보도록 하겠습니다. 빅데이터, 딥러닝, 인공지능 등 요즘 우리가 너무 자주 듣는 말 입니다. 사실 인공지능에 관한 학문적 연구는 오래 전부터 시행되었는데 왜 최근 이렇게 난리난리 일까요? 그래서 제가 준비했습니다! 오늘은 머신러닝이 핫한 이유와 머신러닝의 개념 그리고 배경 지식에 대해 나누어 보고자 합니다. 1. 머신러닝이 HOT한 이유 -. 옛날에는 활용할 수 있는 데이터가 pc, 스마트폰의 도입으로 기아급수적으로 증가하였다. -. 컴퓨터 성능이 매우 많이 좋아졌다. -. 머신러닝의 활용성한 가치 창출과 그로 인한 수익이 증명되었기 때문에!( 맞춤영상/광고 ) 사실 머신러닝을 하기 위해서는 많은 데이터가 필요합니다. 기계에게 학습시킬 데이터가 많을..
안녕하십니까 다제입니다. 오늘은 드디어 중심극한정리와 베이즈안 정리에 대해서만 알아보도록 하겠습니다. 범위가 제일 많으나, 할 말이 제일 많은 구간입니다. 구조도를 보면서 바로 시작해보겠습니다. 3-3. 중심극한정리(CLT, Central Limit Theorem) -. 쉽게 설명하여, 특정 데이터에서 샘플의 평균을 구한 후 -. 그 샘플들로 모집단의 전체 평균을 예측해보는 것이라고 생각하면 쉽습니다. -. 아래 예제를 바로 보시지요! 코드는 깃허브를 참고해 주세요! ( 링크 : github.com/daje0601/pandas_study ) 3-4. 베이즈안 정리 -. 베이즈안 정리를 하기 전, 혼동행렬이라는 개념을 알고 넘어가야 합니다. -. 혼동행렬이란 ? 모델의 성능을 평가할때 사용되는 지표 예측값..
안녕하십니까 다제입니다. 오늘 추정통계에 대해서 공부해 보고자 합니다. 흐름 잘 따라오고 있으시죠? 한번 복습하는 시간이 필요할거 같아요 저 같은 경우, 흐름이 머리속에 잡혀 있지 않으면 머리가 복잡함을 많이 느끼는 편이라서요 우리는 프로그래밍을 위해 통계를 배우고 있습니다. 기초통계1, 통계의 개념과 통계를 배우면 어떻게 분석을 하는지 기초통계2, 기술통계(평균, 중간값, 등)란 무엇인지 기초통계3, 추정통계(가설, ttest, pavlue, 중심극한정리 등) 가 무엇인지 위와 같으 흐름으로 진행되고 있다는 점 다시 한번 상기 부탁드립니다. 오늘은 드디어!!!!! 우리 배운 익숙한 코드들이 나오는 차례입니다 ㅎㅎ 수업 시간에 참 많은 내용들이 생략되었다는거 아시겠죠?ㅎㅎ 저도 코드를 작성할 생각에 벌써..
안녕하세요 다제입니다. 어제에 이어 프로그래밍을 위한 기초 통계를 공부하고 있습니다. 오늘은 기술통계에 대해서 다루어보겠습니다. 구조도를 보니 얼마 없어서 금방 끝나겠다 생각이 드시죠? 아쉽게도,, 내용도 많이 요약을 하였지만, 방대한 편입니다. 주말이여서 힘들고 피곤하시더라도 함께 공부해요! 2-1. Univariate analysis(일 변량 분석) -. 일변량 분석 이란 ?( 위키백과 ) * 중요한 사실은 하나의 변수만 포함하며 그 변수의 분포와 산포를 살펴봄으로써 의미있는 해석을 도출하는 방법입니다. 우리 수학자와 통계자분들이 열심히 분포를 공부하여 분포 모양에 따른 분류를 아래와 같이 하였습니다. 저 같은 경우 위 내용을 공부하고 코딩을 진행하니 충분히 이해가 되었고 비어있는 구멍이 매워지는 느..