Home
Huray.dev
Cancel

개굴캐글개굴 교차검증

Tab study에서 같이 공부한 교차 검증에 대해 정리해보려 한다. 교차 검증 교차 검증이란? 데이터를 여러 번 반복해서 나누고 여러 모델을 학습하여 성능을 평가하는 방법이다. 교차 검증을 사용하는 이유 데이터셋에 대한 과적합을 방지할 수 있다. 데이터셋 규모가 적을 시 과소적합을 방지할 수 있다. 일반화된 모델 생성이...

개굴캐글개굴 결정트리

Tab_study에서 공부한 AI 결정 트리에 대해 정리해보려한다. 결정 트리(Decision tree)란? 결정 트리는 분류, 회귀 등에서 사용하는 지도학습에 대한 학습 모델이다. 기본적으로 결정 트리는 예/아니오 질문을 이어 나가면서 학습한다. 위의 사진처럼 결정 트리는 질문에 의해 학습을 이어나간다. 코드를 통해 확인해보자. ...

개굴캐글개굴 로지스틱 회귀

Tab study에서 배운 로지스틱 회귀에 대해 정리해보려한다. 로지스틱 회귀 로지스틱 회귀란? 로지스틱 회귀는 수학을 사용하여 두 데이터 요인 간의 관계를 찾는 데이터 분석 기법이다. 로지스틱 회귀는 분류 모델인가? 회귀 모델인가? 로지스틱 회귀는 이름은 회귀이지만, 데이터의 결과가 특정 분류로 나뉘기 때문에 일종의 분류(classi...

개굴캐글개굴 회귀 알고리즘과 모델 규제

Tab study에서 공부한 회귀 알고리즘과 모델 규제에 대해 정리해보려한다. 회귀란? 앞서 물고기 데이터를 분류한 것은 그 물고기가 빙어인지 도미인지 분류하는 분류 문제였다면, 회귀란 예를 들어, 물고기의 데이터를 학습해 그 물고기의 무게를 예측하는 것을 회귀라고 할 수있다. 간단한 농어 무게 예측 농어 데이터와 데이터 나누기 perch_l...

개굴캐글개굴 데이터 전처리

Tab_study를 진행하면서 배운 데이터 전처리에 대해 정리해보려한다. 훈련 세트와 테스트 세트 분류 데이터 셋을 훈련시키고 평가하기 위해 훈련 세트와 테스트 셋을 분류한다. 데이터를 섞지 않은 경우 import numpy as np input_arr = np.array(fish_data) target_arr = np.array(fish_...

개굴캐글개굴 시각화 정리

Tab_study를 진행하면서 공부한 시각화(Matplotlib, Seaborn)에 대해 정리해보려 한다. 시각화란? 데이터 시각화는 차트, 그래프 또는 맵과 같은 시각적 요소를 사용해 데이터를 표시하는 것을 말한다. 시각화를 사용하는 이유? 머신러닝 모델의 데이터 전처리나 데이터 특성 파악 시 큰 도움을 준다. 많은 양의 데이...

개굴캐글개굴 Pandas 기초

Tab 23년 2학기 스터디로 AI 공부를 하면서 블로그를 정리해보려한다. NumPy 기초 Numpy import하기 import numpy as np numpy는 일반적으로 np로 줄여 사용한다. ndarray 생성 data = [1,2,3,4] arr = np.array(data) type(arr) numpy.ndarray #출력...

AI 과소적합(underfitting)과 과대적합(overfitting)

다항회귀를 이용한 과소적합(underfitting)과 과대적합(overfitting)에 대해 정리해보려한다. 과소적합(Underfitting)이란? 과소적합은 모델이 주어진 데이터를 충분히 학습하지 못해 훈련 데이터와 테스트 데이터 모두에서 성능이 낮은 상태를 의미한다. 위의 그래프를 보면 알 수 있듯이 모델이 훈련 세트의 규칙에 ...

AI Pandas 정리

데이터를 처리할때 유용하게 사용되는 Pandas에 대해 정리해보려한다. Pandas란? Pandas는 파이썬 프로그래밍 언어를 위한 데이터 분석 및 조작 라이브러리이다. Pandas는 구조화된 데이터를 쉽게 처리하고 분석하는 데 도움이 되는 강력한 도구와 데이터 구조를 제공한다. 주로 표 형식의 데이터를 다루는 데 사용되며, 엑셀 스프레드...

AI 분류 성능 평가 지표

분류(Classification)에서의 성능 평가 지표에 대해 정리해보려한다. 분류(Classification) 성능 평가 지표 정확도(Accuracy) 오차행렬(Confusion Matrix) 정밀도(Precision) 재현율(Recall) F1 스코어 ROC AUC 정확도(Accur...