반응형 글쓰기 개발기록/머신러닝7 [머신러닝] 지도학습 - Linear Classification 선형분류모델 (로지스틱회귀, SVM) 분류용 선형 모델 (Linear Model - Classification) 𝒚 = 𝒘𝟏𝒙𝟏+𝒘𝟐𝒙𝟐+𝒘𝟑𝒙𝟑+⋯+𝒘𝒑𝒙𝒑+𝒃 > 0특성들의 가중치 합이 0보다 크면, class를 1(양성클래스)로 0보다 작으면 -1(음성클래스)로 분류분류용 선형모델은 결정 경계가 입력의 선형함수w : 가중치, x : 입력값 y : 편향모델Logistic RegressionLinear Support Vector Machine (SVM) Logistic Regression (로지스틱 회귀): 사건이 일어날 가능성(확률)을 예측하는 선형 모델 독립변수(x)와 종속변수(y)의 관계를 로지스틱 함수를 사용하여 확률로 예측입력 데이터에 따른 예측 결과가 0 또는 1로 나뉨 ex) 쇼핑몰 사이트.. 2024. 11. 23. [머신러닝] 지도학습 (Supervised Learning) - Linear Model (Regression 회귀) Linear Model (선형모델)입력 특성에 대한 선형 함수를 만들어 예측데이터를 가장 잘 나타낼 수 있는 회귀식을 모델링다양한 선형 모델 존재분류와 회귀에 모두 사용y= ax+ba : 기울기b : y 절편near Model (선형모델) 선형 회귀 함수𝒚 =𝒘𝟏𝒙𝟏 + 𝒘𝟐𝒙𝟐 + 𝒘𝟑𝒙𝟑 + ⋯ + 𝒘i𝒙i + bw : 가중치(weight), 계수(coefficient)b : 절편(intercept), 편향(bias)평균제곱오차(MSE : Mean Square Error)가 최소가 되는 w와 b를 찾는다 경사하강법 (Gradient Descent Algorithm): 비용함수의 기울기(경사)를 구하여, 기울기가 낮은 쪽으로 계속이동하며 값을 최적화시키는 방법 Le.. 2024. 11. 19. [머신러닝] 지도학습 (Supervised Learning) - Decision Tree 알고리즘 Decision Tree (결정트리)- Tree를 만들기 위해 "예/아니오" 질문을 반복하여 학습하는 의사결정 모델- 다양한 앙상블(ensemble)모델이 존재 (ex. RandomForest, GradientBoosting, XGBoost, LightGBM)- 분류와 회귀에 모두 사용 가능 결정트리새로운 데이터 포인트가 들어오면 해당하는 노드를 찾아, 분류라면 더 많은 클래스를 선택하고, 회귀라면 평균을 구한다지니불순도를 사용하여 데이터 분류의 기준을 잡는다타깃값이 하나로만 이루어진 리프노드를 순수노드(G=0)라고 한다모든 노드가 순수노드가 될 때까지 학습하면, 모델이 복잡해지고 과대적합된다 Gini Impurity (지니 불순도) : 데이터 집합의 불확실성 또는 순도를 수치화한 것 G값이 작을수록.. 2024. 11. 18. [머신러닝] 데이터 특징요소 분류 및 특징요소 추출 데이터 특징요소 종류1. 데이터 진폭 (에너지)Maximum : 최댓값Minimum : 최솟값Mean : 평균값RMS (Root Mean Square) 2. 데이터 분포Variance : 분산Skewness (왜도, 비대칭도) : 분포의 좌우 쏠림 형태를 수치화Kurtosis (첨도) : 본포의 뾰족한 형태를 수치화 3. 데이터 그래프 파형Shape Factor : 파형의 전반적인 모양Crest Factor : 파형의 날카로움 정도 비율Impulse Factor : 임펄스성 신호의 비율 핵심 특징요소 도출 방법론 1. 특징 선택 (Feature Selection)▶ Filter 기법 : 통계 테스트 결과로 상위 특징 선택T test : 두 집단의 평균이 같은지 판별 유의수준(p value)가 1%보다 낮.. 2024. 11. 17. 인공지능 (AI : Artificial Intelligence) 강한 인공지능 (Strong AI)스스로 사고하여 문제를 해결할 수 있는 인공지능 주관적인 질문과 답을 탐색 약한 인공지능 (Weak AI)스스로 사고하여 문제를 해결할 수 없는 인공지능 → 입력된 질문(데이터)에 대한 객관적인 답을 출력 ex) 지도학습, CNN, RNN, LSTM 머신러닝경험적 데이터를 바탕으로 지식을 자동으로 습득하여 스스로 성능을 향상하는 기술 데이터를 기반으로 모델을 자동으로 생성 실세계의 복잡한 데이터로부터 규칙과 패턴을 발견하여 미래를 예측하는 기술 입출력 데이터로부터 프로그램(알고리즘)을 자동으로 생성하는 기술 머신러닝의 학습 시스템환경 : 학습시스템이 상호작용하는 대상, 학습할 문제데이터 : 환경과 상호작용을 통해 축적된 경험모델 : 데이터를 모델링하는 학습시스템의 구조성.. 2024. 11. 14. [머신러닝] 지도학습 (Supervised Learning) - KNN 알고리즘 KNN (K-Nearest Neighbors): K-최근접 이웃 알고리즘 - 새로운 데이터 포인트와 가장 가까운 훈련 데이터셋의 데이터 포인트를 찾아 예측- k값에 따라 가까운 이웃의 수가 결정- 분류와 회귀에 모두 사용 - k값이 작을수록 모델의 복잡도가 상대적으로 증가 (noise에 민감)- k값이 커질수록 모델의 복잡도가 낮아짐- 100개의 데이터를 학습하고 k를 100개로 설정하여 예측하면, 빈도가 가장 많은 클래스를 레이블로 분류 데이터 포인트(sample) 사이의 거리값 측정 방법- 유클리디언 거리 공식 Hyper parameter- metric : 유클리디언 거리 방식- n_neighbors : 이웃의 수- weight : 가중치 함수 uniform : 가중치를 동등하게 설정 dista.. 2024. 10. 6. [머신러닝] 머신러닝(Machine Learning)이란? 머신러닝(Machine Learning, 기계학습)데이터를 기반으로 학습을 시켜서 예측하게 만드는 기법인공지능의 한 분야로 컴퓨터가 학습할 수 있도록 하는 알고리즘 기술을 개발하는 분야통계학, 데이터 마이닝, 컴퓨터 과학이 어우러진 분야 데이터를 주면 데이터를 학습하여 기계가 스스로 규칙(알고리즘, 모델)을 만들어낸다데이터를 이용하여 특성과 패턴을 학습하고, 그 결과를 바탕으로 미지의 데이터에 대한 미래결과를 예측 머신러닝의 종류지도학습: 데이터에 대한 Label(명시적인 답)이 주어진 상태에서 컴퓨터를 학습시키는 방법 패턴 학습 (문제와 정답을 모두 알려주고 학습시키는 방법) 분류 (Classification)회귀 (Regression)개념미리 정의된 여러 클래스 레이블 중 하나를 예측하는 것연속적.. 2024. 9. 8. 이전 1 다음 반응형