본문 바로가기
반응형
글쓰기

머신러닝5

[머신러닝] 지도학습 - Linear Classification 선형분류모델 (로지스틱회귀, SVM) Machine Learning - Linear Classification 분류용 선형 모델 (Linear Model - Classification) 𝒚 = 𝒘𝟏𝒙𝟏+𝒘𝟐𝒙𝟐+𝒘𝟑𝒙𝟑+⋯+𝒘𝒑𝒙𝒑+𝒃 > 0특성들의 가중치 합이 0보다 크면, class를 1(양성클래스)로 0보다 작으면 -1(음성클래스)로 분류분류용 선형모델은 결정 경계가 입력의 선형함수w : 가중치, x : 입력값 y : 편향모델Logistic RegressionLinear Support Vector Machine (SVM) Logistic Regression (로지스틱 회귀): 사건이 일어날 가능성(확률)을 예측하는 선형 모델 독립변수(x)와 종속변수(y)의 관계를 로지스틱 함수를 사용하여 확률로 예.. 2024. 11. 23.
[머신러닝] 지도학습 (Supervised Learning) - Linear Model (Regression 회귀) Linear Model (선형모델)입력 특성에 대한 선형 함수를 만들어 예측데이터를 가장 잘 나타낼 수 있는 회귀식을 모델링다양한 선형 모델 존재분류와 회귀에 모두 사용y= ax+ba : 기울기b : y 절편near Model (선형모델) 선형 회귀 함수𝒚 =𝒘𝟏𝒙𝟏 + 𝒘𝟐𝒙𝟐 + 𝒘𝟑𝒙𝟑 + ⋯ + 𝒘i𝒙i + bw : 가중치(weight), 계수(coefficient)b : 절편(intercept), 편향(bias)평균제곱오차(MSE : Mean Square Error)가 최소가 되는 w와 b를 찾는다 경사하강법 (Gradient Descent Algorithm): 비용함수의 기울기(경사)를 구하여, 기울기가 낮은 쪽으로 계속이동하며 값을 최적화시키는 방법 Le.. 2024. 11. 19.
[머신러닝] 지도학습 (Supervised Learning) - Decision Tree 알고리즘 Decision Tree (결정트리)- Tree를 만들기 위해 "예/아니오" 질문을 반복하여 학습하는 의사결정 모델- 다양한 앙상블(ensemble)모델이 존재 (ex. RandomForest, GradientBoosting, XGBoost, LightGBM)- 분류와 회귀에 모두 사용 가능 결정트리새로운 데이터 포인트가 들어오면 해당하는 노드를 찾아, 분류라면 더 많은 클래스를 선택하고, 회귀라면 평균을 구한다지니불순도를 사용하여 데이터 분류의 기준을 잡는다타깃값이 하나로만 이루어진 리프노드를 순수노드(G=0)라고 한다모든 노드가 순수노드가 될 때까지 학습하면, 모델이 복잡해지고 과대적합된다 Gini Impurity (지니 불순도) : 데이터 집합의 불확실성 또는 순도를 수치화한 것 G값이 작을수록.. 2024. 11. 18.
[머신러닝] 데이터 특징요소 분류 및 특징요소 추출 (Feature engineering) Machine Learning Feature Engineering 데이터 특징요소 종류1. 데이터 진폭 (에너지)Maximum : 최댓값Minimum : 최솟값Mean : 평균값RMS (Root Mean Square) 2. 데이터 분포Variance : 분산Skewness (왜도, 비대칭도) : 분포의 좌우 쏠림 형태를 수치화Kurtosis (첨도) : 본포의 뾰족한 형태를 수치화 3. 데이터 그래프 파형Shape Factor : 파형의 전반적인 모양Crest Factor : 파형의 날카로움 정도 비율Impulse Factor : 임펄스성 신호의 비율 핵심 특징요소 도출 방법론 1. 특징 선택 (Feature Selection)▶ Filter 기법: 통계 테스트 결과로 상위 특징 선택T test : 두.. 2024. 11. 17.
인공지능 (AI : Artificial Intelligence) 인공지능, 머신러닝, 딥러닝 강한 인공지능 (Strong AI)스스로 사고하여 문제를 해결할 수 있는 인공지능주관적인 질문과 답을 탐색 약한 인공지능 (Weak AI)스스로 사고하여 문제를 해결할 수 없는 인공지능→ 입력된 질문(데이터)에 대한 객관적인 답을 출력ex) 지도학습, CNN, RNN, LSTM 머신러닝경험적 데이터를 바탕으로 지식을 자동으로 습득하여 스스로 성능을 향상하는 기술데이터를 기반으로 모델을 자동으로 생성실세계의 복잡한 데이터로부터 규칙과 패턴을 발견하여 미래를 예측하는 기술입출력 데이터로부터 프로그램(알고리즘)을 자동으로 생성하는 기술 머신러닝의 학습 시스템환경 : 학습시스템이 상호작용하는 대상, 학습할 문제데이터 : 환경과 상호작용을 통해 축적된 경험모델 : 데이터를 .. 2024. 11. 14.
반응형