- 키워드 정리sue991📘 주제 1. 데이터 전처리 (Data Preprocessing)1. 데이터 품질 관리 (Data Quality Management)핵심 개념: 수집한 원천 데이터에는 결측치(Missing Value), 이상치(Outlier), 중복(Duplicate) 같은 문제가 흔히 발생한다.문제점: 결측치는 통계 추정 왜곡, 이상치는 모델 파라미터 왜곡, 중복은 과적합을 유발한다.대표적 해결방안:결측치 → 평균·중앙값 대치, KNN Imputation, 다중 대치(Multiple Imputation).이상치 → Z-score/IQR 기반 탐지, Isolation Forest, 필요 시 Winsorizing.중복 → 고유 키/해시 기반 중복 제거.시험 포인트: "데이터 결측치가 많을 때 가장 적절한 처리 방법은?"..
- 2025-08-27 13:07:01
- AI에 사용되는 데이터에 대한 이해sue9911. AI 학습용 데이터 수집1.1. 데이터 중심 AI 패러다임 전환모델 중심 접근법에서 데이터 중심 접근법으로의 전환기존에는 더 정교한 모델 아키텍처를 설계하는 것이 성능 향상의 핵심이었다면, 현재는 고품질 데이터 확보와 체계적인 관리가 더욱 중요해짐데이터 중심 AI의 핵심 원칙일관성 (Consistency): 같은 입력에 대해 항상 같은 라벨이 부여되어야 합니다. (e.g., 동일한 이미지에 대해 항상 동일한 객체 라벨)정확성 (Accuracy): 라벨이 실제 정답(Ground Truth)과 일치해야 합니다. (e.g., 고양이 이미지에 '고양이' 라벨)대표성 (Representativeness): 데이터가 실제 운영 환경의 다양성과 분포를 충실히 반영해야 합니다. (e.g., 다양한 조명, 각도, ..
- 2025-08-22 14:24:39
- Micro vs Macro Averagesue991인공지능 모델을 평가하는 대표적인 평가방법 중 하나는 F1-score이다.F1-score란 precision과 recall의 조화평균이다.$$ F1 Score = 2* \frac {Precision*Recall}{Precision+Recall}$$sklearn의 classification report 모듈을 사용한다면 내가만든 모델의 결과를 쉽게 확인할 수 있다.>>> from sklearn.metrics import classification_report>>> y_true = [0, 1, 2, 2, 2]>>> y_pred = [0, 0, 2, 2, 1]>>> target_names = ['class 0', 'class 1', 'class 2']>>> print(classification_report(y..
- 2022-08-18 16:58:12
스킨 업데이트 안내
현재 이용하고 계신 스킨의 버전보다 더 높은 최신 버전이 감지 되었습니다. 최신버전 스킨 파일을 다운로드 받을 수 있는 페이지로 이동하시겠습니까?
("아니오" 를 선택할 시 30일 동안 최신 버전이 감지되어도 모달 창이 표시되지 않습니다.)