728x90

데이터 시각화 5

Unsupervised Learning과 K-Means Clustering

2025.02.01 - [🐍 Python] - K-Means Clustering 실습 및 이론 정리 K-Means Clustering 실습 및 이론 정리K-Means Clustering은 비지도 학습(Unsupervised Learning)의 대표적인 기법으로, 데이터를 군집화하여 비슷한 특성을 가진 데이터를 묶는 데 사용됩니다. 이 알고리즘은 특히 고객 데이터를 분석하거나 특boohoday.com안녕하세요, 여러분. 오늘은 인공지능에서 중요한 개념 중 하나인 Unsupervised Learning(비지도 학습)에 대해 알아보겠습니다.1. 비지도 학습이란?먼저, 우리가 흔히 접하는 인공지능 모델은 크게 두 가지로 나뉩니다. 하나는 정답이 있는 데이터를 가지고 학습하는 Supervised Learning..

🐍 Python 2025.01.31

KK-최근접 이웃 (KNN, K-Nearest Neighbors) 알고리즘: 개념부터 실습까지

1️⃣ K-최근접 이웃(KNN)이란?📌 KNN의 핵심 개념비모수적(Non-parametric) 모델: 사전에 학습을 하지 않고, 데이터가 들어올 때마다 계산하여 예측.거리 기반 분류: 새로운 데이터가 들어왔을 때, 가장 가까운 K개의 데이터 포인트를 찾아 다수결 투표로 분류 결정.K 값의 설정: K 값이 크면 과적합(overfitting)을 방지하지만, 너무 크면 정확도가 떨어질 수 있음.📌 KNN의 활용 사례질병 예측 (환자의 증상이 기존 환자와 얼마나 유사한가?)추천 시스템 (비슷한 취향의 사용자가 좋아하는 콘텐츠 추천)이미지 분류 (손글씨 숫자 인식 등)2️⃣ KNN의 동작 원리데이터 포인트 간의 거리 계산가장 일반적으로 사용되는 거리는 유클리드 거리(Euclidean Distance)유클리드 ..

🐍 Python 2025.01.31

파이썬 그래프 관련 함수 정리 (Matplotlib 중심)

파이썬에서 그래프를 그릴 때 많이 사용하는 Matplotlib의 주요 함수들을 정리하였습니다. 특히, 선 스타일, 색상, 굵기, 마커 등을 조절하는 방법을 보기 쉽게 정리했습니다. 📊✨1️⃣ 그래프의 선(Line) 관련 옵션옵션설명예제color선 색상 지정plt.plot(x, y, color='red')linewidth / lw선 굵기 지정plt.plot(x, y, linewidth=2)linestyle / ls선 스타일 변경plt.plot(x, y, linestyle='--')alpha투명도 설정 (0~1)plt.plot(x, y, alpha=0.5)label범례(Label) 추가plt.plot(x, y, label="그래프")📌 선 스타일 종류'-' : 실선 (기본값)'--' : 점선'-.' : ..

🐍 Python 2025.01.29

파이썬 플롯(Python Plot) 완벽 가이드

데이터 분석에서 중요한 것은 단순한 숫자보다 시각화(Visualization)입니다. 파이썬에서는 다양한 라이브러리를 사용하여 데이터를 시각적으로 표현할 수 있으며, 대표적인 도구로는 Matplotlib, Seaborn, Plotly 등이 있습니다이 글에서는 파이썬에서 플롯을 생성하는 방법을 알아보고, 여러 가지 그래프 유형과 활용 방법을 예제와 함께 설명하겠습니다. 1️⃣ 파이썬에서 플롯(Plot)이란?플롯(Plot)은 데이터를 그래프로 표현하는 것을 의미합니다. 이를 통해 숫자 데이터의 패턴을 쉽게 이해하고, 데이터 간의 관계를 파악할 수 있습니다. 📌 파이썬에서 플롯을 그리는 주요 라이브러리:Matplotlib: 기본적인 그래프 라이브러리Seaborn: Matplotlib 기반의 고급 시각화 라이..

🐍 Python 2025.01.24

파이썬 기초 : 판다스 실습 | 데이터 분석

문제를 보고 실습 하기 방법 1DataFrame 생성 후 직접 추가pd.DataFrame()을 사용하여 비어 있는 DataFrame 객체를 생성합니다.이후, 데이터를 열(column) 단위로 추가하여 완성합니다. 방법2딕셔너리로 DataFrame 생성각 열(column)을 딕셔너리의 키(key), 데이터(값)를 리스트로 구성하여 한 번에 DataFrame을 생성할 수 있습니다. 데이터의 평균 구하기numeric_only는 Pandas의 집계 함수(aggregation functions)에서 사용되는 매개변수로, 데이터프레임에서 숫자 데이터만 처리할지 여부를 지정하는 역할을 합니다. 데이터의 NaN 을 평균으로 채우기 데이터 분석 문제   테이터의 행과 열 확인 하기 데이터 상위 5개 목록만 확인하기 테이..

🐍 Python 2025.01.22
728x90