728x90

데이터 분석 5

Unsupervised Learning과 K-Means Clustering

2025.02.01 - [🐍 Python] - K-Means Clustering 실습 및 이론 정리 K-Means Clustering 실습 및 이론 정리K-Means Clustering은 비지도 학습(Unsupervised Learning)의 대표적인 기법으로, 데이터를 군집화하여 비슷한 특성을 가진 데이터를 묶는 데 사용됩니다. 이 알고리즘은 특히 고객 데이터를 분석하거나 특boohoday.com안녕하세요, 여러분. 오늘은 인공지능에서 중요한 개념 중 하나인 Unsupervised Learning(비지도 학습)에 대해 알아보겠습니다.1. 비지도 학습이란?먼저, 우리가 흔히 접하는 인공지능 모델은 크게 두 가지로 나뉩니다. 하나는 정답이 있는 데이터를 가지고 학습하는 Supervised Learning..

🐍 Python 2025.01.31

리니어리그레션 (Linear Regression) 완벽 이해: 경력과 연봉의 관계 예측하기- Prediction (예측)

2025.01.30 - [🐍 Python] - 머신러닝과 데이터 전처리 - 초보자를 위한 친절한 가이드 머신러닝과 데이터 전처리 - 초보자를 위한 친절한 가이드1. 머신러닝이란?머신러닝(Machine Learning)은 데이터를 이용하여 패턴을 학습하고, 이를 통해 예측을 수행하는 인공지능 기술입니다. 우리가 실생활에서 머신러닝을 만나는 사례는 다음과 같습니boohoday.com 1. 리니어 리그레션이란?우리는 종종 데이터를 통해 미래를 예측하고자 합니다. 예를 들어, 경력이 많을수록 연봉이 높아질까? 이런 질문을 데이터로 분석할 수 있습니다. 이를 위해 리니어 리그레션 (Linear Regression) 이라는 기법을 사용합니다.리니어 리그레션은 데이터를 분석하여 가장 잘 맞는 직선을 찾고, 이를 이..

🐍 Python 2025.01.30

파이썬 기초 : 판다스 실습 | 데이터 분석

문제를 보고 실습 하기 방법 1DataFrame 생성 후 직접 추가pd.DataFrame()을 사용하여 비어 있는 DataFrame 객체를 생성합니다.이후, 데이터를 열(column) 단위로 추가하여 완성합니다. 방법2딕셔너리로 DataFrame 생성각 열(column)을 딕셔너리의 키(key), 데이터(값)를 리스트로 구성하여 한 번에 DataFrame을 생성할 수 있습니다. 데이터의 평균 구하기numeric_only는 Pandas의 집계 함수(aggregation functions)에서 사용되는 매개변수로, 데이터프레임에서 숫자 데이터만 처리할지 여부를 지정하는 역할을 합니다. 데이터의 NaN 을 평균으로 채우기 데이터 분석 문제   테이터의 행과 열 확인 하기 데이터 상위 5개 목록만 확인하기 테이..

🐍 Python 2025.01.22

파이썬 기초 : Pandas(판다스) DataFrame과 Series, 빌트인 함수

Pandas란?Pandas는 Python에서 데이터 분석과 조작을 위한 가장 인기 있는 라이브러리 중 하나입니다. 데이터 처리를 단순화하고 효율적으로 수행할 수 있도록 설계된 도구로, **표 형식의 데이터(스프레드시트처럼)**를 다루기에 최적화되어 있습니다.주로 DataFrame과 Series라는 두 가지 주요 데이터 구조를 기반으로 작동하며, 데이터를 정리, 분석, 변환, 시각화할 때 사용됩니다.Pandas의 특징쉽고 직관적인 데이터 조작데이터의 필터링, 정렬, 병합, 그룹화 등을 간단히 처리할 수 있습니다.다양한 데이터 포맷 지원CSV, Excel, SQL, JSON, HTML 등의 파일 포맷을 읽고 쓸 수 있습니다.고성능 데이터 처리NumPy를 기반으로 최적화되어 대규모 데이터 처리에 적합합니다.강..

🐍 Python 2025.01.21

파이썬 기초 : NumPy 연산을 효율적으로 처리하기 위한 라이브러리

NumPy란?NumPy(NumPy: Numerical Python)는 Python에서 수치 연산을 효율적으로 처리하기 위한 라이브러리입니다. 특히, 다차원 배열 객체 ndarray를 사용해 대규모 데이터 처리를 간단하고 빠르게 수행할 수 있습니다. 또한, 배열 및 행렬 연산, 선형대수, 푸리에 변환, 난수 생성 등의 기능을 제공합니다.  NumPy 설치pip install numpyNumPy의 핵심 요소1. ndarray: 다차원 배열 객체NumPy의 핵심 데이터 구조로, 리스트와 유사하지만 크기가 고정되고 동일한 데이터 타입만 저장 가능합니다.import numpy as np# 1D 배열arr1 = np.array([1, 2, 3])# 2D 배열arr2 = np.array([[1, 2], [3, 4]]..

🐍 Python 2025.01.21
728x90