공부/빅데이터시각화
[데이터 분석] 탐색적 데이터 분석(EDA)의 과정
SOIT
2022. 8. 23. 10:58
데이터(raw data)
데이터의 구성 요소: feature, data
- feature의 속성 탐색
- feature 간의 상관관계(공분산, 상관계수)
- 탐색한 데이터의 시각화
1. 데이터 구성 확인
1.1 정보 확인
- info()
- describe()
1.1 개수 확인
.unique()
#행 열
data.shape()
#행/열 의 구성 정보
data.info()
- info():
- 행과 열의 개수
- 결측값
- type
# describe시 feature에서 문자는 제외해야한다.
data['string_1'] = data['string_1'].astype(str)
data.describe()
728x90