공부/빅데이터시각화

[데이터 분석] 탐색적 데이터 분석(EDA)의 과정

SOIT 2022. 8. 23. 10:58

데이터(raw data)

데이터의 구성 요소: feature, data

 

  1. feature의 속성 탐색
    • feature 간의 상관관계(공분산, 상관계수)
  2. 탐색한 데이터의 시각화

 

1. 데이터 구성 확인

1.1 정보 확인

  • info()
  • describe()

1.1 개수 확인

.unique()

 


#행 열
data.shape()
#행/열 의 구성 정보
data.info()
  • info():
    • 행과 열의 개수
    • 결측값
    • type
# describe시 feature에서 문자는 제외해야한다.
data['string_1'] = data['string_1'].astype(str) 
data.describe()

 

728x90