출처: 퇴근후딴짓
T1-1. 데이터에서 IQR을 활용해 Fare컬럼의 이상치를 찾고, 이상치 데이터의 여성 수를 구하시오
import pandas as pd
df = pd.read_csv('.. /..csv')
#데이터 확인
df.head()
# 행열 개수 확인
df.shape
#결측치 개수 확인
df.isnull().sum()
Q1 = df['Fare'] .quantile(0.25)
Q2 = df['Fare'] .quantile(0.75)
IQR = Q3 - Q1
# 이상치
outdata1 = df[df['Fare'] < (Q1 - 1.5*IQR)]
outdata3 = df[df['Fare'] > (Q3 - 1.5*IQR)] # 이상치
msum = sum(outdata3['Sex'] =='female')
print(msum)
T1-2. 주어진 데이터에서 이상치(소수점 나이)를 찾고 올림, 내림, 버림(절사)했을때 3가지 모두 이상치 'age' 평균을 구한 다음 모두 더하여 출력하시오
import pandas as pd
import numpy as np
df = pd.read_csv('.. /..csv')
#소수점 나이 찾기
df[df['age'] - np.floor( df['age']) != 0]
# 이상치를 포함한 데이터 올림, 내림, 버림의 평균값
mceil = np.ceil(df['age']).mean()
mfloor = np.floor(df['age']).mean()
mtrunc = np.trunc(df['age']).mean()
#합
msum = mceil+mfloor+mtrunc
print(msum)
728x90
'IT 자격증 > 빅데이터분석기사' 카테고리의 다른 글
[빅분기] 빅데이터분석기사 실기, 기출복원 모음 #3 (0) | 2023.11.02 |
---|---|
[빅분기] 빅데이터분석기사 실기, 블로그 꿀팁 사이트 #2 (0) | 2023.11.02 |
[빅분기] 실기, 작업형 1, 전처리 작업 (0) | 2023.10.31 |
[빅분기] 7회 필기 합격, 책 추천, 증빙서류 제출 (2) | 2023.10.28 |
[빅분기] 빅데이터분석기사 실기, 작업형 1-3 공부법 #1 (0) | 2023.10.28 |