์๊ฒฉ์ฆ/๋น
๋ฐ์ดํฐ๋ถ์๊ธฐ์ฌ
์ ์ ์ด์ ๋ฐํ๊ธ์ ํตํด ๊ผญ๊ผญ ์ฐธ๊ณ ํ์๊ธธ ๋ฐ๋๋๋ค!! ์ ๋ ๋น
๋ฐ์ดํฐ ์ ๊ณต์ด๋ผ ๋ฒผ๋ฝ์น๊ธฐ๊ฐ ๊ฐ๋ฅํ๋ ๊ฑฐ ๊ฐ์ต๋๋ค.! ๋น์ ๊ณต์๋ ์ต์ 2์ฃผ์ ์๊ฐ์ด ๋ ํ์ํ ๊ฒ์ด๋ผ ์๊ฐ๋ญ๋๋ค. 2023.12.01 - [์๊ฒฉ์ฆ/๋น
๋ฐ์ดํฐ๋ถ์๊ธฐ์ฌ] - [๋น
๋ถ๊ธฐ] ์ค๊ธฐ 2~6ํ ๊ธฐ์ถ ์ฝ๋ ํ์ด(๊ฐ๋จํ ์ฝ๋๋ก ํ๊ธฐ, 2์ ํ ๋ฌด์ ์ฝ๋) 2023.11.30 - [์๊ฒฉ์ฆ/๋น
๋ฐ์ดํฐ๋ถ์๊ธฐ์ฌ] - [๋น
๋ถ๊ธฐ] ์ค๊ธฐ ์ ํ๋ณ ๊ฐ๋
์๋ฒฝ ์ ๋ฆฌ(์ค์ ํฌ์ธํธ!!) 2023.11.28 - [์๊ฒฉ์ฆ/๋น
๋ฐ์ดํฐ๋ถ์๊ธฐ์ฌ] - [๋น
๋ถ๊ธฐ] ์ค๊ธฐ 3์ ํ ์ฒดํํ๊ฒฝ(์ ์ ํ/ ๊ตฌ์ ํ) ์์ ํ์ด 2023.11.26 - [์๊ฒฉ์ฆ/๋น
๋ฐ์ดํฐ๋ถ์๊ธฐ์ฌ] - [๋น
๋ถ๊ธฐ] ์ค๊ธฐ ํ๊ฒฝ ํ ๋ชจ๋ ํ์ดํ
์
๋๋ค!! ์ถ๊ฐ๋ก ์ด๋ฒ๋
๋์ ๋น
๋ฐ์ดํฐ ๊ด๋ จ ์๊ฒฉ์ฆ๋ค์ ๋๋๋ฐ,, ๋ชจ๋ ํฉ๊ฒฉ์ด๋ผ ๊ธฐ์๋ค์...
์๊ฒฉ์ฆ/๋น
๋ฐ์ดํฐ๋ถ์๊ธฐ์ฌ
์ ํ 1 1. ์ด์์น ๊ตฌํ๋ ๋ฐฉ์ 1) IQR ์ด์ฉ IQR์ ์ฌ์ฉํ ์ด์์น ๊ณต์์ (x[data] (q3 + IQR * 1.5))] 2) ๋ฌธ์ ์์ ์ฃผ์ด์ง ์ด์์น ex. ์ด์๊ฐ์ ํ๊ท ์์ 1.5 ํ์คํธ์ฐจ ์ด์์ธ ๊ฐ์ผ๋ก ํ๋ค. lo = x[data].mean() - x[data].std() *1.5 up = x[data].mean() + x[data].std() *1.5 ์ด์์น ๊ณต์์ (x[data..
์๊ฒฉ์ฆ/๋น
๋ฐ์ดํฐ๋ถ์๊ธฐ์ฌ
์ฒดํํ๊ฒฝ ๊ตฌ๋ฆEDU - ๋ชจ๋๋ฅผ ์ํ ๋ง์ถคํ IT๊ต์ก ๊ตฌ๋ฆEDU๋ ๋ชจ๋๋ฅผ ์ํ ๋ง์ถคํ IT๊ต์ก ํ๋ซํผ์
๋๋ค. ๊ฐ์ธ/ํ๊ต/๊ธฐ์
๋ฐ ๊ธฐ๊ด ๋ณ ์ต์ ํ๋ IT๊ต์ก ์๋ฃจ์
์ ๊ฒฝํํด๋ณด์ธ์. ๊ธฐ์ด๋ถํฐ ์ค๋ฌด ํ๋ก๊ทธ๋๋ฐ ๊ต์ก, ์ ๊ตญ ์ด์ค๊ณ /๋ํ๊ต ์จ๋ผ์ธ ์์
, ๊ธฐ์
/ edu.goorm.io 1. ์ ์ ํ import pandas as pd df = pd.read_csv("data/Titanic.csv") #1. crosstab = pd.crosstab(df['Gender'], df['Survived']) from scipy import stats print(stats.chi2_contingency(crosstab)) #1.ํต๊ณ๋ 2.p-value print('1.',round(260.71702016732104, 3)) #2..
์๊ฒฉ์ฆ/๋น
๋ฐ์ดํฐ๋ถ์๊ธฐ์ฌ
- ๊ฐ์ธ์ ์ผ๋ก ๋จ๊ธฐ๊ฐ์ ๋ฐ๊ณ ์ถ์ผ๋ฉด ํด๊ทผ ํ ๋ด์ง ์์ ์ถ์ฒํฉ๋๋ค. (๋จ, ๊ธฐ๋ณธ์ง์ ์๋ฉด ๋งฅ๋ฝ ๋น ๋ฅด๊ฒ ์ค์ ํฌ์ธํธ๋ง ํ์
ํ๊ธฐ ์ข์์ ์ถ์ฒ--> ๊ฐ๋
+ ์ฝ๋๊ฐ ๊ฐ๋จํด์ ๊ทฏ๊ทฏ) ( ํด๊ทผ ํ ๋ด์ง ์์์ ์ ๋ฃ์
๋๋ค.. ๊ทผ๋ฐ ๋ฌด๋ฃ ๋ฒ์ ๋ ๋ช ๊ฐ ์์ด์! + ๋ฌด๋ฃ ์บ๊ธ ๊ณต๋ถ๋)-- ์ฐธ๊ณ - ๋ค๋ง, ์๊ฐ ๋ง์ด ํฌ์ ๊ฐ๋ฅํ๋ฉด ๋น์ถ (๋ฌด์ ์ฝ๋(2์ ํ) + ๋ฐ์ดํฐ ๋ง๋ ์ ์ฒ๋ฆฌ(1์ ํ)๋ง ๊ณต๋ถํด๋ ๊ทฏ๊ทฏ) ๊ฒฐ๋ก : ์ ๋ ์๊ฐ์ด ์ผ์ฃผ์ผ๋ ํฌ์ํ ์ ์์ด ๋ฐ์ดํฐ ๋ง๋์ ์ ํ๊ณ , ํด๊ทผํ๋ด์ง + ์์ ๋น ํ์ต๋๋ค. + ๊ฐ์ธ์ ์ธ ์๊ฐ: ์์ ๋น ๋ .. ์ง์ง ๊ธฐ๋ณธ ์ง์ ์์ผ์ ๋ถ๋ค.. ๋น์ถ์
๋๋ค ^^ ์ ์ ๋ง ๋ ๋ ๋ ธ์ด์.. ์ธํฐ๋ท์ ๋ ๋๋ ์ฝ๋๋ง ๋ด๋ ๊ทฏ๊ทฏ์ด์๋ค.. + 2์ ํ; ๋๋ง์ ์ฝ๋๋ฅผ ๋ง๋ค์: ์ํ ์ ๋ค๋ฅธ ์ฝ๋ ํ์ด๋ฅผ ๋ณด..
์๊ฒฉ์ฆ/๋น
๋ฐ์ดํฐ๋ถ์๊ธฐ์ฌ
์ฒดํํ๊ฒฝ ๊ตฌ๋ฆEDU - ๋ชจ๋๋ฅผ ์ํ ๋ง์ถคํ IT๊ต์ก ๊ตฌ๋ฆEDU๋ ๋ชจ๋๋ฅผ ์ํ ๋ง์ถคํ IT๊ต์ก ํ๋ซํผ์
๋๋ค. ๊ฐ์ธ/ํ๊ต/๊ธฐ์
๋ฐ ๊ธฐ๊ด ๋ณ ์ต์ ํ๋ IT๊ต์ก ์๋ฃจ์
์ ๊ฒฝํํด๋ณด์ธ์. ๊ธฐ์ด๋ถํฐ ์ค๋ฌด ํ๋ก๊ทธ๋๋ฐ ๊ต์ก, ์ ๊ตญ ์ด์ค๊ณ /๋ํ๊ต ์จ๋ผ์ธ ๊ฐ์, ๊ธฐ์
/ edu.goorm.io 1. ์ ์ ํ ๋ฌธ์ ์์๋ ROC-AUC๋ก ํ๊ฐํฉ๋๋ค. ๋ฐ๋ผ์ predict_proba ๋ก ์ ์ถํ๋ ๊ฒ์ด ์ฑ๋ฅ์ด ๋ ์ข์ต๋๋ค. pred = model.predict_proba(test[cols]) print(pred) print(pred[:,1]) ๋ถ๋ฅ์์ roc-auc๋ฅผ ์ ์ธํ๊ณ predict๋ฅผ ์ฌ์ฉํ๋ฉด๋ฉ๋๋ค. ํ๊ฐ์งํ๊ฐ ์ฃผ์ด์ง์ง ์์ ์๋ ์์ต๋๋ค. ํ๊ฐ์งํ๋ ๋ฐ๋์ ์ฃผ์ด์ง๋๋ค. 0๊ณผ 1์ ์ ์ถํด๋ ํ๋ฆฐ๋ต์ด ์๋๋ฉฐ roc-auc ๊ณ์ฐ ..
์๊ฒฉ์ฆ/๋น
๋ฐ์ดํฐ๋ถ์๊ธฐ์ฌ
์๋์ฐ ๋ฉ๋ชจ์ฅ ์ ๋จ ์ค๊ธฐํ๊ฒฝ ๊ตฌ๋ฆEDU - ๋ชจ๋๋ฅผ ์ํ ๋ง์ถคํ IT๊ต์ก ๊ตฌ๋ฆEDU๋ ๋ชจ๋๋ฅผ ์ํ ๋ง์ถคํ IT๊ต์ก ํ๋ซํผ์
๋๋ค. ๊ฐ์ธ/ํ๊ต/๊ธฐ์
๋ฐ ๊ธฐ๊ด ๋ณ ์ต์ ํ๋ IT๊ต์ก ์๋ฃจ์
์ ๊ฒฝํํด๋ณด์ธ์. ๊ธฐ์ด๋ถํฐ ์ค๋ฌด ํ๋ก๊ทธ๋๋ฐ ๊ต์ก, ์ ๊ตญ ์ด์ค๊ณ /๋ํ๊ต ์จ๋ผ์ธ ๊ฐ์, ๊ธฐ์
/ edu.goorm.io ์์ฒด ๋ฉ๋ชจ์ฅ ์ด์ฉ help, dir ์ด์ฉํ๊ธฐ ์ฌ๊ธฐ์ ์ฃผ์!! ์คํ๊ฒฐ๊ณผ ๋ธ๋ก์์ ๋ณต์ฌ ๋จ์ถํค X Ctrl + C ๋จ์ถํค ์ ๋จ ๋ง์ฐ์ค ์ค๋ฅธ์ชฝ ํด๋ฆญ -> ๋ณต์ฌ -> ์ฝ๋๋ธ๋ก์ ๋ถ์ฌ๋ฃ๊ธฐ ๋ง์ง๋ง ๋ต์ ์ ์ถ print() ๋ก ์ถ๋ ฅํ๊ธฐ