๋ถ์คํ ๊ธฐ๋ฒ: ์ฌ๋ฌ ์ฝํ ๋จธ์ ๋ฌ๋ ๊ธฐ๋ฒ์ ์์ฐจ์ ์ผ๋ก ํ์ตํด ์ค๋ฅ๋ฅผ ๊ฐ์ ํด ๋๊ฐ๋ฉด์ ์ฑ๋ฅ์ ๋์ฌ ๊ฐ๋ ์์๋ธ ๊ธฐ๋ฒ
์๋: ๋๋ค ํฌ๋ ์คํธ(์ฌ๋ฌ ๋๋ฌด๋ฅผ ๋ณ๋ ฌ ๋ฐฉ์์ผ๋ก ํ์ต) > ๋ถ์คํ ๊ธฐ๋ฒ(์ง๋ ฌ๋ก ์์ฐจ์ ์ผ๋ก ํ์ต)
์บ๊ธ์์ ์ฃผ๋ก ์ฐ์ด๋ ๋ถ์คํ ๊ธฐ๋ฒ: Xgboost, LightGBM, CatBoost
GBM(Gradient Boosting Machine)
์์ฐจ(์ค์ ๊ฐ๊ณผ ๊ทธ ํ๊ท ์ ์ฐจ์ด)๋ฅผ ํ์ตํ๋ ๋ชจ๋ธ์ ๋ง๋ค๊ณ ์ด๋ฅผ ํ์ฉํด ์์ฐจ๋ฅผ ์์ธกํ ๊ฐ์ LR(learning rate)๋ฅผ ๊ณฑํ ํ ํ๊ท ์ ๋ํค ์ค์ ์์ธก๊ฐ์ ์ ๋ฐ์ดํธ ํ๋ ๊ณผ์ ์ ๋ฐ๋ณต(๊ณผ์ : ์์ฐจ๋ฅผ ์ค์ด๋ ํ์ต์ด ๋ฐ๋ณต๋จ)
์ฆ, Overfitting(๊ณผ์ ํฉ) ๋ฌธ์ ๊ฐ ๋ฐ์
๋ฐ๋ผ์
์ค์ฐจ(error)์ ์์ฐจ(residual)์ ์ฐจ์ด
์์ฐจ: (๋ชจ๋ธ์) ์์ธก๊ฐ-์ค์ ๊ฐ
์ค์ฐจ: ์์ธก๊ฐ-์ค์ ๊ฐ
์ฐจ์ด์ : ๋ชจ์ง๋จ์์ ์ป์ ๊ฒ์ด๋ / ํ๋ณธ์ง๋จ์์ ์ป์ ๊ฒ์ด๋
์ฆ, ๋ง์ฝ์ A๊ฐ ์ํ ๋ฌธ์ ๋ฅผ ํ์๋๋ฐ 10๋ฌธ์ ์ค 3๋ฌธ์ ๋ฅผ ํ๋ ธ๋ค. ๊ทธ๋ฌ๋ฉด B๋ ํ๋ฆฐ 3๋ฌธ์ ๋ฅผ ๋ค์ ํ๊ณ 1๋ฌธ์ ๋ฅผ ๋ ํ๋ฆฌ๋ฉด C๋ ๊ทธ 1๋ฌธ์ ๋ฅผ ๋ค์ ํ๊ณ ์ด ๋ฐฉ์์ผ๋ก ํ์ด ๋๊ฐ๋ค๊ณ ์๊ฐํ ์ ์๋ค.
์ด๋ฌํ ๋ฐฉ๋ฒ์ ๊ณ์ํ๋ฉด ์์ฐจ๋ ๊ณ์ํด์ ์ค์ด๋ค๊ฒ๋๊ณ , training set์ ์ ์ค๋ช ํ๋ ์์ธก ๋ชจํ์ ๋ง๋ค ์ ์๊ฒ ๋ฉ๋๋ค. ํ์ง๋ง ์ด๋ฌํ ๋ฐฉ์์ bias๋ ์๋นํ ์ค์ผ ์ ์์ด๋, ๊ณผ์ ํฉ์ด ์ผ์ด๋ ์๋ ์๋ค๋ ๋จ์ ์ด ์์ต๋๋ค. ๋ฐ๋ผ์ ์ค์ ๋ก GBM์ ์ฌ์ฉํ ๋๋ sampling, penalizing ๋ฑ์ regularization ํ ํฌ๋์ ์ด์ฉํ์ฌ ๋ advanced ๋ ๋ชจ๋ธ์ ์ด์ฉํ๋ ๊ฒ์ด ๋ณดํธ์ ์ ๋๋ค.
์ถ์ฒ: https://3months.tistory.com/368 [Deep Play:ํฐ์คํ ๋ฆฌ]
'๐ AI & Bigdata > AI & ML & DL' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
[ML] XGBoost ๊ฐ๋ ์ ๋ฆฌ (0) | 2022.09.13 |
---|---|
[ML] ์์๋ธ ๊ธฐ๋ฒ(bagging, boosting, votting) (0) | 2022.09.01 |
[ML] ๋ชจ๋ธ์ ์ฌ์ฉ๋ feature๋ฅผ ์ ํํ๋ ๊ณผ์ : Permutation Feature Importance (0) | 2022.08.31 |
[ML] GBM์ด๋ (0) | 2022.08.29 |
[AI] XAI, eXplanable AI์ด๋ (0) | 2022.08.29 |