Data Mining?
๋๊ท๋ชจ์ ๋ฐ์ดํฐ๋ก๋ถํฐ ๋ฐ์ดํฐ์ ํจํด์ด๋ ๊ท์น ๋ฑ์ ์ ์ฉํ ์ ๋ณด๋ฅผ ์๋์ผ๋ก ๋ฐ๊ฒฌํ๋ ์์ฉ ๋ฐ ๋ฐฉ๋ฒ(Knowledge Discovery)์ด๋ค.
ํต๊ณํ, ์ธ๊ณต์ง๋ฅ, ๋ฐ์ดํฐ๋ฒ ์ด์ค ๋ฑ ๋ค์ํ ๋ถ์ผ์ ์ฌ์ฉ๋๋ค.
๋ํ์ ์ผ๋ก Association Rules(์ฐ๊ด๊ท์น), Clustering(๊ตฐ์งํ), Classfication(๋ถ๋ฅ), Regression(ํ๊ท) ๋ฑ์ด ์๋ค.
์ฒซ๋ฒ์งธ ๊ทธ๋ฆผ์ ๋ฐ์ดํฐ ๋ง์ด๋์ ํ๋ก์ธ์ค๋ฅผ ๋ํ๋ธ๋ค. (๋ฐ์ดํฐ -> ์ค๋น -> ๋ง์ด๋ ์๊ณ ๋ฆฌ์ฆ -> ๋ฐ์ดํฐ ๋ถ์)
๋๋ฒ์งธ ๊ทธ๋ฆผ์ ๊ทธ ์์์ด๋ค. ๋์ถ ์ ์ฒญ์ ๋ฐ ๊ด๋ จ ๋ฐ์ดํฐ๊ฐ ์ ๋ฆฌ ๋ฐ ๋ณํ๋๋ค. ์ด ๋ฐ์ดํฐ๋ ๋์ถ ์น์ธ ๋๋ ๊ฑฐ์ ์ ์์ธกํ๋๋ฐ ์ฌ์ฉ ๋ ๊ฒ์ด๋ค. ์๊ณ ๋ฆฌ์ฆ์ด ๋ฐ์ดํฐ๋ฅผ ๋ถ์ํ์ฌ ๋ชจ๋ธ์ ์์ฑํ๊ณ , ํ์ต๋ ๋ชจ๋ธ์ด ๋์ถ ์ ์ฒญ ๋ฐ์ดํฐ๋ฅผ ํ๊ฐํ๋ค. ๊ทธ ๊ฒฐ๊ณผ์ ๋ฐ๋ผ ๋์ถ ์ ์ฒญ์ด ๊ฑฐ์ ๋๊ฑฐ๋ ์น์ธ๋๋ค. ํ๋ก์ธ์ค ์ ์ฒด ์ค์์ ๋ฐ์ดํฐ ์ค๋น(Preparation)์ด ๊ฐ์ฅ ์ค์
์ฐ๊ด ๊ท์น(Assosiation Rule)
์ฐ๊ด ๊ท์น์ ๋ฐ์ดํฐ์์ ์๋ก ๋ค๋ฅธ ์์ดํ ์งํฉ ๊ฐ์ ์ฐ๊ด์ฑ์ ๋ถ์ํ๋ ๊ธฐ๋ฒ์ด๋ค.
์๋ฅผ ๋ค์ด X๊ฐ ๋ฐ์ํ๋ฉด Y๋ ๋ฐ์ํ๋ค๋ ํจํด์ ์ฐพ๋ ๋ฐ ์ฌ์ฉ๋๋ค. ์ด ๊ธฐ๋ฒ์ ์ฅ๋ฐ๊ตฌ๋ ๋ถ์์ ํ๋ ๊ฒฝ์ฐ ๋ฑ์ ์ฌ์ฉ ํ ์ ์๋ค.
์ฐ๊ด๊ท์น์ ์ ์ํ๋๋ฐ ํ์ํ ์์๋ ๋ค์๊ณผ ๊ฐ๋ค.
๋ํ์ ์ธ ์๊ณ ๋ฆฌ์ฆ
- Apriori Algorithm
- Agrawal๊ณผ Srikant์ด 1994๋ ์ ์ ์.
- ๋น๋ฒํ ์์ดํ ์งํฉ์ ๋ฐ๋ณต์ ์ผ๋ก ์์ฑํ๋ฉฐ ์ฐ๊ด ๊ท์น์ ๋์ถ.
- FP-Growth Algorithm
- ๋ฐ์ดํฐ์ ๋น๋ฒํ ํจํด์ ํจ์จ์ ์ผ๋ก ์ฐพ๋ ์๊ณ ๋ฆฌ์ฆ.
Apriori ์๊ณ ๋ฆฌ์ฆ
์ฐ๊ด ๊ท์น ๋ถ์์์ ๊ฐ์ฅ ๋๋ฆฌ ์ฌ์ฉ๋๋ ๋ฐฉ๋ฒ ์ค ํ๋๋ก, ๋ฐ์ดํฐ๋ฒ ์ด์ค์์ ๋น๋ฒํ ์์ดํ ์งํฉ(Frequent Itemsets)์ ํจ์จ์ ์ผ๋ก ํ์ํ๊ณ ์ด๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ๊ท์น์ ์์ฑํ๋ค.
์๋๋ Minimum Support = 2 ๋ก ์ค์ ๋ ์์ ์ด๋ค.
๋ฐ์ดํฐ ์ค๋น: ์ ๋ ฅ ๋ฐ์ดํฐ๋ ๊ฑฐ๋(Transaction) ๋ชฉ๋ก์ผ๋ก ๊ตฌ์ฑ๋๋ค (TID, items๋ก ์ด๋ฃจ์ด์ง ๋ฐ์ดํฐ๋ฒ ์ด์ค D)
C1 ์์ฑ: ๋ชจ๋ ์์ดํ ๊ฐ์ ๊ณ์ฐ -> ๋ฐ์ดํฐ๋ฒ ์ด์ค๋ฅผ ์ค์บํ์ฌ ๊ฐ๊ฐ์ ์์ดํ ์ด ๊ฑฐ๋์์ ๋ฑ์ฅํ ํ์(Support)๋ฅผ ๊ณ์ฐ
L1์์ฑ: ์ต์ ์ง์ง๋ ๊ธฐ์ค์ผ๋ก ํํฐ๋ง -> minimum Support(์ต์ ์ง์ง๋)๊ฐ 2๋ก ์ค์ ๋์๊ธฐ ๋๋ฌธ์, ๋ฑ์ฅ ํ์๊ฐ 2 ๋ฏธ๋ง์ธ ์์ดํ ์ ์ ๊ฑฐ
C2์์ฑ: ๋๊ฐ์ ์์ดํ ์กฐํฉ -> ๋จ์ ์์ดํ ๋ค์ 2๊ฐ์ฉ ์กฐํฉํ์ฌ ๊ฐ๋ฅํ ๋ชจ๋ ์์ดํ ์งํฉ ์์ฑ
L2 ์์ฑ: ์ต์ ์ง์ง๋ ๊ธฐ์ค์ผ๋ก ๋ค์ ํํฐ๋ง
C3 ์์ฑ: 3๊ฐ์ ์์ดํ ์กฐํฉ -> L2์์ ์ด์๋จ์ ์์ดํ ์งํฉ๋ค์ ์กฐ์ฌํ์ฌ 3๊ฐ๋ก ํ์ฅ.
L3 ์์ฑ: ์ต์ข ๋น๋ฒํ ์์ดํ ์งํฉ ๋์ถ -> ์ต์ ์ง์ง๋ ๊ธฐ์ค์ผ๋ก ๋ฑ์ฅ ํ์๊ฐ 2 ์ด์์ธ ์งํฉ๋ง ์ ํ
์ต์ข ๊ฒฐ๊ณผ : {2,3,5}๊ฐ ์ต์ ์ง์ง๋ 2 ๊ธฐ์ค์์ ์ต์ข ๋น๋ฒํ ์์ดํ ์งํฉ์ผ๋ก ๋์ถ
ํฌ์ธํธ๋ ๋ฐ๋ณต์ ํ์์ผ๋ก ํํฐ๋ง์ ํ๋ ๊ฒ, ๊ทธ๋ฆฌ๊ณ ๋ถํ์ํ ์กฐํฉ์ ๋ฏธ๋ฆฌ ์ ๊ฑฐํ์ฌ ์ฐ์ฐ๋์ ์ค์ด๋ ๊ฒ์ด๋ค.
์ด๋ ๊ฒ ๋์ถ๋ ๋น๋ฒํ ์์ดํ ์งํฉ์ ๊ธฐ๋ฐ์ผ๋ก ์ฐ๊ด๊ท์น(์: 2์ 3์ ์ฌ๋ฉด 5๋ฅผ ์ด ๊ฐ๋ฅ์ฑ์ด ๋์)์ ์์ฑํ ์ ์๋ค.
์ ์์๊ฑฐ๋ ์ฅ๋ฐ๊ตฌ๋ ๋ถ์, ๋ง์ผํ ์ ํ ์ถ์ฒ ์์คํ ๋ฑ์ ์ฐ์ผ ์ ์๋ค.
Clustering
๋ฐ์ดํฐ๋ฅผ ์ ์ฌํ ํน์ฑ์ ๊ฐ์ง ๊ทธ๋ฃน(Cluster)๋ก ๋ฌถ๋ ๊ณผ์ ์ด๋ค. ์ด ๊ณผ์ ์ ์ฃผ๋ก ๋น์ง๋ ํ์ต(Unsupervised Learning) ๊ธฐ๋ฒ์ ์ํ๋ฉฐ, ๋ฐ์ดํฐ์ ๋ํ ์ฌ์ ๋ ์ด๋ธ ์์ด๋ ์จ๊ฒจ์ง ํจํด์ด๋ ๊ตฌ์กฐ๋ฅผ ์ฐพ๋๋ฐ ์ฌ์ฉ๋๋ค.
๋ฐ์ดํฐ ๊ตฌ์กฐ๋ฅผ ์ดํดํ๊ณ ํจ์จ์ฑ์ ํฅ์์ํค๋ ๊ฒ์ ๋ชฉ์ ์ผ๋ก ํ๋ค.
๋ํ์ ์ธ ์๊ณ ๋ฆฌ์ฆ์ K-means ๋ฑ์ด ์์ผ๋ฉฐ, ์ด๋ฏธ์ง ๋ถ๋ฅ, ์ด์ ํ์ง, ์ถ์ฒ ์์คํ (๋น์ทํ ์ฑํฅ์ ์ฌ์ฉ์ ๊ทธ๋ฃน ์์ฑ) ๋ฑ์ ์ฐ์ธ๋ค.
K-means
๋ฐ์ดํฐ๋ฅผ K๊ฐ์ ํด๋ฌ์คํฐ๋ก ๋๋๋ ๊ฐ์ฅ ๋๋ฆฌ ์ฐ์ด๋ ์๊ณ ๋ฆฌ์ฆ์ด๋ค.
๊ฐ ๋ฐ์ดํฐ๋ ๊ฐ์ฅ ๊ฐ๊น์ด ์ค์ฌ์ ์ ํ ๋น๋๋ฉฐ, ํด๋ฌ์คํฐ๋ ์ค์ฌ์ ์ ๊ธฐ์ค์ผ๋ก ์ ์๋๋ค.
N๊ฐ์ ๋ฐ์ดํฐ๋ฅผ K๊ฐ์ ํด๋ฌ์คํฐ๋ก ๋๋๊ณ , ๊ฐ ๋ฐ์ดํฐ๋ ๊ฐ์ฅ ๊ฐ๊น์ด ์ค์ฌ์ ์ ๊ธฐ์ค์ผ๋ก ํด๋ฌ์คํฐ์ ์์๋๋ค.
์ค์ฌ์ ์ ํด๋ฌ์คํฐ์ ์ค์ฌ์ ๋ํ๋ด๋ฉฐ ๋ฐ์ดํฐ๊ฐ ์์๋ ํด๋ฌ์คํฐ๋ฅผ ๊ฒฐ์ ํ๋ ๊ธฐ์ค์ด ๋๋ค.
์ต์ ํ ๋ชฉํ๋ ํด๋ฌ์คํฐ ๋ด ๋ฐ์ดํฐ ๊ฐ์ ๊ฑฐ๋ฆฌ๋ฅผ ์ต์ํํ๋ ๋ฐฉํฅ์ผ๋ก ์ค์ฌ์ ์ ๋ฐ๋ณต์ ์ผ๋ก ์กฐ์ ํ๋ค.
์๊ณ ๋ฆฌ์ฆ ํ๋ฆ์ ์์๋๋ก ์ ๋ฆฌํด๋ณด๋ฉด
- ์ด๊ธฐ ์ค์ฌ์ (K๊ฐ์ ๋๋ค ์์น) ์ค์ .
- ๊ฐ ๋ฐ์ดํฐ๋ฅผ ๊ฐ์ฅ ๊ฐ๊น์ด ์ค์ฌ์ ์ ํ ๋น.
- ๊ฐ ํด๋ฌ์คํฐ์ ํ๊ท ์์น๋ฅผ ๊ณ์ฐํ์ฌ ์ค์ฌ์ ๊ฐฑ์ .
- ์ค์ฌ์ ๋ณํ๊ฐ ์์ ๋๊น์ง ๋ฐ๋ณต.
์ด ๊ณผ์ ์ ๋ฐ๋ณตํ๋ค.
์ด๋ค ํ๋ฆ์ผ๋ก ํด๋ฌ์คํฐ๋ง ๋๋์ง๋ ์๊ฐ์ ์ผ๋ก ๋ณด๋ ๊ฒ์ด ๊ฐ์ฅ ๋์์ด ๋์๋ ๊ฒ ๊ฐ์์, ์ ํ๋ธ ์์์ ๋จ๊ฒจ๋๋ค.
https://youtu.be/nXY6PxAaOk0?si=_CoRYsVZFh0hlfmZ
K-means๋ ์ค์ฌ์ ๊ณผ ๋ฐ์ดํฐ ํ ๋น์ ๋ฐ๋ณตํ์ฌ ์ต์ ํํ๋ EM ์๊ณ ๋ฆฌ์ฆ์ ํด๋น๋๋ค.
๊ฐ๋จํ๊ณ ๋น ๋ฅธ ์ฐ์ฐ์ด ๊ฐ๋ฅํ์ฌ ๋๊ท๋ชจ ๋ฐ์ดํฐ์๋ ํจ์จ์ ์ด๋ค.
๊ณ ๊ฐ ์ธ๋ถํ, ์ด๋ฏธ์ง ์์ถ, ์ด์ ํ์ง, ๋ฌธ์ ๋ถ๋ฅ ๋ฑ์ ์ฌ์ฉ๋๋ค.
๋ถ๋ฅ(Classfication)
๋ถ๋ฅ๋ ์ฃผ์ด์ง ๋ณ์์ ๋ํ ์นดํ ๊ณ ๋ฆฌ๋ฅผ ์ฐพ๋ ๊ณผ์ ์ด๋ค. ์๋ฅผ ๋ค์ด, ์ฆ์์ ๋ณด๊ณ ํ์๊ฐ ํจ์ ๊ฑธ๋ ธ๋๊ฐ๋ฅผ Yes, No๋ก ํ๋จํ๋ ๊ฒ
์ด๋ฌํ ๋ถ๋ฅ๋ Supervised learning(training data)๊ฐ ํ์ํ๋ค.
๋ํ์ ์ธ ์๊ณ ๋ฆฌ์ฆ์ผ๋ก๋ Decision Tree, Support Vector Machines์ด ์๋ค. ํต๊ณํ๊ณผ ์ ํ๋์์ ์ด๋ก ์ ์๊ณ ์์ด์ผ ์ค๋ช ํ ์ ์๋ ๋ด์ฉ์ด๋ฏ๋ก ์๊ณ ๋ฆฌ์ฆ์ ๋ํ ์ค๋ช ์ ์๋ตํ๋ค.
Support Vector Machine(SVM)
๊ธฐ๊ณ ํ์ต์ ๋ถ์ผ ์ค ํ๋๋ก ํจํด ์ธ์, ์๋ฃ ๋ถ์์ ์ํ ์ง๋ ํ์ต ๋ชจ๋ธ์ด๋ค.
์ ํธ ์ฒ๋ฆฌ, ์๋ฃ ์์ฉ ๋ถ์ผ, ์์ฐ์ด ์ฒ๋ฆฌ, ์์ฑ ๋ฐ ์์ ์ธ์์ ๋น๋กฏ ์ฌ๋ฌ ๋ถ๋ฅ ๋ฐ ํ๊ท ๋ฌธ์ ์ ์ฌ์ฉ๋๋ ์๊ณ ๋ฆฌ์ฆ์ด๋ค.
-> SVC(Classfication), SVR(Regression)
๋ฐ์ดํฐ๊ฐ ๋ง์ด ํ์ ์์ง๋ง, ์ํ์ Background๊ฐ ํ์ํ๋ค.
ํผ๋ ํ๋ ฌ(Confusion Matrix )
ํผ๋ ํ๋ ฌ์ ๋ถ๋ฅ(Classification) ๋ชจ๋ธ์ ์ฑ๋ฅ์ ์๊ฐ์ ์ผ๋ก ํ๊ฐํ๋ ๋ฐ ์ฌ์ฉ๋๋ ํ ํ์์ ๋๊ตฌ๋ค.
๋ถ๋ฅ ๋ฌ๋ธ์ ์์ธก ๊ฒฐ๊ณผ์ ์ค์ ๊ฒฐ๊ณผ๋ฅผ ๋น๊ตํ์ฌ TP, FP, TN, FN 4๊ฐ์ง ์ฃผ์ ์งํ๋ฅผ ๋์ถํ๋ค.
๊ตฌ์ฑ
- True Positive (TP): ์ค์ ๋ก Positive์ธ ๋ฐ์ดํฐ๋ฅผ Positive๋ก ์ฌ๋ฐ๋ฅด๊ฒ ์์ธกํ ๊ฒฝ์ฐ.
- False Positive (FP): ์ค์ ๋ก Negative์ธ ๋ฐ์ดํฐ๋ฅผ Positive๋ก ์๋ชป ์์ธกํ ๊ฒฝ์ฐ (Type I error).
- True Negative (TN): ์ค์ ๋ก Negative์ธ ๋ฐ์ดํฐ๋ฅผ Negative๋ก ์ฌ๋ฐ๋ฅด๊ฒ ์์ธกํ ๊ฒฝ์ฐ.
- False Negative (FN): ์ค์ ๋ก Positive์ธ ๋ฐ์ดํฐ๋ฅผ Negative๋ก ์๋ชป ์์ธกํ ๊ฒฝ์ฐ (Type II error).
์๋ฅผ ๋ค์ด, ์์ด ๊ฑธ๋ฆฐ ํ์๊ฐ ์์ด ์๊ฑธ๋ ธ๋ค๊ณ ์๋ชป ํ๋จํ๋ ๊ฒฝ์ฐ๋ฅผ False Negative๋ผ๊ณ ํ๋ค. ์ด๋ฌํ ์ค๋ฅ๋ ์น๋ช ์ ์ด๊ธฐ ๋๋ฌธ์ ์ค์ฌ์ผ ํ๋ค.
Precision(์ ๋ฐ๋) and Recall(์ฌํ์จ)
์ ๋ฐ๋, ์ฌํ์จ ๋ ๊ฐ๋ ์ ๋ถ๋ฅ ๋ชจ๋ธ์ ์ฑ๋ฅ์ ํ๊ฐํ๋๋ฐ ์ค์ํ ์งํ์ด๋ค.
Positivie๋ผ๊ณ ์์ธกํ ๊ฐ ์ค ์ค์ ๋ก Positive์ธ ๋น์จ์ ์๋ฏธํ๋ค.
์ ๋ฐ๋
์ ๋ฐ๋๋ Positive๋ผ๊ณ ์์ธกํ ๊ฐ ์ค ์ค์ ๋ก Positive์ธ ๋น์จ์ ์๋ฏธํ๋ค.
FP๋ฅผ ์ค์ด๋ ๊ฒ์ด ์ค์ํ๋ค. ์ฆ ์๋ชป๋ Positive ์์ธก์ ์ค์ด๋ ๋ฐ ์ด์ ์ ๋ง์ถ๋ค.
์๋ฅผ ๋ค์ด ์คํธ ํํฐ ๋ฑ์ ๊ตฌํํ ๋, ์ ํจํ ์ด๋ฉ์ผ์ ์คํธ์ผ๋ก ๋ถ๋ฅํ์ง ์๋๋ก ํ๋ ๊ฒ์ ์ฐ์ ์ ํด์ผํ๋ค.
-> ์์ ์ด ์ฐ์ ์ด๋ค ๋ผ๋ ์ ๊ทผ๋ฐฉ์
์ฌํ์จ
์ฌํ์จ์ Positive์ธ ๊ฐ ์ค ๋ชจ๋ธ์ด Positive๋ก ์ฌ๋ฐ๋ฅด๊ฒ ์์ธกํ ๋น์จ์ ์๋ฏธํ๋ค.
FN์ ์ค์ด๋ ๊ฒ์ด ์ค์ํ๋ค. ์ฆ ๋์น Positive ์์ธก์ ์ต์ํํ๋๋ฐ ์ด์ ์ ๋ง์ถ๋ค.
์๋ฅผ ๋ค์ด ๊ณ ๊ฐ ๊ด๋ฆฌ ์์คํ ์์ ์ค์ํ ๊ณ ๊ฐ์ ๋์น์ง ์๋ ๊ฒ์ ์ฐ์ ์ ํด์ผํ๋ค.
-> ์ ๊ทผ์ฑ์ด ์ฐ์ ์ด๋ค ๋ผ๋ ์ ๊ทผ ๋ฐฉ์
์ด ๋๊ฐ์ง ์งํ ์ธ์๋, ํผ๋ ํ๋ ฌ์ ๊ธฐ๋ฐ์ผ๋ก ๊ณ์ฐํ ์ ์๋ ์ฃผ์ ์ฑ๋ฅ ์งํ๋ ๋ค์๊ณผ ๊ฐ๋ค.
ํน์ด๋(Specificity)๋ ์ค์ Negative์ค ์ ๋๋ก ์์ธกํ ๋น์จ, Accuracy๋ ์ ์ฒด ๋ฐ์ดํฐ์ค ์ฌ๋ฐ๋ฅด๊ฒ ์์ธกํ ๋น์จ์ด๋ค.
F-measure(F1 Score)
F-Measure๋ Precision๊ณผ Recall์ ์กฐํ ํ๊ท (Harmonic Mean)์ ํตํด ๋ ์งํ ๊ฐ์ ๊ท ํ์ ์ธก์ ํ๋ ํ๊ฐ ์งํ์ด๋ค.
๋ ์งํ์ค ์ด๋ ํ๋์๋ง ์น์คํ์ง ์๊ณ ์ข ํฉ์ ์ธ ์ฑ๋ฅ์ ํ๊ฐํ๋ ์งํ๋ก ์ฌ์ฉ๋๋ค.
์๋ฅผ๋ค์ด, ๊ฐ์ฅ ์์ ํ ์คํธ ํํฐ๋ฅผ ๋ง๋ ๋ค๊ณ ํ๋ฉด ๋ชจ๋ ์ด๋ฉ์ผ์ ์คํธ์ผ๋ก ์์ธกํ ์ ์์ง๋ง, Recall์ ๋์๋ Precision์ด ๋ฎ์ ์ ์๋ค.
๊ณ ๊ฐ ๊ด๋ฆฌ ํํฐ ๋ํ ๋ชจ๋ ๊ณ ๊ฐ์ VIP๋ผ๊ณ ์์ธกํ๋ฉด ๋์ง๋ง, Precision์ ๋ฎ์๋ Recall์ด ๋์ ์ ์๋ค.
๊ธฐ๋ณธ์ ์ธ F1-Measure์ ๊ฒฝ์ฐ ๋ ์งํ ๋ชจ๋์๊ฒ ๋์ผํ ๊ฐ์ค์น๋ฅผ ๋ถ์ฌํ๋ค.
Fb-Measure์ ๊ฒฝ์ฐ b๊ฐ์ ํตํด ๋ ์ค ํ๋์ ๋ ๋์ ๊ฐ์ค์น๋ฅผ ๋ถ์ฌํ๋ค.
b๊ฐ 1๋ณด๋ค ํฌ๋ฉด Recall์, 1๋ณด๋ค ์์ผ๋ฉด Precision์ ๋ ํฐ ๋น์ค์ ๋๋ค.
์ด๊ฑธ ์ข ๋ ํ์ฅํด์
F2-Measure์ F0.5-Meauser๋ ์ ์๋๋ค.(๊ฐ๊ฐ b๊ฐ 2์ 0.5)
์ด์ฒ๋ผ F-Measure์งํ๋ Precision๊ณผ Recall์ ์ฐ์ ์์๋ฅผ ์กฐ์ ํ์ฌ ๋ชจ๋ธ์ ์ฑ๋ฅ์ ์ต์ ํํ๋๋ฐ ๋์์ ์ค๋ค.
๋ง์ฐฌ๊ฐ์ง๋ก, Confusion Matrix๋ ์ด๋ ๊ฒ ๋ค์ํ ์งํ๋ค์ ๋ค๋ฃจ์ด ๋ชจ๋ธ์ ํน์ฑ์ ํ์ ํ๊ณ , ์ค๋ถ๋ฅ ๋๋ ๋ฌธ์ ์ ์ ํ์ ํ๋ ๋ฑ ์ฑ๋ฅ์ ํ๊ฐํ๋ ์ฉ๋๋ก ํ์ฉํ ์ ์๋ค. ์ด๋ฅผ ํ ๋๋ก ๋ชจ๋ธ์ ๊ฐ์ ํ๋ ๊ฒ์ด ๊ฐ๋ฅํ๋ค.
'Database > ๋ฐ์ดํฐ๋ฒ ์ด์ค ์ด๋ก ' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
[DB] ๐ Big Data ๊ธฐ์ (feat. MapReduce, Hadoop) (3) | 2024.12.07 |
---|---|
[DB] ๐ NoSQL์ ํน์ง๊ณผ ์ข ๋ฅ (0) | 2024.12.07 |
[DB] ๐ ๋ฐ์ดํฐ๋ฒ ์ด์ค ์ธ๋ฑ์ฑ ๐๏ธ ๊ตฌ์กฐ with MySQL (0) | 2024.12.06 |
[DB] ๐ ๋์์ฑ ์ ์ด(Concurrency Control) with MySQL (1) | 2024.12.06 |
[DB] ๐ ํธ๋์ญ์ (Transaction), ํ๋ณต(Recovery) with MySQL (0) | 2024.12.02 |