week2

small data vs big data
small data๋ clean labels๊ฐ ์ค์ํ๊ณ
์ง์ ๋ฐ์ดํฐ์ ์ ํ์ธํ๊ณ ๋ผ๋ฒจ์ ์์ ํ ์ ์์ผ๋ฉฐ
๋ผ๋ฒจ๋ฌ๋ค์ด ์๋ก ์ด์ผ๊ธฐ๋ฅผ ๋๋ ์ ์๋ค.
ํ์ง๋ง, ๋น ๋ฐ์ดํฐ์์ ๋ฐ์ดํฐ ํ๋ก์ธ์ค๊ฐ ์ค์ํ๋ค.

Baseline์ ์ค์์ฑ
์ ํ๋๊ฐ ์ค์ํ ๊ฒ ์๋๋ค.
๋ง์ฝ 99%๊ฐ True, 1%๊ฐ False์ธ ์ง๋ณ ์์ธก ๋ฌธ์ ๊ฐ ์๋ค๋ฉด, 99%์ ์ ํ๋๋ฅผ ๊ฐ๋ ๋ชจ๋ธ์ด ์ข์ ๋ชจ๋ธ์ผ๊น?
ํญ์ True๋ฅผ ์ ์ถํ๊ธฐ๋ง ํด๋ 99%์ ์ ํ๋๋ฅผ ๊ฐ๊ฒ ๋๋ค.
์ด๋ฐ ๊ฒฝ์ฐF1 score๊ฐ ์ ์ฉํ๊ฒ ์ฌ์ฉ๋ ์ ์๋ค.
Baseline ๋ชจ๋ธ์ ๋๊ณ ๋น๊ตํ๋ ๊ฒ ์ข์ ์์์ด ๋๋ค.
HLP(Human Level Performance), Open source model, ๋ค๋ฅธ ์ฌ๋๋ค์ ๋ชจ๋ธ ๋ฑ์ baseline์ผ๋ก ์ฌ์ฉํ ์ ์๋ค.
์ฐธ๊ณ ์๋ฃ
Last updated