week2

  • small data vs big data

    • small data๋Š” clean labels๊ฐ€ ์ค‘์š”ํ•˜๊ณ 

    • ์ง์ ‘ ๋ฐ์ดํ„ฐ์…‹์„ ํ™•์ธํ•˜๊ณ  ๋ผ๋ฒจ์„ ์ˆ˜์ •ํ•  ์ˆ˜ ์žˆ์œผ๋ฉฐ

    • ๋ผ๋ฒจ๋Ÿฌ๋“ค์ด ์„œ๋กœ ์ด์•ผ๊ธฐ๋ฅผ ๋‚˜๋ˆŒ ์ˆ˜ ์žˆ๋‹ค.

    • ํ•˜์ง€๋งŒ, ๋น…๋ฐ์ดํ„ฐ์—์„  ๋ฐ์ดํ„ฐ ํ”„๋กœ์„ธ์Šค๊ฐ€ ์ค‘์š”ํ•˜๋‹ค.

  • Baseline์˜ ์ค‘์š”์„ฑ

    • ์ •ํ™•๋„๊ฐ€ ์ค‘์š”ํ•œ ๊ฒŒ ์•„๋‹ˆ๋‹ค.

      • ๋งŒ์•ฝ 99%๊ฐ€ True, 1%๊ฐ€ False์ธ ์งˆ๋ณ‘ ์˜ˆ์ธก ๋ฌธ์ œ๊ฐ€ ์žˆ๋‹ค๋ฉด, 99%์˜ ์ •ํ™•๋„๋ฅผ ๊ฐ–๋Š” ๋ชจ๋ธ์ด ์ข‹์€ ๋ชจ๋ธ์ผ๊นŒ?

      • ํ•ญ์ƒ True๋ฅผ ์ œ์ถœํ•˜๊ธฐ๋งŒ ํ•ด๋„ 99%์˜ ์ •ํ™•๋„๋ฅผ ๊ฐ–๊ฒŒ ๋œ๋‹ค.

      • ์ด๋Ÿฐ ๊ฒฝ์šฐF1 score๊ฐ€ ์œ ์šฉํ•˜๊ฒŒ ์‚ฌ์šฉ๋  ์ˆ˜ ์žˆ๋‹ค.

    • Baseline ๋ชจ๋ธ์„ ๋‘๊ณ  ๋น„๊ตํ•˜๋Š” ๊ฒŒ ์ข‹์€ ์‹œ์ž‘์ด ๋œ๋‹ค.

      • HLP(Human Level Performance), Open source model, ๋‹ค๋ฅธ ์‚ฌ๋žŒ๋“ค์˜ ๋ชจ๋ธ ๋“ฑ์„ baseline์œผ๋กœ ์‚ฌ์šฉํ•  ์ˆ˜ ์žˆ๋‹ค.

์ฐธ๊ณ  ์ž๋ฃŒ

Last updated