๐Ÿง ๋‚˜์˜ ์ƒ๊ฐ / ๋น„ํŒ (My Thoughts / Critiques)

  • ์‚ฌ์‹ค ๋‹น์—ฐํ•œ ์ด์•ผ๊ธฐ์ธ ๋ฐ์ดํ„ฐ์…‹ ํŠน์„ฑ์— ๋”ฐ๋ผ ์ตœ์  ์ฒญํฌ๋Š” ๋‹ฌ๋ผ์ง„๋‹ค๋Š”๊ฑธ ์‹คํ—˜์œผ๋กœ ๋ฐํ˜€๋‚ธ ๋…ผ๋ฌธ
  • ๋ฐ์ดํ„ฐ์™€ ์ž„๋ฒ ๋”ฉ๋ชจ๋ธ์„ ๋ชจ๋‘ ๊ณ ๋ คํ•ด์„œ ์ฒญํ‚นํ•ด์•ผํ•˜๋Š”๊ฑด ๋‹น์—ฐํ•˜๋‹ค.

3์ค„ ์š”์•ฝ

  • RAG ์‹œ์Šคํ…œ์˜ ๊ฒ€์ƒ‰ ์„ฑ๋Šฅ์— ์žˆ์–ด ์ฒญํฌ(Chunk) ํฌ๊ธฐ๊ฐ€ ๋ฏธ์น˜๋Š” ์˜ํ–ฅ์„ ๋‹ค์–‘ํ•œ ๋ฐ์ดํ„ฐ์…‹๊ณผ ์ž„๋ฒ ๋”ฉ ๋ชจ๋ธ์— ๊ฑธ์ณ ์ฒด๊ณ„์ ์œผ๋กœ ๋ถ„์„ํ•จ.

  • ๋ฐ์ดํ„ฐ์…‹ ํŠน์„ฑ์— ๋”ฐ๋ผ ์ตœ์ ์˜ ์ฒญํฌ ํฌ๊ธฐ๊ฐ€ ๋‹ฌ๋ผ์ง€๋ฉฐ, ๊ฐ„๊ฒฐํ•œ ์‚ฌ์‹ค ๊ธฐ๋ฐ˜ ๋‹ต๋ณ€์—๋Š” ์ž‘์€ ์ฒญํฌ(64-128 ํ† ํฐ)๊ฐ€, ๋„“์€ ๋ฌธ๋งฅ ์ดํ•ด๊ฐ€ ํ•„์š”ํ•  ๋•Œ๋Š” ํฐ ์ฒญํฌ(512-1024 ํ† ํฐ)๊ฐ€ ์œ ๋ฆฌํ•จ ์„ ํ™•์ธํ•จ.

  • ๊ฒฐ๋ก ์ ์œผ๋กœ, ๋ฐ์ดํ„ฐ์…‹์˜ ์ข…๋ฅ˜์™€ ์ž„๋ฒ ๋”ฉ ๋ชจ๋ธ์˜ ์•„ํ‚คํ…์ฒ˜๋ฅผ ๋ชจ๋‘ ๊ณ ๋ คํ•˜์—ฌ ์ฒญํ‚น ์ „๋žต์„ ์ตœ์ ํ™”ํ•ด์•ผ ํ•  ํ•„์š”์„ฑ์„ ์ œ์‹œํ•จ.


1. ๋ชฉํ‘œ (Goal)

์ด ์—ฐ๊ตฌ์˜ ํ•ต์‹ฌ ๋ชฉํ‘œ๋Š” ๊ฒ€์ƒ‰ ์ฆ๊ฐ• ์ƒ์„ฑ(RAG) ์‹œ์Šคํ…œ์—์„œ ๊ณ ์ • ํฌ๊ธฐ ์ฒญํ‚น(fixed-size chunking) ์ „๋žต์ด ๊ฒ€์ƒ‰ ์„ฑ๋Šฅ์— ๋ฏธ์น˜๋Š” ์˜ํ–ฅ์„ ์ฒด๊ณ„์ ์œผ๋กœ ํ‰๊ฐ€ํ•˜๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค. ๊ตฌ์ฒด์ ์œผ๋กœ ์ฒญํฌ ํฌ๊ธฐ, ๋‹ค์–‘ํ•œ ํŠน์„ฑ์„ ๊ฐ€์ง„ ๋ฐ์ดํ„ฐ์…‹, ๊ทธ๋ฆฌ๊ณ  ์—ฌ๋Ÿฌ ์ž„๋ฒ ๋”ฉ ๋ชจ๋ธ ๊ฐ„์˜ ์ƒํ˜ธ์ž‘์šฉ์„ ๋ถ„์„ํ•˜์—ฌ , ๋‹ค์–‘ํ•œ ์งˆ์˜์‘๋‹ต ์‹œ๋‚˜๋ฆฌ์˜ค์— ๋งž๋Š” ์ตœ์ ์˜ ์ฒญํฌ ํฌ๊ธฐ ์„ ํƒ์— ๋Œ€ํ•œ ๊นŠ์ด ์žˆ๋Š” ํ†ต์ฐฐ๋ ฅ์„ ์ œ๊ณตํ•˜๊ณ ์ž ํ•ฉ๋‹ˆ๋‹ค.


2. ๋ฐ์ดํ„ฐ (Data)

์—ฐ๊ตฌ์—๋Š” ๋‹ค์–‘ํ•œ ์œ ํ˜•์˜ ์žฅ๋ฌธ ์ถ”์ถœ์  ์งˆ์˜์‘๋‹ต(long extractive question answering) ๋ฐ์ดํ„ฐ์…‹์ด ์‚ฌ์šฉ๋˜์—ˆ์Šต๋‹ˆ๋‹ค. ์ฃผ์š” ๋ฐ์ดํ„ฐ์…‹์€ ๋‹ค์Œ๊ณผ ๊ฐ™์Šต๋‹ˆ๋‹ค:

  • NarrativeQA

  • Natural Questions (NQ)

  • NewsQA

  • COVID-QA

  • TechQA

  • SQUAD

ํŠนํžˆ, ๊ธด ๋ฌธ์„œ ๋ฐ์ดํ„ฐ์…‹์ด ๋ถ€์กฑํ•œ ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•ด ์—ฌ๋Ÿฌ ๊ฐœ์˜ ์งง์€ QA ๋ฐ์ดํ„ฐ์…‹์„ ์ด์–ด ๋ถ™์—ฌ 50,000์ž ์ด์ƒ์˜ ๊ธด ํ•ฉ์„ฑ ๋ฌธ์„œ๋ฅผ ์ƒ์„ฑํ•˜์—ฌ ์‹คํ—˜์— ํ™œ์šฉํ–ˆ์Šต๋‹ˆ๋‹ค. ๋˜ํ•œ, ํ‰๊ฐ€์˜ ์ •ํ™•๋„๋ฅผ ๋†’์ด๊ธฐ ์œ„ํ•ด ๋ฌธ์„œ ๋ณธ๋ฌธ์— ๋ฐ˜๋“œ์‹œ ์ •๋‹ต์ด ํฌํ•จ๋˜์–ด ์žˆ๋Š”์ง€ ๋ฌธ์ž์—ด ์ผ์น˜ ๋น„๊ต๋ฅผ ํ†ตํ•ด ํ•„ํ„ฐ๋งํ•˜๋Š” ์ „์ฒ˜๋ฆฌ ๊ณผ์ •์„ ๊ฑฐ์ณค์Šต๋‹ˆ๋‹ค.


3. ๋ชจ๋ธ ๋ฐ ์‹œ์Šคํ…œ ๊ตฌ์กฐ (Model & System Architecture)

์‹คํ—˜์€ LlamaIndex ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ ๊ตฌ์ถ•๋œ RAG ์‹œ์Šคํ…œ์„ ์‚ฌ์šฉํ•˜์—ฌ ์ˆ˜ํ–‰๋˜์—ˆ์Šต๋‹ˆ๋‹ค. ์‹œ์Šคํ…œ์˜ ํ•ต์‹ฌ ์š”์†Œ์ธ ์ž„๋ฒ ๋”ฉ ๋ชจ๋ธ์€ ์„œ๋กœ ๋‹ค๋ฅธ ์•„ํ‚คํ…์ฒ˜๋ฅผ ๋Œ€ํ‘œํ•˜๋Š” ๋‘ ๊ฐ€์ง€ ๋ชจ๋ธ์ด ์‚ฌ์šฉ๋˜์—ˆ์Šต๋‹ˆ๋‹ค:

  • Stella: Qwen2๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ ํ•˜๋Š” ๋””์ฝ”๋”(decoder-based) ๋ชจ๋ธ์ž…๋‹ˆ๋‹ค.

  • Snowflake: ์ธ์ฝ”๋”(encoder-based) ๋ชจ๋ธ์ž…๋‹ˆ๋‹ค.

๋ฌธ์„œ ๊ฒ€์ƒ‰์€ ์‚ฌ์šฉ์ž ์งˆ๋ฌธ๊ณผ ๊ฐ ๋ฌธ์„œ ์ฒญํฌ๋ฅผ ์ž„๋ฒ ๋”ฉํ•œ ํ›„, **์ฝ”์‚ฌ์ธ ์œ ์‚ฌ๋„(cosine similarity)**๋ฅผ ๊ณ„์‚ฐํ•˜์—ฌ ๊ฐ€์žฅ ์ ์ˆ˜๊ฐ€ ๋†’์€ ์ƒ์œ„ k๊ฐœ์˜ ์ฒญํฌ๋ฅผ ๋ฐ˜ํ™˜ํ•˜๋Š” ๋ฐฉ์‹์œผ๋กœ ์ด๋ฃจ์–ด์ง‘๋‹ˆ๋‹ค.


4. ์ฃผ์š” ์„ฑ๊ณผ (Key Achievements)

์ด ์—ฐ๊ตฌ๋Š” ๋‹ค์Œ๊ณผ ๊ฐ™์€ ์ค‘์š”ํ•œ ์„ฑ๊ณผ๋“ค์„ ๋‹ฌ์„ฑํ–ˆ์Šต๋‹ˆ๋‹ค:

  • โ€˜๋งŒ๋Šฅโ€™ ์ฒญํฌ ํฌ๊ธฐ๋Š” ์—†์Œ์„ ์ž…์ฆ: ๋ฐ์ดํ„ฐ์…‹์˜ ํŠน์„ฑ์— ๋”ฐ๋ผ ์ตœ์ ์˜ ์ฒญํฌ ํฌ๊ธฐ๊ฐ€ ๊ทน๋ช…ํ•˜๊ฒŒ ๋‹ฌ๋ผ์ง„๋‹ค๋Š” ์‚ฌ์‹ค์„ ์‹คํ—˜์ ์œผ๋กœ ๋ฐํ˜”์Šต๋‹ˆ๋‹ค.

  • ๋ฐ์ดํ„ฐ์…‹ ์œ ํ˜•๋ณ„ ์ตœ์  ์ฒญํฌ ํฌ๊ธฐ ๊ทœ๋ช…:

    • ์ž‘์€ ์ฒญํฌ (64-128 ํ† ํฐ): SQuAD์ฒ˜๋Ÿผ ์ •๋‹ต์ด ๊ฐ„๊ฒฐํ•˜๊ณ  ์‚ฌ์‹ค ๊ธฐ๋ฐ˜์ธ ๋ฐ์ดํ„ฐ์…‹์—์„œ ์ตœ๊ณ ์˜ ์„ฑ๋Šฅ์„ ๋ณด์˜€์Šต๋‹ˆ๋‹ค.

    • ํฐ ์ฒญํฌ (512-1024 ํ† ํฐ): NarrativeQA๋‚˜ TechQA์ฒ˜๋Ÿผ ์ •๋‹ต ์ •๋ณด๊ฐ€ ๋ฌธ์„œ์— ๋„“๊ฒŒ ํผ์ ธ์žˆ๊ฑฐ๋‚˜ ๋ณต์žกํ•œ ๋งฅ๋ฝ ์ดํ•ด๊ฐ€ ํ•„์š”ํ•œ ๋ฐ์ดํ„ฐ์…‹์— ํ•„์ˆ˜์ ์ด์—ˆ์Šต๋‹ˆ๋‹ค.

  • ์ž„๋ฒ ๋”ฉ ๋ชจ๋ธ๊ณผ ์ฒญํฌ ํฌ๊ธฐ์˜ ์ƒํ˜ธ์ž‘์šฉ ๋ถ„์„:

    • Stella(๋””์ฝ”๋” ๊ธฐ๋ฐ˜) ๋ชจ๋ธ์€ ๋” ๋„“์€ ์ „์—ญ์  ๋งฅ๋ฝ์„ ํ™œ์šฉํ•˜๋Š” ๋ฐ ๊ฐ•์ ์„ ๋ณด์—ฌ ํฐ ์ฒญํฌ์—์„œ ๋” ๋‚˜์€ ์„ฑ๋Šฅ์„ ๋ณด์˜€์Šต๋‹ˆ๋‹ค.

    • Snowflake(์ธ์ฝ”๋” ๊ธฐ๋ฐ˜) ๋ชจ๋ธ์€ ์„ธ๋ฐ€ํ•œ ์ •๋ณด ๋งค์นญ์— ๊ฐ•์ ์„ ๋ณด์—ฌ ์ž‘์€ ์ฒญํฌ์—์„œ ๋” ํšจ์œจ์ ์ธ ์„ฑ๋Šฅ์„ ๋‚˜ํƒ€๋ƒˆ์Šต๋‹ˆ๋‹ค.

  • ์‹ค์šฉ์  ๊ฐ€์ด๋“œ๋ผ์ธ ์ œ์‹œ: RAG ์‹œ์Šคํ…œ์„ ๊ตฌ์ถ•ํ•  ๋•Œ ๊ณ ๋ คํ•ด์•ผ ํ•  ์ฒญํฌ ํฌ๊ธฐ, ๋ฐ์ดํ„ฐ์…‹ ํŠน์„ฑ, ๋ชจ๋ธ ์•„ํ‚คํ…์ฒ˜ ๊ฐ„์˜ ์ƒํ˜ธ ์ ˆ์ถฉ ๊ด€๊ณ„(trade-offs)๋ฅผ ๋ช…ํ™•ํžˆ ์ œ์‹œํ•˜์—ฌ ์‹ค์งˆ์ ์ธ ์ตœ์ ํ™” ๋ฐฉํ–ฅ์„ ์ œ๊ณตํ–ˆ์Šต๋‹ˆ๋‹ค.