๐Ÿง ๋‚˜์˜ ์ƒ๊ฐ / ๋น„ํŒ (My Thoughts / Critiques)

  • ๊ตฌ์กฐ์  ์š”์†Œ๋ฅผ ์ธ์‹ํ•ด์„œ ์ฒญํ‚น์„ ํ•˜๋ฉด ๊ธฐ๋ณธ ๊ณ ์ • ํฌ๊ธฐ ๋ฐฉ์‹๋ณด๋‹ค ์ข‹๋‹ค.
  • ์ด๊ฒƒ๋„ ์ด๋ก ์ ์œผ๋กœ ๋‹น์—ฐํžˆ ์ƒ๊ฐํ•˜๋˜ ๋‚ด์šฉ์ด๊ธด ํ•˜๋‹ค.
  • ๊ทธ๋ž˜๋„ ๊ทธ๊ฑธ ์‹คํ—˜์œผ๋กœ ์ฆ๋ช…ํ•ด๋‚ธ ๋…ผ๋ฌธ

3์ค„ ์š”์•ฝ

  • ๊ธฐ์กด์˜ ๊ณ ์ • ํฌ๊ธฐ ์ฒญํ‚น ๋ฐฉ์‹์˜ ํ•œ๊ณ„๋ฅผ ์ง€์ ํ•˜๊ณ , ๋ฌธ์„œ์˜ ๊ตฌ์กฐ์  โ€˜์š”์†Œโ€™(์ œ๋ชฉ, ํ‘œ ๋“ฑ)๋ฅผ ์ธ์‹ํ•ด ์ฒญํฌ๋ฅผ ์ƒ์„ฑํ•˜๋Š” ์ƒˆ๋กœ์šด RAG ์ ‘๊ทผ๋ฒ•์„ ์ œ์•ˆํ•จ.

  • ๊ธˆ์œต ๋ณด๊ณ ์„œ(FinanceBench) ๋Œ€์ƒ ์‹คํ—˜ ๊ฒฐ๊ณผ, ์ œ์•ˆ ๋ฐฉ์‹์ด ๊ธฐ์กด ๊ณ ์ • ํฌ๊ธฐ ๋ฐฉ์‹๋ณด๋‹ค ์›”๋“ฑํžˆ ๋†’์€ Q&A ์ •ํ™•๋„(53.19%)๋ฅผ ๋‹ฌ์„ฑํ•˜๋ฉฐ ์ตœ๊ณ  ์„ฑ๋Šฅ์„ ๊ธฐ๋กํ•จ.

  • ๋ฌธ์„œ ๊ตฌ์กฐ๋ฅผ ๋ณด์กดํ•˜๋Š” ์ฒญํ‚น์ด ์ˆ˜๋™ ํŠœ๋‹ ์—†์ด๋„ RAG ์„ฑ๋Šฅ์„ ์ตœ์ ํ™”ํ•  ์ˆ˜ ์žˆ๋Š” ํšจ๊ณผ์ ์ธ ์ „๋žต์ž„์„ ์ž…์ฆํ•จ.

1. ๋ชฉํ‘œ (Goal)

์ด ์—ฐ๊ตฌ์˜ ๋ชฉํ‘œ๋Š” ๊ธฐ์กด์˜ ๊ณ ์ • ํฌ๊ธฐ๋‚˜ ๋ฌธ๋‹จ ๋‹จ์œ„ ์ฒญํ‚น ๋ฐฉ์‹์ด ๋ฌธ์„œ์˜ ๊ตฌ์กฐ์  ์ •๋ณด๋ฅผ ๋ฌด์‹œํ•˜๋Š” ํ•œ๊ณ„๋ฅผ ์ง€์ ํ•˜๊ณ , ๋ฌธ์„œ์˜ ๊ตฌ์กฐ์  โ€˜์š”์†Œโ€™(element)๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ ์ฒญํ‚นํ•˜๋Š” ์ƒˆ๋กœ์šด ์ „๋žต์„ ์ œ์•ˆํ•˜๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค. ํŠนํžˆ, ์ œ๋ชฉ, ํ‘œ, ๋ฆฌ์ŠคํŠธ ๋“ฑ ๋ฌธ์„œ์˜ ๋…ผ๋ฆฌ์  ๋‹จ์œ„๋ฅผ ๊ทธ๋Œ€๋กœ ๋ณด์กดํ•˜๋Š” ์ฒญํ‚น์„ ํ†ตํ•ด ๊ธˆ์œต ๋ณด๊ณ ์„œ์™€ ๊ฐ™์€ ๋ณต์žกํ•œ ๋ฌธ์„œ์— ๋Œ€ํ•œ RAG ์‹œ์Šคํ…œ์˜ ๊ฒ€์ƒ‰ ๋ฐ ๋‹ต๋ณ€ ์ •ํ™•๋„๋ฅผ ํฌ๊ฒŒ ํ–ฅ์ƒ์‹œํ‚ค๋Š” ๊ฒƒ์„ ๋ชฉํ‘œ๋กœ ํ•ฉ๋‹ˆ๋‹ค.


2. ๋ฐ์ดํ„ฐ (Data)

์‹คํ—˜์—๋Š” ์‹ค์ œ ๊ธˆ์œต ์‹œ๋‚˜๋ฆฌ์˜ค์˜ ๋ณต์žกํ•œ ์งˆ๋ฌธ๋“ค๋กœ ๊ตฌ์„ฑ๋œ โ€˜FinanceBenchโ€™ ๋ฒค์น˜๋งˆํฌ ๋ฐ์ดํ„ฐ์…‹์ด ์‚ฌ์šฉ๋˜์—ˆ์Šต๋‹ˆ๋‹ค. ์ด ๋ฐ์ดํ„ฐ์…‹์€ ์ด 84๊ฐœ์˜ ๊ณ ์œ ํ•œ ๋ฏธ๊ตญ ์ฆ๊ถŒ๊ฑฐ๋ž˜์œ„์›ํšŒ(SEC) ๊ธˆ์œต ๋ณด๊ณ ์„œ(10-K, 10-Q ๋“ฑ)์™€ ์ด์— ๋Œ€ํ•œ 141๊ฐœ์˜ ์งˆ์˜์‘๋‹ต ์Œ์œผ๋กœ ๊ตฌ์„ฑ๋ฉ๋‹ˆ๋‹ค. ๋ฌธ์„œ๋“ค์˜ ํ‰๊ท  ํŽ˜์ด์ง€ ์ˆ˜๊ฐ€ 147์ชฝ์— ๋‹ฌํ•˜๊ณ  ์ •๋‹ต์˜ ๊ทผ๊ฑฐ๊ฐ€ ๋ฌธ์„œ ์ „๋ฐ˜์— ํฉ์–ด์ ธ ์žˆ์–ด, RAG ์‹œ์Šคํ…œ์˜ ์„ฑ๋Šฅ์„ ํ‰๊ฐ€ํ•˜๊ธฐ์— ๋งค์šฐ ์ ํ•ฉํ•œ ๋ฐ์ดํ„ฐ์…‹์ž…๋‹ˆ๋‹ค.


3. ๋ชจ๋ธ ๊ตฌ์กฐ (Model Architecture)

์ด ์—ฐ๊ตฌ๋Š” ํ‘œ์ค€์ ์ธ RAG(๊ฒ€์ƒ‰ ์ฆ๊ฐ• ์ƒ์„ฑ) ํŒŒ์ดํ”„๋ผ์ธ์„ ๊ธฐ๋ฐ˜์œผ๋กœ ํ•ฉ๋‹ˆ๋‹ค.

  • ๋ฌธ์„œ ์ฒ˜๋ฆฌ ๋ฐ ์ฒญํ‚น: ํ•ต์‹ฌ ๊ธฐ์ˆ ๋กœ, Unstructured ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ์˜ โ€˜Chipperโ€™ ๋ชจ๋ธ์„ ์‚ฌ์šฉํ•˜์—ฌ ๋ฌธ์„œ์˜ ์‹œ๊ฐ์ , ๊ตฌ์กฐ์  ์š”์†Œ๋ฅผ ์‹๋ณ„ํ•ฉ๋‹ˆ๋‹ค. ์ด ๋ชจ๋ธ์€ ๋ฌธ์„œ ๋‚ด์˜ ํ‘œ(Table), ์ œ๋ชฉ(Title), ์„œ์ˆ  ํ…์ŠคํŠธ(Narrative Text) ๋“ฑ์„ ๋จผ์ € ์ธ์‹ํ•œ ํ›„, ์ด ์š”์†Œ๋“ค์„ ์ค‘์‹ฌ์œผ๋กœ ์˜๋ฏธ๊ฐ€ ํ›ผ์†๋˜์ง€ ์•Š๋„๋ก ์ฒญํฌ๋ฅผ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค.

  • ์ธ๋ฑ์‹ฑ ๋ฐ ๊ฒ€์ƒ‰: sentence-transformer ๋ชจ๋ธ๋กœ ๊ฐ ์ฒญํฌ๋ฅผ ์ž„๋ฒ ๋”ฉํ•˜๊ณ , Weaviate ๋ฒกํ„ฐ ๋ฐ์ดํ„ฐ๋ฒ ์ด์Šค์— ์ €์žฅํ•˜์—ฌ ์งˆ๋ฌธ๊ณผ ๊ฐ€์žฅ ์œ ์‚ฌํ•œ ์ƒ์œ„ 10๊ฐœ์˜ ์ฒญํฌ๋ฅผ ๊ฒ€์ƒ‰ํ•ฉ๋‹ˆ๋‹ค.

  • ๋‹ต๋ณ€ ์ƒ์„ฑ: ๊ฒ€์ƒ‰๋œ ์ฒญํฌ์™€ ์›๋ณธ ์งˆ๋ฌธ์„ GPT-4 ๋ชจ๋ธ์— ์ž…๋ ฅํ•˜์—ฌ ์ตœ์ข… ๋‹ต๋ณ€์„ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค.


4. ์ฃผ์š” ์„ฑ๊ณผ (Key Achievements)

  • ์ตœ๊ณ  ์ˆ˜์ค€์˜ Q&A ์ •ํ™•๋„ ๋‹ฌ์„ฑ: ์ œ์•ˆ๋œ โ€˜์š”์†Œ ๊ธฐ๋ฐ˜ ์ฒญํ‚นโ€™ ์ „๋žต์€ 53.19%์˜ Q&A ์ •ํ™•๋„๋ฅผ ๊ธฐ๋กํ•˜๋ฉฐ, ๊ธฐ์กด์˜ ๋ชจ๋“  ๊ณ ์ • ํฌ๊ธฐ ์ฒญํ‚น ๋ฐฉ์‹(์ตœ๋Œ€ 48.23%)์„ ํฌ๊ฒŒ ๋›ฐ์–ด๋„˜๋Š” ์ตœ๊ณ  ์„ฑ๋Šฅ(State-of-the-art)์„ ๋‹ฌ์„ฑํ–ˆ์Šต๋‹ˆ๋‹ค.

  • ํŠœ๋‹ ์—†๋Š” ์ผ๋ฐ˜ํ™” ๊ฐ€๋Šฅ์„ฑ: ์ด ๋ฐฉ์‹์€ ๋ฌธ์„œ์˜ ๊ณ ์œ ํ•œ ๊ตฌ์กฐ๋ฅผ ์ž๋™์œผ๋กœ ์ธ์‹ํ•˜์—ฌ ์ฒญํฌ๋ฅผ ์ƒ์„ฑํ•˜๋ฏ€๋กœ, ๋ฌธ์„œ ์ข…๋ฅ˜๋งˆ๋‹ค ์ตœ์ ์˜ ์ฒญํฌ ํฌ๊ธฐ๋ฅผ ์ˆ˜๋™์œผ๋กœ ์กฐ์ •ํ•  ํ•„์š”๊ฐ€ ์—†๋Š” ์ผ๋ฐ˜ํ™”๋œ ์ ‘๊ทผ๋ฒ•์ž„์„ ์ฆ๋ช…ํ–ˆ์Šต๋‹ˆ๋‹ค.

  • ์ผ๊ด€๋˜๊ณ  ๋†’์€ ๊ฒ€์ƒ‰ ํ’ˆ์งˆ: ๊ธฐ์กด ๋ฐฉ์‹์ด ์ •๋‹ต์ด ์žˆ๋Š” โ€˜ํŽ˜์ด์ง€โ€™๋Š” ์ž˜ ์ฐพ์•„๋„ ์ •์ž‘ ํ•„์š”ํ•œ โ€˜๋ฌธ๋งฅโ€™์„ ๋†“์น˜๋Š” ๋ฐ˜๋ฉด, ์š”์†Œ ๊ธฐ๋ฐ˜ ์ฒญํ‚น์€ ๊ฒ€์ƒ‰ ์ •ํ™•๋„์™€ ์ตœ์ข… ๋‹ต๋ณ€ ์ •ํ™•๋„ ๋ชจ๋‘์—์„œ ์ผ๊ด€๋˜๊ฒŒ ๋†’์€ ์„ฑ๋Šฅ์„ ๋ณด์˜€์Šต๋‹ˆ๋‹ค.

  • ๋น„์šฉ ๋ฐ ์†๋„ ํšจ์œจ์„ฑ: ๋” ์ ์€ ์ˆ˜์˜ ์ฒญํฌ๋กœ๋„ ์ตœ๊ณ ์˜ ์„ฑ๋Šฅ์„ ๋‹ฌ์„ฑํ•˜์—ฌ, ๋ฒกํ„ฐ ๋ฐ์ดํ„ฐ๋ฒ ์ด์Šค์˜ ์ธ๋ฑ์‹ฑ ๋น„์šฉ๊ณผ ๊ฒ€์ƒ‰ ์ง€์—ฐ ์‹œ๊ฐ„์„ ์ค„์ด๋Š” ํšจ์œจ์„ฑ์„ ์ž…์ฆํ–ˆ์Šต๋‹ˆ๋‹ค.