๐Ÿง ๋‚˜์˜ ์ƒ๊ฐ / ๋น„ํŒ (My Thoughts / Critiques)

  • 2024๋…„์— ๋‚˜์˜จ ๋…ผ๋ฌธ์ด๋ผ ๊ทธ๋Ÿฐ์ง€ ์ง€๊ธˆ์€ ๋‹น์—ฐํ•œ ๋‚ด์šฉ์ธ ๋‚ด์šฉ ์ƒ์„ฑ ๋ฐ ์ถ”๋ก ์— โ€œllm์„ ์‚ฌ์šฉํ•œ๋‹ค.โ€ ๋ฅผ ์ฃผ์žฅํ•จ
  • ์—ฐ๊ด€๋œ ๋ฌธ์„œ ์ฐพ๋Š”๋ฐ ์ž„๋ฒ ๋”ฉ ๋ฐฉ์‹์„ ํ™œ์šฉํ•œ ๋Œ€์กฐํ•™์Šต ํ›„ ์ถ”์ฒœ ๋ชจ๋ธ
  • ์—ฐ๊ด€๋œ ๋ฌธ์„œ ์ฐพ์„ ๋•Œ ๊ฒ€์ƒ‰ ๋ฐ ์ถ”์ฒœ ๋ฐฉ์‹์„ ํ™œ์šฉ

  • ํ•ต์‹ฌ ์ œ์•ˆ: ๋Œ€๊ทœ๋ชจ ์–ธ์–ด ๋ชจ๋ธ(LLM)์„ ํ™œ์šฉํ•œ ์ƒˆ๋กœ์šด item-to-item (I2I) ๋…ธํŠธ ์ถ”์ฒœ ํ”„๋ ˆ์ž„์›Œํฌ โ€˜NoteLLMโ€™ ์ œ์•ˆ.

  • ์ฃผ์š” ์„ฑ๊ณผ: ์˜จ๋ผ์ธ A/B ํ…Œ์ŠคํŠธ(Xiaohongshu)์—์„œ ๊ธฐ์กด SentenceBERT ๊ธฐ๋ฐ˜ ๋ชจ๋ธ ๋Œ€๋น„ ํด๋ฆญ๋ฅ (CTR) 16.20% ํ–ฅ์ƒ ๋‹ฌ์„ฑ.

  • ์˜์˜: ๋…ธํŠธ ์ถ”์ฒœ(GCL)๊ณผ ํ•ด์‹œํƒœ๊ทธ/์นดํ…Œ๊ณ ๋ฆฌ ์ƒ์„ฑ(CSFT)์˜ ๋ฉ€ํ‹ฐํƒœ์Šคํฌ ํ•™์Šต์„ ํ†ตํ•ด LLM์˜ ์ž„๋ฒ ๋”ฉ ํ’ˆ์งˆ์„ ํ–ฅ์ƒ์‹œํ‚จ I2I ์ถ”์ฒœ ์—ฐ๊ตฌ.


1. ๋ชฉํ‘œ (Goal)

  • ๊ธฐ์กด BERT ๊ธฐ๋ฐ˜ ์ถ”์ฒœ ๋ชจ๋ธ์ด ๋…ธํŠธ์˜ ํ•ต์‹ฌ ์ •๋ณด(ํ•ด์‹œํƒœ๊ทธ, ์นดํ…Œ๊ณ ๋ฆฌ ๋“ฑ)๋ฅผ ์ถฉ๋ถ„ํžˆ ํ™œ์šฉํ•˜์ง€ ๋ชปํ•˜๋Š” ํ•œ๊ณ„ ๊ทน๋ณต.

  • ๋Œ€๊ทœ๋ชจ ์–ธ์–ด ๋ชจ๋ธ(LLM)์„ I2I(Item-to-Item) ๋…ธํŠธ ์ถ”์ฒœ์— ํšจ๊ณผ์ ์œผ๋กœ ๋„์ž…ํ•˜๋Š” ํ†ตํ•ฉ ํ”„๋ ˆ์ž„์›Œํฌ โ€˜NoteLLMโ€™ ๊ฐœ๋ฐœ.

  • ๋…ธํŠธ ์ถ”์ฒœ ์ž‘์—…(์ž„๋ฒ ๋”ฉ ์••์ถ•)๊ณผ ํ•ด์‹œํƒœ๊ทธ/์นดํ…Œ๊ณ ๋ฆฌ ์ƒ์„ฑ ์ž‘์—…์„ **๋ฉ€ํ‹ฐํƒœ์Šคํฌ(Multi-task)**๋กœ ๋™์‹œ์— ํ•™์Šต์‹œ์ผœ, ๋…ธํŠธ ์ž„๋ฒ ๋”ฉ์˜ ํ’ˆ์งˆ ํ–ฅ์ƒ.

2. ๋ฐ์ดํ„ฐ (Data)

  • **Xiaohongshu (์ƒค์˜คํ™์Šˆ)**์˜ ์‹ค์ œ ์œ ์ € ์ƒ์„ฑ ๋…ธํŠธ ๋ฐ์ดํ„ฐ์…‹ ํ™œ์šฉ.

  • ํ•™์Šต ๋ฐ์ดํ„ฐ: ๋…ธํŠธ 458,221๊ฐœ, ๋…ธํŠธ ํŽ˜์–ด 312,564๊ฐœ.

  • ํ…Œ์ŠคํŠธ ๋ฐ์ดํ„ฐ: ๋…ธํŠธ 257,937๊ฐœ, ๋…ธํŠธ ํŽ˜์–ด 27,999๊ฐœ.

  • 1์ฃผ๊ฐ„์˜ ์‚ฌ์šฉ์ž ํ–‰๋™ ๋ฐ์ดํ„ฐ๋ฅผ ์ˆ˜์ง‘ํ•˜์—ฌ **๋…ธํŠธ ๊ฐ„ ๋™์‹œ ๋“ฑ์žฅ ์ ์ˆ˜(co-occurrence score)**๋ฅผ ๊ณ„์‚ฐ, ์ด๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ โ€˜์—ฐ๊ด€ ๋…ธํŠธ ํŽ˜์–ดโ€™ ๊ตฌ์ถ•.

3. ๋ชจ๋ธ ๊ตฌ์กฐ (Model Architecture)

  • ๊ธฐ๋ฐ˜ ๋ชจ๋ธ: ์‚ฌ์ „ ํ•™์Šต๋œ LLM (LLAMA 2, 7B) ํ™œ์šฉ.

  • ์ฃผ์š” ๊ตฌ์„ฑ ์š”์†Œ:

    1. Note Compression Prompt: ๋…ธํŠธ ์ •๋ณด๋ฅผ ์ž…๋ ฅ๋ฐ›์•„, ์ถ”์ฒœ์„ ์œ„ํ•œ ๋‹จ์ผ ํŠน์ˆ˜ ํ† ํฐ([EMB])์œผ๋กœ ์••์ถ•ํ•˜๊ณ  ๋™์‹œ์— ํ•ด์‹œํƒœ๊ทธ/์นดํ…Œ๊ณ ๋ฆฌ ์ƒ์„ฑ์„ ์ง€์‹œํ•˜๋Š” ํ†ตํ•ฉ ํ”„๋กฌํ”„ํŠธ.

    2. Generative-Contrastive Learning (GCL): [EMB] ํ† ํฐ์˜ ์ˆจ๊ฒจ์ง„ ์ƒํƒœ(hidden state)๋ฅผ ๋…ธํŠธ ์ž„๋ฒ ๋”ฉ์œผ๋กœ ์‚ฌ์šฉ. ์‚ฌ์šฉ์ž ํ–‰๋™ ๊ธฐ๋ฐ˜ โ€˜์—ฐ๊ด€ ๋…ธํŠธ ํŽ˜์–ดโ€™๋ฅผ Positive๋กœ, ๋ฐฐ์น˜ ๋‚ด ๋‹ค๋ฅธ ๋…ธํŠธ๋ฅผ Negative๋กœ ์‚ฌ์šฉํ•˜์—ฌ ๋Œ€์กฐ ํ•™์Šต(Contrastive Learning) ์ˆ˜ํ–‰ (I2I ์ถ”์ฒœ ์ž‘์—…).

    3. Collaborative Supervised Fine-tuning (CSFT): LLM์˜ ์ƒ์„ฑ ๋Šฅ๋ ฅ์„ ํ™œ์šฉํ•˜์—ฌ ๋…ธํŠธ์˜ ํ•ด์‹œํƒœ๊ทธ์™€ ์นดํ…Œ๊ณ ๋ฆฌ๋ฅผ ์ƒ์„ฑํ•˜๋„๋ก ์ง€๋„ ํ•™์Šต(Supervised Fine-tuning) ์ˆ˜ํ–‰ (์ƒ์„ฑ ์ž‘์—…).

  • ์†์‹ค ํ•จ์ˆ˜: GCL์˜ ๋Œ€์กฐ ํ•™์Šต ์†์‹ค()๊ณผ CSFT์˜ ์ƒ์„ฑ ์†์‹ค()์„ ํ•˜์ดํผํŒŒ๋ผ๋ฏธํ„ฐ()๋กœ ๊ฒฐํ•ฉํ•˜์—ฌ ์ „์ฒด ์†์‹ค ๊ณ„์‚ฐ.

4. ์ฃผ์š” ์„ฑ๊ณผ (Key Achievements)

  • ์˜คํ”„๋ผ์ธ ํ‰๊ฐ€: SentenceBERT, RepLLAMA ๋“ฑ ๊ธฐ์กด ํ…์ŠคํŠธ ๊ธฐ๋ฐ˜ I2I ์ถ”์ฒœ ๋ชจ๋ธ ๋Œ€๋น„ ๋ชจ๋“  Recall@k ์ง€ํ‘œ์—์„œ ์ตœ๊ณ  ์„ฑ๋Šฅ(SOTA) ๋‹ฌ์„ฑ (Avg. 94.66%).

  • ์˜จ๋ผ์ธ A/B ํ…Œ์ŠคํŠธ (Xiaohongshu ๋ฐฐํฌ):

    • ๊ธฐ์กด SentenceBERT ์˜จ๋ผ์ธ ๋ชจ๋ธ ๋Œ€๋น„ ํด๋ฆญ๋ฅ (CTR) 16.20% ์ฆ๊ฐ€.

    • ๋Œ“๊ธ€ ์ˆ˜ 1.10% ์ฆ๊ฐ€, ์ฃผ๊ฐ„ ๊ฒŒ์‹œ์ž ์ˆ˜(WAP) 0.41% ์ฆ๊ฐ€.

    • ์‹ ๊ทœ ๋…ธํŠธ(์ฝœ๋“œ ์Šคํƒ€ํŠธ)์— ๋Œ€ํ•œ ๋Œ“๊ธ€ ์ˆ˜ 3.58% ์ฆ๊ฐ€, LLM์˜ ์šฐ์ˆ˜ํ•œ ์ผ๋ฐ˜ํ™” ์„ฑ๋Šฅ ์ž…์ฆ.

  • ์–ด๋ธ”๋ ˆ์ด์…˜ ์Šคํ„ฐ๋””:

    • CSFT(์ƒ์„ฑ) ๋ชจ๋“ˆ ์ œ๊ฑฐ ์‹œ ์ถ”์ฒœ ์„ฑ๋Šฅ ํ•˜๋ฝ, ์ƒ์„ฑ ์ž‘์—…์ด ์ž„๋ฒ ๋”ฉ ํ’ˆ์งˆ ํ–ฅ์ƒ์— ๊ธฐ์—ฌํ•จ์„ ์ฆ๋ช….

    • GCL(์ถ”์ฒœ) ๋ชจ๋“ˆ ์ œ๊ฑฐ ์‹œ ์ถ”์ฒœ ์„ฑ๋Šฅ ํฌ๊ฒŒ ํ•˜๋ฝ, ๋Œ€์กฐ ํ•™์Šต์˜ ์ค‘์š”์„ฑ ํ™•์ธ.

5. ๋…ผ๋ฌธ์˜ ๊ฒฐ๋ก  (Conclusion)

  • I2I ๋…ธํŠธ ์ถ”์ฒœ์„ ์œ„ํ•œ ์ƒˆ๋กœ์šด ๊ฒ€์ƒ‰ ๊ฐ€๋Šฅ LLM ํ”„๋ ˆ์ž„์›Œํฌ โ€˜NoteLLMโ€™ ์ œ์•ˆ.

  • Note Compression Prompt, GCL, CSFT ์„ธ ๊ฐ€์ง€ ์š”์†Œ๋ฅผ ํ†ตํ•ด LLM์„ ์ถ”์ฒœ ์‹œ์Šคํ…œ์— ํšจ๊ณผ์ ์œผ๋กœ ํ†ตํ•ฉ.

  • GCL์€ **ํ˜‘์—… ์‹ ํ˜ธ(collaborative signals)**๋ฅผ ํ•™์Šตํ•˜๊ณ , CSFT๋Š” ๋…ธํŠธ ์š”์•ฝ ๋ฐ ์ƒ์„ฑ์„ ํ†ตํ•ด ์ž„๋ฒ ๋”ฉ์„ ๊ฐ•ํ™”ํ•˜๋Š” ์ƒํ˜ธ ๋ณด์™„์  ์—ญํ•  ์ˆ˜ํ–‰.

  • ์‹ค์ œ ๋Œ€๊ทœ๋ชจ ์„œ๋น„์Šค(Xiaohongshu) ํ™˜๊ฒฝ์—์„œ์˜ ์‹คํ—˜์„ ํ†ตํ•ด ์ œ์•ˆ ๋ชจ๋ธ์˜ ํšจ๊ณผ์„ฑ๊ณผ ์‹ค์šฉ์„ฑ์„ ์ž…์ฆ.