๐ง ๋์ ์๊ฐ / ๋นํ (My Thoughts / Critiques)
- 2024๋ ์ ๋์จ ๋ ผ๋ฌธ์ด๋ผ ๊ทธ๋ฐ์ง ์ง๊ธ์ ๋น์ฐํ ๋ด์ฉ์ธ ๋ด์ฉ ์์ฑ ๋ฐ ์ถ๋ก ์ โllm์ ์ฌ์ฉํ๋ค.โ ๋ฅผ ์ฃผ์ฅํจ
- ์ฐ๊ด๋ ๋ฌธ์ ์ฐพ๋๋ฐ ์๋ฒ ๋ฉ ๋ฐฉ์์ ํ์ฉํ ๋์กฐํ์ต ํ ์ถ์ฒ ๋ชจ๋ธ
- ์ฐ๊ด๋ ๋ฌธ์ ์ฐพ์ ๋ ๊ฒ์ ๋ฐ ์ถ์ฒ ๋ฐฉ์์ ํ์ฉ

-
ํต์ฌ ์ ์: ๋๊ท๋ชจ ์ธ์ด ๋ชจ๋ธ(LLM)์ ํ์ฉํ ์๋ก์ด item-to-item (I2I) ๋ ธํธ ์ถ์ฒ ํ๋ ์์ํฌ โNoteLLMโ ์ ์.
-
์ฃผ์ ์ฑ๊ณผ: ์จ๋ผ์ธ A/B ํ ์คํธ(Xiaohongshu)์์ ๊ธฐ์กด SentenceBERT ๊ธฐ๋ฐ ๋ชจ๋ธ ๋๋น ํด๋ฆญ๋ฅ (CTR) 16.20% ํฅ์ ๋ฌ์ฑ.
-
์์: ๋ ธํธ ์ถ์ฒ(GCL)๊ณผ ํด์ํ๊ทธ/์นดํ ๊ณ ๋ฆฌ ์์ฑ(CSFT)์ ๋ฉํฐํ์คํฌ ํ์ต์ ํตํด LLM์ ์๋ฒ ๋ฉ ํ์ง์ ํฅ์์ํจ I2I ์ถ์ฒ ์ฐ๊ตฌ.
1. ๋ชฉํ (Goal)
-
๊ธฐ์กด BERT ๊ธฐ๋ฐ ์ถ์ฒ ๋ชจ๋ธ์ด ๋ ธํธ์ ํต์ฌ ์ ๋ณด(ํด์ํ๊ทธ, ์นดํ ๊ณ ๋ฆฌ ๋ฑ)๋ฅผ ์ถฉ๋ถํ ํ์ฉํ์ง ๋ชปํ๋ ํ๊ณ ๊ทน๋ณต.
-
๋๊ท๋ชจ ์ธ์ด ๋ชจ๋ธ(LLM)์ I2I(Item-to-Item) ๋ ธํธ ์ถ์ฒ์ ํจ๊ณผ์ ์ผ๋ก ๋์ ํ๋ ํตํฉ ํ๋ ์์ํฌ โNoteLLMโ ๊ฐ๋ฐ.
-
๋ ธํธ ์ถ์ฒ ์์ (์๋ฒ ๋ฉ ์์ถ)๊ณผ ํด์ํ๊ทธ/์นดํ ๊ณ ๋ฆฌ ์์ฑ ์์ ์ **๋ฉํฐํ์คํฌ(Multi-task)**๋ก ๋์์ ํ์ต์์ผ, ๋ ธํธ ์๋ฒ ๋ฉ์ ํ์ง ํฅ์.
2. ๋ฐ์ดํฐ (Data)
-
**Xiaohongshu (์ค์คํ์)**์ ์ค์ ์ ์ ์์ฑ ๋ ธํธ ๋ฐ์ดํฐ์ ํ์ฉ.
-
ํ์ต ๋ฐ์ดํฐ: ๋ ธํธ 458,221๊ฐ, ๋ ธํธ ํ์ด 312,564๊ฐ.
-
ํ ์คํธ ๋ฐ์ดํฐ: ๋ ธํธ 257,937๊ฐ, ๋ ธํธ ํ์ด 27,999๊ฐ.
-
1์ฃผ๊ฐ์ ์ฌ์ฉ์ ํ๋ ๋ฐ์ดํฐ๋ฅผ ์์งํ์ฌ **๋ ธํธ ๊ฐ ๋์ ๋ฑ์ฅ ์ ์(co-occurrence score)**๋ฅผ ๊ณ์ฐ, ์ด๋ฅผ ๊ธฐ๋ฐ์ผ๋ก โ์ฐ๊ด ๋ ธํธ ํ์ดโ ๊ตฌ์ถ.
3. ๋ชจ๋ธ ๊ตฌ์กฐ (Model Architecture)
-
๊ธฐ๋ฐ ๋ชจ๋ธ: ์ฌ์ ํ์ต๋ LLM (LLAMA 2, 7B) ํ์ฉ.
-
์ฃผ์ ๊ตฌ์ฑ ์์:
-
Note Compression Prompt: ๋ ธํธ ์ ๋ณด๋ฅผ ์ ๋ ฅ๋ฐ์, ์ถ์ฒ์ ์ํ ๋จ์ผ ํน์ ํ ํฐ([EMB])์ผ๋ก ์์ถํ๊ณ ๋์์ ํด์ํ๊ทธ/์นดํ ๊ณ ๋ฆฌ ์์ฑ์ ์ง์ํ๋ ํตํฉ ํ๋กฌํํธ.
-
Generative-Contrastive Learning (GCL): [EMB] ํ ํฐ์ ์จ๊ฒจ์ง ์ํ(hidden state)๋ฅผ ๋ ธํธ ์๋ฒ ๋ฉ์ผ๋ก ์ฌ์ฉ. ์ฌ์ฉ์ ํ๋ ๊ธฐ๋ฐ โ์ฐ๊ด ๋ ธํธ ํ์ดโ๋ฅผ Positive๋ก, ๋ฐฐ์น ๋ด ๋ค๋ฅธ ๋ ธํธ๋ฅผ Negative๋ก ์ฌ์ฉํ์ฌ ๋์กฐ ํ์ต(Contrastive Learning) ์ํ (I2I ์ถ์ฒ ์์ ).
-
Collaborative Supervised Fine-tuning (CSFT): LLM์ ์์ฑ ๋ฅ๋ ฅ์ ํ์ฉํ์ฌ ๋ ธํธ์ ํด์ํ๊ทธ์ ์นดํ ๊ณ ๋ฆฌ๋ฅผ ์์ฑํ๋๋ก ์ง๋ ํ์ต(Supervised Fine-tuning) ์ํ (์์ฑ ์์ ).
-
-
์์ค ํจ์: GCL์ ๋์กฐ ํ์ต ์์ค()๊ณผ CSFT์ ์์ฑ ์์ค()์ ํ์ดํผํ๋ผ๋ฏธํฐ()๋ก ๊ฒฐํฉํ์ฌ ์ ์ฒด ์์ค ๊ณ์ฐ.
4. ์ฃผ์ ์ฑ๊ณผ (Key Achievements)
-
์คํ๋ผ์ธ ํ๊ฐ: SentenceBERT, RepLLAMA ๋ฑ ๊ธฐ์กด ํ ์คํธ ๊ธฐ๋ฐ I2I ์ถ์ฒ ๋ชจ๋ธ ๋๋น ๋ชจ๋ Recall@k ์งํ์์ ์ต๊ณ ์ฑ๋ฅ(SOTA) ๋ฌ์ฑ (Avg. 94.66%).
-
์จ๋ผ์ธ A/B ํ ์คํธ (Xiaohongshu ๋ฐฐํฌ):
-
๊ธฐ์กด SentenceBERT ์จ๋ผ์ธ ๋ชจ๋ธ ๋๋น ํด๋ฆญ๋ฅ (CTR) 16.20% ์ฆ๊ฐ.
-
๋๊ธ ์ 1.10% ์ฆ๊ฐ, ์ฃผ๊ฐ ๊ฒ์์ ์(WAP) 0.41% ์ฆ๊ฐ.
-
์ ๊ท ๋ ธํธ(์ฝ๋ ์คํํธ)์ ๋ํ ๋๊ธ ์ 3.58% ์ฆ๊ฐ, LLM์ ์ฐ์ํ ์ผ๋ฐํ ์ฑ๋ฅ ์ ์ฆ.
-
-
์ด๋ธ๋ ์ด์ ์คํฐ๋:
-
CSFT(์์ฑ) ๋ชจ๋ ์ ๊ฑฐ ์ ์ถ์ฒ ์ฑ๋ฅ ํ๋ฝ, ์์ฑ ์์ ์ด ์๋ฒ ๋ฉ ํ์ง ํฅ์์ ๊ธฐ์ฌํจ์ ์ฆ๋ช .
-
GCL(์ถ์ฒ) ๋ชจ๋ ์ ๊ฑฐ ์ ์ถ์ฒ ์ฑ๋ฅ ํฌ๊ฒ ํ๋ฝ, ๋์กฐ ํ์ต์ ์ค์์ฑ ํ์ธ.
-
5. ๋ ผ๋ฌธ์ ๊ฒฐ๋ก (Conclusion)
-
I2I ๋ ธํธ ์ถ์ฒ์ ์ํ ์๋ก์ด ๊ฒ์ ๊ฐ๋ฅ LLM ํ๋ ์์ํฌ โNoteLLMโ ์ ์.
-
Note Compression Prompt, GCL, CSFT ์ธ ๊ฐ์ง ์์๋ฅผ ํตํด LLM์ ์ถ์ฒ ์์คํ ์ ํจ๊ณผ์ ์ผ๋ก ํตํฉ.
-
GCL์ **ํ์ ์ ํธ(collaborative signals)**๋ฅผ ํ์ตํ๊ณ , CSFT๋ ๋ ธํธ ์์ฝ ๋ฐ ์์ฑ์ ํตํด ์๋ฒ ๋ฉ์ ๊ฐํํ๋ ์ํธ ๋ณด์์ ์ญํ ์ํ.
-
์ค์ ๋๊ท๋ชจ ์๋น์ค(Xiaohongshu) ํ๊ฒฝ์์์ ์คํ์ ํตํด ์ ์ ๋ชจ๋ธ์ ํจ๊ณผ์ฑ๊ณผ ์ค์ฉ์ฑ์ ์ ์ฆ.