π§ λμ μκ° / λΉν (My Thoughts / Critiques)
- RAG κ²μ νμ§μ κ·ΉλννκΈ° μν΄, μμ€ν
μ μ°μ° λΉμ©μ΄ νμ©νλ νλ λ΄μμ LLM κΈ°λ° μλ§¨ν± λ©νλ°μ΄ν°λ₯Ό μ²νΉμ ν΅ν©νλ κ²μ΄ ν¨κ³Όμ μ΄λ€.
λ
Όλ¬Έ 3μ€ μμ½ (Three-Line Summary)
- ν΅μ¬ μ μ: RAG μμ€ν
νκ° μ ν
μ€νΈμ λ©νλ°μ΄ν°(μκ°, ν ν½, κ°μ± λ±)λ₯Ό ν¨κ» κ³ λ €νλ μλ‘μ΄ QA λ²€μΉλ§ν¬ βAMAQAβ μ μ.
- μ£Όμ μ±κ³Ό: λ©νλ°μ΄ν°λ₯Ό λ¨μ ν
μ€νΈκ° μλ νν°λ‘ λͺ
μμ μΌλ‘ νμ©ν λ RAG μμ€ν
μ νλκ° 0.12μμ 0.61λ‘ ν¬κ² ν₯μλ¨μ μ
μ¦.
- μμ: λ©νλ°μ΄ν° κΈ°λ° κ²μ λ° μ¬μ λ ¬, λ°λ³΅μ 컨ν
μ€νΈ νμ₯ λ±μ ν΅ν΄ μ νλ 0.75λ₯Ό λ¬μ±, ν₯ν 컨ν
μ€νΈ μΈμ QA μμ€ν
μ°κ΅¬μ κΈ°λ° λ§λ ¨.
1. λͺ©ν (Goal)
- κΈ°μ‘΄ RAG (Retrieval-Augmented Generation) μμ€ν
λ²€μΉλ§ν¬κ° ν
μ€νΈ κΈ°λ° μ
λ ₯μλ§ μ€μ μ λκ³ λ©νλ°μ΄ν° ν΅ν©μ΄ λΆμ‘±ν νκ³ μ§μ .
- ν
μ€νΈμ λ©νλ°μ΄ν°(νμμ€ν¬ν, ν ν½, κ°μ± λ±)λ₯Ό κ²°ν©νμ¬ RAG μμ€ν
μ νκ°ν μ μλ μλ‘μ΄ μ€ν μ‘μΈμ€ QA λ°μ΄ν°μ
βAMAQAβ μ μ.
- λ©νλ°μ΄ν° νμ©μ΄ RAG μμ€ν
μ±λ₯μ λ―ΈμΉλ μν₯(RQ1) λ° λ¦¬νΈλ¦¬λ²/μμ±κΈ° κ΅¬μ± μμ κ°μ μ΄ μ 체 μ±λ₯μ ν₯μμν€λμ§(RQ2) νꡬ.
- μ¬μ΄λ² 보μ, μΈν
리μ μ€ λ± λμ©λ λ°μ΄ν°μ μ μν λΆμμ΄ νμν λΆμΌμμ λ©νλ°μ΄ν° κΈ°λ° QA μμ€ν
μ°κ΅¬ λ°μ μ μν κΈ°λ° μ 곡.
2. λ°μ΄ν° (Data)
- AMAQA λ°μ΄ν°μ
: 26κ° κ³΅κ° ν
λ κ·Έλ¨ κ·Έλ£Ήμμ μμ§ν μ½ 110λ§ κ°μ μμ΄ λ©μμ§λ‘ ꡬμ±.
- λ°μ΄ν° μμ§ κΈ°κ°: 2024λ
6μ 13μΌ ~ 8μ 13μΌ.
- νλΆν λ©νλ°μ΄ν° λ° λ μ΄λΈ:
- λ©νλ°μ΄ν°: νμμ€ν¬ν, μ±ν
κ·Έλ£Ήλͺ
λ±.
- μλ μμ± λ μ΄λΈ: 58κ° ν ν½ (GPT-4o, BERTTopic νμ©), 7κ°μ§ κ°μ (Ekman λͺ¨λΈ κΈ°λ°), λ
μ± μ§ν (Perspective API νμ©: λ
μ±, λͺ¨μ, μν λ±).
- QA νμ΄: μ λ¬Έκ°(μ΄λ
Έν
μ΄ν° λ° μ¬μ¬κ΄)μ 2λ¨κ³ μλ κ²μ¦μ κ±°μΉ 450κ°μ κ³ νμ§ QA νμ΄ ν¬ν¨.
- λ°μ΄ν° νΉμ±: λ¬μμ-μ°ν¬λΌμ΄λ κ°λ±, λ―Έκ΅ μ κ±° λ± μ§μ νμ μ£Όμ μ νΈμ€. βλΆλ
Έ(Anger)β κ°μ μ΄ λλλ¬μ§λ©° νΈν₯λ λ΄λ‘ λ°μ.
3. λͺ¨λΈ ꡬ쑰 (Model Architecture)
- λ³Έ λ
Όλ¬Έμ μλ‘μ΄ λ¨μΌ λͺ¨λΈμ μ μν기보λ€, AMAQA λ°μ΄ν°μ
μ νκ°νκΈ° μν μ¬λ¬ RAG μν€ν
μ²λ₯Ό λΉκ΅ λ° λΆμν¨.
- λ² μ΄μ€λΌμΈ λͺ¨λΈ:
- Vanilla RAG: λ©νλ°μ΄ν°λ₯Ό ν
μ€νΈμ μλ² λ©νμ¬ μ²λ¦¬.
- RAG with Metadata Filter: LLM(Query Creator)μ΄ μμ°μ΄ μ§λ¬Έμ ꡬ쑰νλ 쿼리(ν
μ€νΈ + λ©νλ°μ΄ν° νν°)λ‘ λ³ννμ¬ κ²μ.
- Re^2G: λ©νλ°μ΄ν° νν°λ§ RAG + κ²μ κ²°κ³Ό μ¬μ λ ¬(Reranker) λ¨κ³ μΆκ°.
- νκ°λ κ³ κΈ μ κ·Όλ²:
- Iter-Re^2G: Re^2G κΈ°λ°, βI donβt knowβ μλ΅ μ λ€μ top-n λ¬Έμλ‘ λ°λ³΅(μ¬λΌμ΄λ© μλμ°)νλ λ°λ³΅μ 컨ν
μ€νΈ νμ₯ μ μ©.
- Re^2G with Noise: Re^2Gμ 컨ν
μ€νΈμ μλμ μΌλ‘ κ΄λ ¨ μλ βλ
Έμ΄μ¦β λ¬Έμ μ£Όμ
.
- Iter-Re^2G with Noise: λ°λ³΅μ 컨ν
μ€νΈ νμ₯κ³Ό λ
Έμ΄μ¦ μ£Όμ
μ λ΅ κ²°ν©.
4. μ£Όμ μ±κ³Ό (Key Achievements)
- λ©νλ°μ΄ν° νν°λ§μ μ€μμ± μ
μ¦ (RQ1): λ©νλ°μ΄ν°λ₯Ό λ¨μ ν
μ€νΈλ‘ μλ² λ©ν Vanilla RAG(μ νλ 0.12) λλΉ, λ©νλ°μ΄ν° νν°λ§ μ μ© μ μ νλ 0.61λ‘ λν ν₯μ.
- 리νΈλ¦¬λ²/μμ±κΈ° μ΅μ ν (RQ2):
- μ¬μ λ ¬(Re^2G) λ¨κ³ λμ
μΌλ‘ βLost-in-the-Middleβ νμ μν, μ νλ 0.72λ‘ ν₯μ.
- λ°λ³΅μ 컨ν
μ€νΈ νμ₯(Iter-Re^2G) μ μ© μ μ νλ 0.75 λ¬μ±.
- μ΅κ³ μ±λ₯ λ¬μ±: Iter-Re^2G with Noise μν€ν
μ²(λ°λ³΅ + λ
Έμ΄μ¦ μ£Όμ
)κ° μ΅κ³ μ νλ(0.75) λ° NEM μ μ(0.54) κΈ°λ‘.
- λ©νλ°μ΄ν°λ₯Ό νμ©ν ꡬ쑰νλ 컨ν
μ€νΈκ° RAG μμ€ν
μ νλ ν₯μμ κ²°μ μ μμ μ€μ¦.
5. λ
Όλ¬Έμ κ²°λ‘ (Conclusion)
- λ©νλ°μ΄ν°λ₯Ό νμ©νλ RAG μμ€ν
νκ°λ₯Ό μν μ΅μ΄μ μ€ν μ‘μΈμ€ QA λ°μ΄ν°μ
βAMAQAβ λμ
.
- μ€νμ ν΅ν΄ λ©νλ°μ΄ν° νν°λ§μ΄ RAG μμ€ν
μ±λ₯μ (μ νλ 0.12 β 0.61) κ·Ήμ μΌλ‘ ν₯μμν΄μ μ
μ¦.
- μ¬μ λ ¬, λ°λ³΅μ 컨ν
μ€νΈ νμ₯, λ
Έμ΄μ¦ μ£Όμ
λ± κ³ κΈ μ λ΅μ ν΅ν΄ AMAQA λ²€μΉλ§ν¬μ SOTA μ±λ₯(μ νλ 0.75) λ¬μ±.
- ν₯ν μ°κ΅¬ λ°©ν₯μΌλ‘ μλ² λ© λ° μμ±κΈ° LLMμ νμΈνλ, λ²€μΉλ§ν¬μ μ§μμ μΈ μ μ§λ³΄μ λ° ν λλ©μΈ νμ₯ μ μ.