π§ λμ μκ° / λΉν (My Thoughts / Critiques)
- κ²°λ‘ μ μΌλ‘ μμ΄μ νΈκ° νλ νλμ μμ μ€ν κ°λ₯ν νμ΄μ¬ μ½λλ‘ λ°κΎΌ κ²
- λ§μ°ν λΉμ°νκ² μκ°νλ βμμ΄μ νΈμκ² μ€μ μ¬μ©ν μ μλ λꡬλ₯Ό 쀬λλ μ νλλΌβ λΌλ λ Όλ¬Έμ΄λ€.
ν΅μ¬μ 리
-
βCodeActβ νλ μμν¬ μ μ
-
λͺ©μ : κΈ°μ‘΄ LLM μμ΄μ νΈκ° μ¬μ©νλ ν μ€νΈ/JSON νλ λ°©μμ νκ³λ₯Ό 극볡νλ κ².
-
ν΅μ¬: LLM μμ΄μ νΈμ νλ(Action)μ μ€ν κ°λ₯ν νμ΄μ¬ μ½λλ‘ ν΅ν©ν¨.
-
-
CodeActμ μ£Όμ κΈ°λ₯ λ° μ₯μ
-
λ°©λν νμ΄μ¬ λΌμ΄λΈλ¬λ¦¬ μνκ³λ₯Ό μ§μ νμ©νμ¬ νλ 곡κ°μ νμ₯ν¨.
-
λ°λ³΅λ¬Έ, 쑰건문 λ± μ½λμ μ μ΄ νλ¦μ μ΄μ©ν΄ 볡μ‘ν μμ μ ν¨μ¨μ μΌλ‘ μνν¨.
-
μ½λ μ€ν μ λ°μνλ μλ¬ λ©μμ§λ₯Ό νΌλλ°±μΌλ‘ μΌμ μ€μ€λ‘ λ¬Έμ λ₯Ό ν΄κ²°(Self-Debugging)ν¨.
-
-
μ€ν κ²°κ³Ό λ° μμ
-
κΈ°μ‘΄ λ°©μ λλΉ μμ μ±κ³΅λ₯ (μ΅λ 20%p) λ° ν¨μ¨μ±(μ΅λ 30% λ μ μ μνΈμμ©)μ ν¬κ² ν₯μμμΌ°μ.
-
κ²°λ‘ μ μΌλ‘, λ μ λ₯νκ³ μμ¨μ μΈ AI μμ΄μ νΈ κ΅¬μΆμ λ§€μ° ν¨κ³Όμ μΈ λ°©λ²μμ μ μ¦ν¨.
-

1. κ΄μ°° (Observation)
- μμμ : μ¬μ©μμ μ΅μ΄ μ§λ¬Έ(
"μ΄ λ¬Έμ νμ΄μ€")μ΄λ, μμ΄μ νΈκ° μ΄μ μ μ€ννλ μ½λμ κ²°κ³Ό λλ μλ¬ λ©μμ§κ° μ λ ₯μΌλ‘ λ€μ΄μ΅λλ€.
2. μκ° (Think)
- κ³ν μ립: μμ΄μ νΈλ βκ΄μ°°βλ μ 보λ₯Ό λ³΄κ³ λ€μ νλμ κ³νν©λλ€. (
"μ΄ λ¬Έμ λ₯Ό νλ €λ©΄ μ΄ μ½λλ₯Ό μ¨μΌκ² λ€.")
3. νλ (Action)
- μ½λ μμ±: κ³νμ λ°λΌ μ€ν κ°λ₯ν νμ΄μ¬ μ½λλ₯Ό μμ±ν©λλ€. μ΄κ²μ΄ μμ΄μ νΈμ μ μΌν νλμ λλ€.
4. κ²°κ³Ό (Outcome) β‘οΈ μλ‘μ΄ κ΄μ°°
- μ½λ μ€ν: μμ±λ μ½λκ° μ€νλκ³ , κ·Έ κ²°κ³Ό(Outcome)κ° λ€μ 1λ²μ μλ‘μ΄ βκ΄μ°°βμ΄ λμ΄ μμ΄μ νΈμκ² λμκ°λλ€.
1. λͺ©ν (Goal)
μ΄ μ°κ΅¬μ μ£Όλ λͺ©νλ λκ·λͺ¨ μΈμ΄ λͺ¨λΈ(LLM) κΈ°λ° μμ΄μ νΈκ° μμ μ μννλ κΈ°μ‘΄ λ°©μ(ν μ€νΈ, JSON)μ κ·Όλ³Έμ μΈ νκ³λ₯Ό 극볡νλ μλ‘μ΄ νλ μμν¬ βCodeActβ λ₯Ό μ μνκ³ κ·Έ μ°μμ±μ μ μ¦νλ κ²μ λλ€.
μ°κ΅¬νμ LLM μμ΄μ νΈμ νλ(Action)μ μ€ν κ°λ₯ν νμ΄μ¬ μ½λλ‘ ν΅ν©ν¨μΌλ‘μ¨, μ νλ λꡬ μ¬μ©κ³Ό κ²½μ§λ μνΈμμ© λ°©μμμ λ²μ΄λ, ν¨μ¬ λ μ μ°νκ³ κ°λ ₯νλ©° ν΅μΌλ νλ 곡κ°μ μ 곡νκ³ μ νμ΅λλ€. μ΄λ₯Ό ν΅ν΄ LLMμ΄ λ³΅μ‘ν μ€μ λ¬Έμ λ₯Ό λ ν¨μ¨μ μΌλ‘ ν΄κ²°ν μ μλ λ₯λ ₯μ λμ΄λ΄λ κ²μ΄ ν΅μ¬μ λλ€.
2. λ°©λ²λ‘ λ° ν΅μ¬ μμ΄λμ΄ (CodeAct)
μ΄ λ Όλ¬Έμ ν΅μ¬ μμ΄λμ΄λ LLM μμ΄μ νΈμ νλμ νμ΄μ¬ μ½λλ‘ μ μνλCodeAct νλ μμν¬μ λλ€. μ΄ μ κ·Όλ²μ λ€μκ³Ό κ°μ λλ ·ν μ₯μ μ κ°μ§λλ€.
-
ν΅ν©λκ³ νμ₯λ νλ 곡κ°: μ¬μ μ μλ λͺ κ°μ λꡬμ μ½λ§€μ΄μ§ μκ³ , Pandas, Scikit-Learn λ± λ°©λν νμ΄μ¬ λΌμ΄λΈλ¬λ¦¬ μνκ³ μ 체λ₯Ό μ¦μ λκ΅¬λ‘ νμ©ν μ μμ΅λλ€. μ΄λ μμ΄μ νΈμ λ¬Έμ ν΄κ²° λ₯λ ₯μ λΉμ½μ μΌλ‘ νμ₯μν΅λλ€.
-
ν¨μ¨μ μΈ λ³΅ν© μ°μ°: μ½λλ λ³μ(λ°μ΄ν° νλ¦)μ λ°λ³΅λ¬Έ/쑰건문(μ μ΄ νλ¦)μ κΈ°λ³Έμ μΌλ‘ μ§μν©λλ€. λλΆμ μ¬λ¬ κ΅κ°μ νμ¨μ κ³μ°νλ κ²κ³Ό κ°μ 볡μ‘ν μμ μ λ¨ νλμ μ½λ λΈλ‘(Action)μΌλ‘ μ²λ¦¬ν μ μμ΄, κΈ°μ‘΄ λ°©μλ³΄λ€ μνΈμμ© νμλ₯Ό ν¬κ² μ€μ¬ ν¨μ¨μ±μ λμ λλ€.
-
μμ¨μ μκ°-λλ²κΉ (Self-Debugging): μ½λ μ€ν μ€ μ€λ₯κ° λ°μνλ©΄, νμ΄μ¬ μΈν°ν리ν°κ° μ 곡νλ μμΈν μλ¬ λ©μμ§λ₯Ό νΌλλ°±μΌλ‘ λ°μ΅λλ€. μμ΄μ νΈλ μ΄ νΌλλ°±μ λΆμνμ¬ μ€μ€λ‘ μ½λλ₯Ό μμ νκ³ λ¬Έμ λ₯Ό ν΄κ²°ν΄ λκ° μ μμ΄, λ¬Έμ ν΄κ²°μ κ²¬κ³ ν¨μ΄ ν¬κ² ν₯μλ©λλ€.
-
μ¬μ νλ ¨ μ§μμ κ·Ήλν: LLMμ μ΄λ―Έ λ°©λν μ½λ λ°μ΄ν°λ‘ νλ ¨λμ΄ νλ‘κ·Έλλ° μΈμ΄μ λ§€μ° μ΅μν©λλ€. λ°λΌμ μ½λλ₯Ό νλμΌλ‘ μ¬μ©νλ κ²μ LLMμ΄ κ°μ§ μ μ¬λ ₯μ κ°μ₯ μμ°μ€λ½κ³ λΉμ© ν¨μ¨μ μΌλ‘ λμ΄λ΄λ λ°©λ²μ λλ€.
3. μ€ν λ° κ²μ¦
μ°κ΅¬νμ CodeActμ ν¨κ³Όλ₯Ό μ μ¦νκΈ° μν΄ 17κ°μ λ€μν LLMμ λμμΌλ‘ ν μ€νΈ, JSON λ°©μκ³Ό μ§μ λΉκ΅νλ κ΄λ²μν μ€νμ μ§ννμ΅λλ€.
-
λ²€μΉλ§ν¬:
-
API-Bank: κ°λ¨ν λ¨μΌ λꡬ νΈμΆ μ±λ₯μ μΈ‘μ νμ¬ κ° νμμ λν LLMμ κΈ°λ³Έμ μΈ μΉμλλ₯Ό νκ°νμ΅λλ€.
-
MΒ³ToolEval (μ체 μ μ): μ¬λ¬ λꡬλ₯Ό μ‘°ν©νκ³ μ¬λ¬ ν΄μ μνΈμμ©μ΄ νμν 볡μ‘ν μμ μ νκ°νκΈ° μν΄ μλ‘κ² κ΅¬μΆν λ²€μΉλ§ν¬μ λλ€.
-
-
CodeActAgent κ°λ°: μ€νμμ€ λͺ¨λΈμ CodeAct λ₯λ ₯μ κ°ννκΈ° μν΄, 7μ²μ¬ κ°μ κ³ νμ§ μ½λ κΈ°λ° μνΈμμ© λ°μ΄ν°μ μΈ CodeActInstructλ₯Ό ꡬμΆνμ΅λλ€. μ΄λ₯Ό νμ©ν΄ Llama-2μ Mistral λͺ¨λΈμ λ―ΈμΈμ‘°μ (fine-tuning)νμ¬ CodeActAgentλΌλ νΉν μμ΄μ νΈλ₯Ό κ°λ°νμ΅λλ€.
4. μ£Όμ μ±κ³Ό λ° κ²°κ³Ό
-
볡μ‘ν μμ μμμ μλμ μ±λ₯: λ³΅ν© λ¬Έμ ν΄κ²° λ₯λ ₯μ νκ°νλ MΒ³ToolEvalμμ CodeActλ λ€λ₯Έ λ°©μ λλΉ μ΅λ 20% λ λμ μ±κ³΅λ₯ μ λ¬μ±νμΌλ©°, λ¬Έμ λ₯Ό ν΄κ²°νλ λ° νμν μνΈμμ© νμλ μ΅λ 30% λ μ μμ΅λλ€. μ΄λ CodeActκ° ν¨μ¬ λ ν¨μ¨μ μ΄κ³ κ°λ ₯νλ€λ κ²μ λͺ νν 보μ¬μ€λλ€.
-
κ³ μ±λ₯ μ€νμμ€ μμ΄μ νΈ κ³΅κ°: λ―ΈμΈμ‘°μ λ CodeActAgent (Mistral κΈ°λ°)λ λΉμ·ν ν¬κΈ°μ λ€λ₯Έ μ€νμμ€ λͺ¨λΈλ€μ λ₯κ°νμΌλ©°, μ¬μ§μ΄ ν¨μ¬ ν° 70B λͺ¨λΈκ³Ό λλ±ν μ±λ₯μ 보μμ΅λλ€. μ΄λ νΉνλ λ°μ΄ν°μ μ ν΅ν νλ ¨μ΄ λ§€μ° ν¨κ³Όμ μμ μ¦λͺ ν©λλ€.
-
μμ¨μ λ¬Έμ ν΄κ²° λ₯λ ₯ μ μ¦: CodeActAgentκ° λ³λμ μμ μμ΄λ μ€μ€λ‘ λ°μ΄ν°λ₯Ό λ€μ΄λ‘λνμ¬ λ¨Έμ λ¬λ λͺ¨λΈμ νλ ¨νκ³ , κ²°κ³Όλ₯Ό μκ°ννλ©°, κ·Έ κ³Όμ μμ λ°μνλ μ€λ₯λ₯Ό μμ¨μ μΌλ‘ λλ²κΉ νλ 볡ν©μ μΈ μμ μ μ±κ³΅μ μΌλ‘ μνν¨μ 보μ¬μ£Όμμ΅λλ€. μ΄λ λ μμ¨μ μ΄κ³ μ λ₯ν AI μμ΄μ νΈμ μ€ν κ°λ₯μ±μ μ μν©λλ€.