Model-Agnostic Meta-Learning for Fast Adaption of Deep Networks
Last updated
Last updated
MAML(Model-Agnostic Meta-Learning)μ ν¨ μ· λ¬λ λͺ¨λΈμ ν μ’ λ₯λ‘, μ μ μμλ§μΌλ‘λ λ¬Έμ λ₯Ό ν΄κ²°, μλ‘μ΄ μμ μ λν λΉ λ₯Έ μ μλ ₯μ μ±μ·¨νλ λ°©λ²μΌλ‘ μκ°λμμ΅λλ€. κΈ°μ‘΄μ κ²½μ¬ νκ°λ²κ³Ό νΈνλμ΄ κ°ν νμ΅, νκ·, λΆλ₯μ κ°μ μ ν΅μ μΈ λ¨Έμ λ¬λ λ¬Έμ μ νλκ² μ μ©ν μ μλ€κ³ ν©λλ€.
μΈκ°μ μ§λ₯μ ν μμλ₯Ό ν΅ν΄ ν¨ν΄μ μ νννμ¬ λ€λ₯Έ μν©μμλ μ μ¬ν μμ μ μνν μ μμ΅λλ€. μΈκ³΅μ§λ₯ μμ μ΄λ¬ν λ₯λ ₯μ κ°μΆμ΄μΌ νλ€λ μκ°μμ MAMLμ΄ μμλμμ΅λλ€. MAMLμ κΈ°μ‘΄ λ©ν νμ΅μ΄ μΆκ΅¬νλ ν¨μ μ΅μ νλ νμ΅μ¨μ λν κ°±μ λ²μ λν νμ΅κ³Όλ λ€λ₯Έ μ κ·Όλ²μ μ·¨ν©λλ€. νΉν, νμ΅μ¨μ΄λ μ΄λ§€κ°λ³μ μ΅μ νμ μ§μ μ μΈ μ°κ΄μ±μ κ°μ§ μλλ€λ μ μμ κ·Έλ¬ν©λλ€.
ν΄λΉ λ΄μ©μ μ΄ λ Όλ¬Έμ κΈ°λ°μΌλ‘ ν©λλ€.
μΌλ°μ μΈ ν¨ μ· νμ΅ κ΄μ μμ λ³Έλ€λ©΄ κ° μμ λΆν¬λ μν¬νΈ μΈνΈ, μ 체 λΆν¬λ 쿼리 μΈνΈλ‘ μκ°λ μ μμ΅λλ€.
λλκΈ° μ κΉμ§ λ€μμ λ°λ³΅νλ€.
μ¬κΈ°μ μ§μ 맀κ°λ³μμ λ©ν 맀κ°λ³μλ λͺ¨λ κ°μ λμμ λλ€. MAMLμ μ΄λ₯Ό κ°κ°μ κ΄μ μ μλ‘ λ€λ₯Έ κ°λ μΌλ‘ μ€λͺ νλ € ν©λλ€.
μ κ° μ§μ μμ±ν ꡬν μ½λλ₯Ό νμΈνμΈμ!
MAML μκ³ λ¦¬μ¦μ λ¬Έμ μν©μ μμ νκΈ° μν΄ μμ λ₯Ό λ€μκ³Ό κ°μ΄ μμνν©λλ€.
λ νμ°¨(episode length)λ‘ μκ°μ μμλ₯Ό μλ―Έν©λλ€.
λͺ¨λΈ λ κ΄μ°°κ° λ₯Ό μ λ ₯ λ°μ λ₯Ό μΆλ ₯ν©λλ€.
μ μμ€ν¨μμ λλ€. μ λΆν¬κ° λ°μλ©λλ€.
μ μ΄κΈ° κ΄μ°°κ°μ λλ€.
q(x_{t+1} | x_t, a_t)$λ $x_t$, $a_tλ , μ μ°κ΄λ μ μ΄λΆν¬(transition distribution)μ λλ€.
μμ μλ리μ€μμ λͺ¨λΈμ μ λν λΆν¬μ λν΄ μ μν¨μ λͺ©νλ‘ ν©λλ€. μ΄λ₯Ό μΌμ΄-μ· νλ μμν¬λ‘ μ€λͺ ν μ μμ΅λλ€: λͺ¨λΈ μ λ₯Ό μννλλ° μμ΄ λ§νΌμ νλ³Έ λ₯Ό μ¬μ©ν©λλ€. μ΄μ κ°μ λ°μ λ‘ λ₯Ό μνν μ μμ΄μΌ ν©λλ€.
MAMLμ ν 루νμ λ νλμ 루νλ₯Ό κ°μΈλ λ©μ»€λμ¦μ κ°μ§κ³ μμ΅λλ€. μ΄ μκ³ λ¦¬μ¦μ μ€λͺ νκΈ° μν΄ μ΄λ루ν, μμ°ν°λ£¨νμ μ§μ 맀κ°λ³μ , λ©ν 맀κ°λ³μ μ λν΄ μκ°ν΄λ³Ό μ μμ΅λλ€:
μꡬ μ¬ν: βμμ μ λν λΆν¬, , : μ΄-맀κ°λ³μμ λν λ°μκ΅ ν¬κΈ°
λ νμ΅μ¨, λ°μκ΅ ν¬κΈ°μ λλ€.
λ νμ΅μ¨, λ°μκ΅ ν¬κΈ°μ λλ€.
λ₯Ό 무μμλ‘ μμνλ€.
μ 무μ λν μν μ λ°°μΉνλ€.
λͺ¨λ μ λν΄ λ€μμ νλ€.
νλ³Έμ μ°κ΄λ μ νκ°ν΄ κ·ΈλΌλμΈνΈλ₯Ό 맀κ°λ³μμ λ°μνλ€:
λ‘ κ°±μ νλ€.
μ΄λ루ν(2)μμ κ° κ°λ³ μμ μ μ°κ΄λλ μ§μ 맀κ°λ³μ λ₯Ό κ°±μ ν©λλ€.
μμ°ν°λ£¨ν(4)λ μ΄λ루ν μ΄νμ μλν©λλ€. μμ κ°±μ λ 맀κ°λ³μλ₯Ό ν΅ν λͺ¨λ μμ μ μμ€μ μ΄ν©μ κ΄λ ¨νμ¬ λ©ν 맀κ°λ³μ λ₯Ό κ°±μ ν©λλ€.