Overview on Meta Learning
Last updated
Last updated
λ©ννμ΅(meta learning)μ νμ΅ κ³Όμ μ체λ₯Ό ν₯μμν€κΈ° μν μκ³ λ¦¬μ¦μ λν μ°κ΅¬μ λλ€. μ΄λ₯Ό ν΅ν΄ μ κ²½λ§μ μλ‘μ΄ μμ μ ν¨κ³Όμ μΌλ‘ νμ΅ν©λλ€. λ λΉ λ₯΄κ² λ³ννλ νκ²½μμ λͺ¨λΈμ μ΅μ ννλλ° νΉν μ μ©ν©λλ€. λ€μμ λ©ννμ΅μ μ£Όμν λΆμΌλ€μ λλ€:
λͺ¨λΈ κΈ°λ° λ©ν νμ΅(model-based meta learning)μ μ΄μ κ²½νμ μ μ₯νκΈ° μν΄ νμ₯λ λ©λͺ¨λ¦¬λ₯Ό κ°μ§ μ κ²½λ§μ΄λ μν μ κ²½λ§μ μ¬μ©ν©λλ€.
λ©νΈλ¦ κΈ°λ° λ©ν νμ΅(metric-based meta learning)μ μ μ¬μ±μ΄λ 거리 μΈ‘μ μ νμ©νμ¬ μλ‘μ΄ μμ μ λν λΉ λ₯Έ νμ΅μ μ΄μ§ν©λλ€.
μ΅μ ν κΈ°λ° λ©ν νμ΅(optimization-based meta learning)μ μ΅μ ν μκ³ λ¦¬μ¦μ νμ΅ν¨μΌλ‘μ¨ μλ‘μ΄ μμ μ λν νμ΅ ν¨μ¨μ±μ ν₯μμν΅λλ€.
TAML(Task-Agnostic Meta Learning)μ νΉμ μ 무 λΆν¬μ κ΄λ ¨λ νμ΅ μ λ΅μ κ·μ νλ λ° μ΄μ μ λ§μΆ₯λλ€. μ΄λ₯Ό ν΅ν΄ λ€μν μ 무λ₯Ό ν¨κ³Όμ μΌλ‘ λ²μ£Όνν μ μμ΅λλ€.
λ©ννμ΅ μκ³ λ¦¬μ¦μ λ κ°μ νμ μκ³ λ¦¬μ¦(λλ 루ν)λ₯Ό μ°κ΄νμ¬ νμ©νλ κ΅¬μ‘°λ‘ μ΄λ£¨μ΄μ Έ μλ κ²½μ°κ°λ§μ΅λλ€. μ΄λ₯Ό κ°κ°μ λ¨κ³λ‘ μκ°ν μμ μ λ¨κ³λ³ νμ΅(learning level)λΌ ν©λλ€.
λ©ν λ¨κ³ νμ΅(meta-level learning)μ κ³ μ°¨μμ νμ΅ κ³Όμ μΌλ‘ μ¬λ¬ μμ μμ 곡ν΅μ μ νμ νκ³ λ¬Έμ ν΄κ²° λ°©λ² κ·Έ μ체λ₯Ό νμ΅ν©λλ€. μΌλ°νλ νμ΅ μ λ΅μ κ°λ°νκ±°λ μλ‘μ΄ κ³Όμ λ νκ²½μ λΉ λ₯΄κ² μ μνλ λ₯λ ₯μ ν€μλλ€.
κΈ°λ³Έ λ¨κ³ νμ΅(base-level learning)μ μΌλ°μ μΈ κΈ°κ³ νμ΅κ³Ό μ μ¬νκ² μ§νλ©λλ€. μμ λλ λ¬Έμ ν΄κ²°μ μν νμ΅μ μ€μ μ λ‘λλ€. μ΄λ―Έμ§ λΆλ₯λ μμ°μ΄ μ²λ¦¬μ κ°μ ꡬ체μ μΈ κ³Όμ λ₯Ό μν νμ΅ μκ³ λ¦¬μ¦μ΄ μ΄μ ν΄λΉν©λλ€.
λ©ννμ΅μμ ν λ°μ΄ν°μ μ μν¬νΈ μΈνΈ, 쿼리 μΈνΈλ₯Ό ν΅ν΄ μ€λͺ λκ³€ν©λλ€. κ°κ° μλ‘ λ€λ₯Έ μν μ΄ μ μλλ©° λͺ¨λΈμ μ΄λ€μ νμ©νμ¬ μ κ·ν, λΉ λ₯Έ νμ΅, μ μ μλ£μμμ νμ΅ λ±μ μ±μ·¨ν΄μΌ ν©λλ€.
μν¬νΈ μΈνΈ(support set)λ νμ΅κ³Ό μ§μ μ μΌλ‘ μ°κ΄λλ λ°μ΄ν°μ μ λλ€. λͺ¨λΈμ μν¬νΈ μΈνΈλ₯Ό νμ΅ν΄ 쿼리 μΈνΈλ₯Ό λΆλ₯νκ² λ©λλ€.
쿼리 μΈνΈ(query set)λ μ±λ₯ νκ°λ₯Ό μν λ°μ΄ν°μ μ λλ€. νμ§λ§ μκ³ λ¦¬μ¦μ λ°λΌ λ€μν μν λ‘ μ μλλ κ²½μ°κ° λ§μ΅λλ€.
λ©ννμ΅ μκ³ λ¦¬μ¦μ μ±λ₯μ νΉμ ν λ¬Έμ λ₯Ό ν΄κ²°νκΈ° λ³΄λ¨ νμ΅νλ λ²μ νμ΅ν¨μ μμ΅λλ€. λ°λΌμ μκ³ λ¦¬μ¦μ μ±λ₯ μΈ‘μ μ μν΄ λͺ¨λΈμ μ±λ₯ μμΉμ λλΆμ΄ μ λ°μ μΈ λ¬Έμ μ€μ λν κ°μ΄ κΈ°μ λμ΄μΌ ν©λλ€. μ΄μλν νμ€μ μ-μ¨μ΄ μΌμ΄-μ· νλ μμν¬(n-way k-shot framework)λΌ ν©λλ€.
μ-μ¨μ΄(n-way): ν μ 무μ κ΄ν κ³κΈμ μ΄ μλ₯Ό μ§μΉν©λλ€.
μΌμ΄-μ·(k-shot): μν¬νΈ μΈνΈμμ κ³κΈ λΉ μ 곡λ μμμ μ΄ μλ₯Ό μ§μΉν©λλ€.
λ©ν μ κ·ν(meta regularization)λ λͺ¨λΈμ μ κ·ν μ±λ₯μ κΈ°μ¬νλ μμ, μ νΈ, λ³νμ λν μ°κ΅¬μ λλ€.
λλ‘μμ(dropout): νμ΅ κ³Όμ μμ 무μμλ‘ μΌλΆ λ΄λ°μ λΉνμ±ννμ¬ λͺ¨λΈμ κ³Όμ ν©μ λ°©μ§νκ³ μΌλ°ν λ₯λ ₯μ ν₯μμν€λ μ κ·ν κΈ°λ²μ λλ€.
μ¬μ μ§μ(prior knowledge): λλ©μΈ μ λ¬Έκ°μ μ§μμ΄λ μ΄μ νμ΅ κ²½νμμ μ»μ ν΅μ°°μ νμ©νμ¬ νμ΅ μκ³ λ¦¬μ¦μ μ΅μ ννκ³ , λ ν¨μ¨μ μ΄κ³ κ²¬κ³ ν νμ΅ κ³Όμ μ μ€κ³ν©λλ€.
κ·ΈμΈ λ³ν, ν΄λ¬μ€ν°λ§μ κ΄λ ¨λ μμ λ±