Meta Learning
λ©ννμ΅(meta learning)μ νμ΅ κ³Όμ μ체λ₯Ό ν₯μμν€κΈ° μν μκ³ λ¦¬μ¦μ λν μ°κ΅¬μ λλ€. μ΄λ₯Ό ν΅ν΄ μ κ²½λ§μ μλ‘μ΄ μμ μ ν¨κ³Όμ μΌλ‘ νμ΅ν©λλ€. λ λΉ λ₯΄κ² λ³ννλ νκ²½μμ λͺ¨λΈμ μ΅μ ννλλ° νΉν μ μ©ν©λλ€. λ€μμ λ©ννμ΅μ μ£Όμν λΆμΌλ€μ λλ€:
λͺ¨λΈ κΈ°λ° λ©ν νμ΅(model-based meta learning)μ μ΄μ κ²½νμ μ μ₯νκΈ° μν΄ νμ₯λ λ©λͺ¨λ¦¬λ₯Ό κ°μ§ μ κ²½λ§μ΄λ μν μ κ²½λ§μ μ¬μ©ν©λλ€.
λ©νΈλ¦ κΈ°λ° λ©ν νμ΅(metric-based meta learning)μ μ μ¬μ±μ΄λ 거리 μΈ‘μ μ νμ©νμ¬ μλ‘μ΄ μμ μ λν λΉ λ₯Έ νμ΅μ μ΄μ§ν©λλ€.
μ΅μ ν κΈ°λ° λ©ν νμ΅(optimization-based meta learning)μ μ΅μ ν μκ³ λ¦¬μ¦μ νμ΅ν¨μΌλ‘μ¨ μλ‘μ΄ μμ μ λν νμ΅ ν¨μ¨μ±μ ν₯μμν΅λλ€.
TAML(Task-Agnostic Meta Learning)μ νΉμ μ 무 λΆν¬μ κ΄λ ¨λ νμ΅ μ λ΅μ κ·μ νλ λ° μ΄μ μ λ§μΆ₯λλ€. μ΄λ₯Ό ν΅ν΄ λ€μν μ 무λ₯Ό ν¨κ³Όμ μΌλ‘ λ²μ£Όνν μ μμ΅λλ€.
Learning Level
λ©ννμ΅ μκ³ λ¦¬μ¦μ λ κ°μ νμ μκ³ λ¦¬μ¦(λλ 루ν)λ₯Ό μ°κ΄νμ¬ νμ©νλ κ΅¬μ‘°λ‘ μ΄λ£¨μ΄μ Έ μλ κ²½μ°κ°λ§μ΅λλ€. μ΄λ₯Ό κ°κ°μ λ¨κ³λ‘ μκ°ν μμ μ λ¨κ³λ³ νμ΅(learning level)λΌ ν©λλ€.
λ©ν λ¨κ³ νμ΅(meta-level learning)μ κ³ μ°¨μμ νμ΅ κ³Όμ μΌλ‘ μ¬λ¬ μμ μμ 곡ν΅μ μ νμ νκ³ λ¬Έμ ν΄κ²° λ°©λ² κ·Έ μ체λ₯Ό νμ΅ν©λλ€. μΌλ°νλ νμ΅ μ λ΅μ κ°λ°νκ±°λ μλ‘μ΄ κ³Όμ λ νκ²½μ λΉ λ₯΄κ² μ μνλ λ₯λ ₯μ ν€μλλ€.
κΈ°λ³Έ λ¨κ³ νμ΅(base-level learning)μ μΌλ°μ μΈ κΈ°κ³ νμ΅κ³Ό μ μ¬νκ² μ§νλ©λλ€. μμ λλ λ¬Έμ ν΄κ²°μ μν νμ΅μ μ€μ μ λ‘λλ€. μ΄λ―Έμ§ λΆλ₯λ μμ°μ΄ μ²λ¦¬μ κ°μ ꡬ체μ μΈ κ³Όμ λ₯Ό μν νμ΅ μκ³ λ¦¬μ¦μ΄ μ΄μ ν΄λΉν©λλ€.
κ° λ¨κ³μμ μλνλ μκ³ λ¦¬μ¦μ λν΄ κΈ°λ³Έ νμ΅μ(basic learner), λ©ν νμ΅μ(meta-learner)λΌ λΆλ₯΄κΈ°λ ν©λλ€.
λλΆλΆμ λ©ννμ΅ μκ³ λ¦¬μ¦μ νλ ¨ κ³Όμ κ³Ό κ²μ¦ κ³Όμ μΌλ‘ μ΄λ£¨μ΄μ§λ©° κ°κ° λ©ν νλ ¨ λ¨κ³(meta training phase), λ©ν κ²μ¦ λ¨κ³(meta evaluation phase)λΌ λΆλ¦ λλ€. μ΄λ μμ λ¨κ³λ³ νμ΅κ³Όλ λ€λ₯Έ κ°λ μΌλ‘ λ©ν λ¨κ³ νμ΅κ³Ό κΈ°λ³Έ λ¨κ³ νμ΅μ΄ λͺ¨μ¬ λ©ν νλ ¨ λ¨κ³λ₯Ό λ§λ λ€ μ΄ν΄νλ©΄ λ©λλ€.
Query Set, Support Set
λ©ννμ΅μμ ν λ°μ΄ν°μ μ μν¬νΈ μΈνΈ, 쿼리 μΈνΈλ₯Ό ν΅ν΄ μ€λͺ λκ³€ν©λλ€. κ°κ° μλ‘ λ€λ₯Έ μν μ΄ μ μλλ©° λͺ¨λΈμ μ΄λ€μ νμ©νμ¬ μ κ·ν, λΉ λ₯Έ νμ΅, μ μ μλ£μμμ νμ΅ λ±μ μ±μ·¨ν΄μΌ ν©λλ€.
μν¬νΈ μΈνΈ(support set)λ νμ΅κ³Ό μ§μ μ μΌλ‘ μ°κ΄λλ λ°μ΄ν°μ μ λλ€. λͺ¨λΈμ μν¬νΈ μΈνΈλ₯Ό νμ΅ν΄ 쿼리 μΈνΈλ₯Ό λΆλ₯νκ² λ©λλ€.
쿼리 μΈνΈ(query set)λ μ±λ₯ νκ°λ₯Ό μν λ°μ΄ν°μ μ λλ€. νμ§λ§ μκ³ λ¦¬μ¦μ λ°λΌ λ€μν μν λ‘ μ μλλ κ²½μ°κ° λ§μ΅λλ€.
μμ (task)μ΄λ μ©μ΄λ₯Ό μ¬μ©νκΈ°λν©λλ€. μ΄λ κ·Έ νμ΅μμ μ μλ λ¬Έμ λ€μ λλ€. μμλ‘ μ΄λ―Έμ§ λΆλ₯κΈ°μ μμ λ€μ 'κ³ μμ΄ νλ³', 'μ νλ³', 'λΌμ§ νλ³' λ±μ΄ μμ μ μμ΅λλ€.
Unseen Classes and Seen Classes
μ λ³Έ κ³κΈκ³Ό λ³Έ κ³κΈμ λ©ννμ΅μ μ€μμλ μ κ·νμ κ΄λ ¨λ κ°λ μ λλ€. μ λ³Έ κ³κΈ(unseen classes)λ νμ΅ κ³Όμ μμ λνλμ§ μκ³ κ²μ¦ λλ μ΄μ κ³Όμ μμλ§ λ±μ₯νλ κ³κΈμ λλ€. λ°λ©΄, λ³Έ κ³κΈ(seen classes)μ νλ ¨κ³Όμ μ ν¬ν¨λ©λλ€. μ μ κ·νλ λͺ¨λΈμ μ λ³Έ κ³κΈμ λν μ²λ¦¬ λ₯λ ₯μ κ°μ§κ³ μμ΄μΌ ν©λλ€.
μ΄μ λν μμλ‘ μ§λ³ λΆλ₯κΈ°λ₯Ό μκ°ν΄λ³Ό μ μμ΅λλ€. μ΄ λΆλ₯κΈ°λ νμ΅μμ λ³Έ μ§λ³ μΈμλ μλ‘μ΄ ν¬κ· μ§λ³μ μ§λ¨λ μꡬλ μ μμ΅λλ€. μΌλ° νμ΅λ λͺ¨λΈμ μ λ³Έ κ³κΈμ μ²λ¦¬νλ λ° ν° μ΄λ €μμ κ²ͺμ΅λλ€. μ΄λ μ κ·νλ₯Ό νμ΅ν기보λ€λ νλ ¨ κ³Όμ μμ κ°λ₯ν λͺ¨λ ν΄λμ€μ λν΄ νμ΅νλλ‘ μ€κ³λμκΈ° λλ¬Έμ λλ€.
N-way K-shot Framework
λ©ννμ΅ μκ³ λ¦¬μ¦μ μ±λ₯μ νΉμ ν λ¬Έμ λ₯Ό ν΄κ²°νκΈ° λ³΄λ¨ νμ΅νλ λ²μ νμ΅ν¨μ μμ΅λλ€. λ°λΌμ μκ³ λ¦¬μ¦μ μ±λ₯ μΈ‘μ μ μν΄ λͺ¨λΈμ μ±λ₯ μμΉμ λλΆμ΄ μ λ°μ μΈ λ¬Έμ μ€μ λν κ°μ΄ κΈ°μ λμ΄μΌ ν©λλ€. μ΄μλν νμ€μ μ-μ¨μ΄ μΌμ΄-μ· νλ μμν¬(n-way k-shot framework)λΌ ν©λλ€.
μ-μ¨μ΄(n-way): ν μ 무μ κ΄ν κ³κΈμ μ΄ μλ₯Ό μ§μΉν©λλ€.
μΌμ΄-μ·(k-shot): μν¬νΈ μΈνΈμμ κ³κΈ λΉ μ 곡λ μμμ μ΄ μλ₯Ό μ§μΉν©λλ€.
Few Shot Learning and Zero Shot Learning
ν¨ μ· νμ΅(few shot learning), μ λ‘ μ· νμ΅(zero shot learning) λ±μ λͺ μΉμ μ-μ¨μ΄ μΌμ΄-μ· νλ μμν¬μμ κΈ°μν©λλ€. ν¨ μ· νμ΅μ μ μ μΌμ΄-μ·μ μν, μ λ‘ μ· νμ΅μ 0μ μΌμ΄-μ·μ μ€μ ν λ©ννμ΅μ λν μ°κ΅¬ λλ μκ³ λ¦¬μ¦μ λλ€.
Meta Regularization
λ©ν μ κ·ν(meta regularization)λ λͺ¨λΈμ μ κ·ν μ±λ₯μ κΈ°μ¬νλ μμ, μ νΈ, λ³νμ λν μ°κ΅¬μ λλ€.
λλ‘μμ(dropout): νμ΅ κ³Όμ μμ 무μμλ‘ μΌλΆ λ΄λ°μ λΉνμ±ννμ¬ λͺ¨λΈμ κ³Όμ ν©μ λ°©μ§νκ³ μΌλ°ν λ₯λ ₯μ ν₯μμν€λ μ κ·ν κΈ°λ²μ λλ€.
μ¬μ μ§μ(prior knowledge): λλ©μΈ μ λ¬Έκ°μ μ§μμ΄λ μ΄μ νμ΅ κ²½νμμ μ»μ ν΅μ°°μ νμ©νμ¬ νμ΅ μκ³ λ¦¬μ¦μ μ΅μ ννκ³ , λ ν¨μ¨μ μ΄κ³ κ²¬κ³ ν νμ΅ κ³Όμ μ μ€κ³ν©λλ€.
κ·ΈμΈ λ³ν, ν΄λ¬μ€ν°λ§μ κ΄λ ¨λ μμ λ±
μ΄λ λ¨μν λ©ννμ΅μλ§ κ΅νλλ κ°λ μ μλλλ€. κ·Έλ¬λ λ©ννμ΅μ μ£Όμ λͺ©νμΈ μ κ·νμ λ§₯λ½μ κ°μ΄ μλ‘ μμ£Ό μ°κ΄λκ³€ ν©λλ€.
Last updated