์์ ์ ๊ฒฝ๋ง(prototypical network)์ ํจ ์ท ๋ฌ๋์ ํ ๋ฐฉ๋ฒ์ผ๋ก, ์์์ ์์๋ง์ผ๋ก๋ ํจ๊ณผ์ ์ธ ํ์ต์ด ๊ฐ๋ฅํ ๋ชจ๋ธ์
๋๋ค. ์ด๋ฏธ์ง ๋ถ๋ฅ๋ฅผ ๋น๋กฏํ ์ฌ๋ฌ ๋ถ์ผ์์ ๊ทธ ์ฑ๋ฅ์ด ์
์ฆ๋์์ผ๋ฉฐ ์ ํ๋ ๋ฐ์ดํฐ๋ก๋ ์ ํํ ๋ถ๋ฅ๊ฐ ๊ฐ๋ฅํ๋ค๋ ์ฅ์ ์ด ์์ต๋๋ค.
์์ ์ ๊ฒฝ๋ง์ ๊ตฐ์งํ ๋ก์ง์ ๋ณด์ฌ์ฃผ๋ ๋ํ ํจ ์ท ํ์ต๊ณผ ๊ฐ์ ๊ทนํ ์ ํ๋ ๋ฐ์ดํฐ ํ๊ฒฝ์์ ๋ถ๋ฅ๊ธฐ๋ ๋จ์ํ๊ณ ๊ท๋ฉ์ ํน์ฑ์ ๊ฐ์ ธ์ผ ๊ณผ๋์ ํฉ์ ํผํ ์ ์์ต๋๋ค. ์ด๋ฅผ ์ํด ๊ฐ ํด๋์ค๋ฅผ ๋ํํ๋ ์ํ์ ์ค์ฌ์ผ๋ก ๊ตฐ์งํ๊ฐ ์ด๋ฃจ์ด์ง๋๋ค. ์ด๋ ์
๋ ฅ ๋ฐ์ดํฐ์ ๋น์ ํ ๋งคํ๊ณผ ๋ถ์ฐ ๊ณต๊ฐ(embedding space)์ ํ์ฉํ๋ ๋คํธ์ํฌ๋ฅผ ํตํด ์ํ๋๋ฉฐ, ์ด ๊ณต๊ฐ์์ ๊ฐ ํด๋์ค์ ์ํ์ด ์ ์๋ฉ๋๋ค.
ํด๋น ๋ด์ฉ์ ์ด ๋
ผ๋ฌธ์ ๊ธฐ๋ฐ์ผ๋ก ํฉ๋๋ค.
Formulation
์ด๋, ๋ค์์ด ์ ์๋ ์ ์์ต๋๋ค:
Algorithm
๊ณ๊ธ k์ ๋ํ ์ํฌํธ ์ธํธ Skโ๋ ๋ค์๊ณผ ๊ฐ์ด ์์ํ๋ฉ๋๋ค:
Skโ={(xiโ,yiโ),...,(xNโ,yNโ)}whereย is:ย
yiโโ{1,โฆ,K}
kย isย indexย ofย aย class
์์ ์ ๊ฒฝ๋ง์ M-์ฐจ์์ ๋ํด ๊ทธ ๊ณ๊ธ์ ๋ํ์ธ ์ํ ckโโRM์ ์ฌ์ฉํฉ๋๋ค. ์ด๋ฅผ ์ํ ๋ถ์ฐ ๊ฐ์ ์ป๊ธฐ์ํด ๋งค๊ฐ๋ณ์ ฮธ๋ฅผ ๊ฐ์ง ๋ถ์ฐ ํจ์ fฮธโ:RDโRM๋ฅผ ์ฌ์ฉํฉ๋๋ค. ๊ฐ ์ํ์ ๋ค์๊ณผ ๊ฐ์ด ๊ณ์ฐ๋ฉ๋๋ค.
Prototype=ckโ=โฃNCโโฃ1โโ(xiโ,yiโ)โSkโโfฮธโ(xiโ)
๊ฑฐ๋ฆฌ ํจ์ d:RMโ
RMโ[0,+inf)๊ฐ ์ฃผ์ด์ก์ ๋, ์์ ์ ๊ฒฝ๋ง์ ๋ถ์ฐ ๊ณต๊ฐ์์ ๊ฐ ๊ณ๊ธ์ ์ํ์ ์ฟผ๋ฆฌ ์ง์ x ๋ํ ๊ฑฐ๋ฆฌ, ๊ทธ์ ๋ํ ์ํํธ๋งฅ์ค๋ฅผ ๊ณ์ฐํฉ๋๋ค.
pฮธโ(y=kโฃx)=โkโโexp(โd(fฮธโ(x),ckโโ))expโd(fฮธโ(x),ckโ)โ
๊ฑฐ๋ฆฌ๋ฅผ ๊ตฌํ๋ ํจ์ d(.,.)๋ ๋ค์๊ณผ ๊ฐ์ต๋๋ค: d(x,y)=โi=1nโ(xiโโyiโ)2โ
ํ์ต์ ๋ค๊ฑฐํฐ๋ธ ๋ก๊ทธ ํ๋ฅ J(ฮธ)=โlogpฮธโ(y=kโฃx)๊ณผ SGD๋ฅผ ํตํด ๊ณ์ฐ๋ฉ๋๋ค. ํ ์ํผ์๋๋ฅผ ์ํ ๋ฐ์ดํฐ์
์ ๋ฌด์์๋ก ์ ์ ๋ ๊ณ๊ธ์ ๋ถ๋ถ์งํฉ๊ณผ ๊ทธ์ ๋ํ ๋ฌด์์ ์ํ ๋ช ๊ฐ๋ก ๊ตฌ์ฑ๋ฉ๋๋ค. ๋๋จธ์ง๋ ์ฟผ๋ฆฌ ์ง์ ์ผ๋ก ์ฌ์ฉ๋ฉ๋๋ค.
๋ชจ๋ธ fฮธโ(x)์ ํ๋ จ ์๊ณ ๋ฆฌ์ฆ์ ๋ ํ์ต ๋จ๊ณ๋ก ์ค๋ช
๋ ์ ์์ต๋๋ค. ๋จ๊ณ 1์์ ์ํฌํธ ์ธํธ๋ฅผ ํตํด ์ํ ckโ๋ฅผ ๊ณ์ฐํฉ๋๋ค. ๋จ๊ณ 2์์ ์ฟผ๋ฆฌ ์ธํธ๋ฅผ ํตํด ์์ค J์ ๊ณ์ฐํ๊ณ ์๋ฒ ๋ฉ ๋คํธ์ํฌ๋ฅผ ๊ฐ์ค์น ฮธ๋ฅผ ๊ฐฑ์ ํฉ๋๋ค.
์ํํธ๋งฅ์ค: pฮธโ(y=kโฃx)=โkโโexp(โd(fฮธโ(x),ckโโ))expโd(fฮธโ(x),ckโ)โ
๋ค๊ฑฐํฐ๋ธ ๋ก๊ทธ ํ๋ฅ : J(ฮธ)=โlogpฮธโ(y=kโฃx)
S=RandomSample(D,Nkโ)
ckโ=Skโ1โโ
โ(xiโ,yiโ)โSkโโfฮธโ(xiโ)
Q=RandomSample(...S+D,Nqโ)
pฮธโ(y=kโฃx)=โkโโexp(โd(fฮธโ(x),ckโโ))expโd(fฮธโ(x),ckโ)โ
J(ฮธ)=โlogpฮธโ(y=kโฃx)
ฮธโฮธ+ฮJ(ฮธ)