๐ง Understanding LISA - LISA ์์๋ณด๊ธฐ?!!
๐ง (ํ๊ตญ์ด) LISA: ์ถ๋ก ๊ธฐ๋ฐ ์ธ๊ทธ๋ฉํ ์ด์ ์ ์๋ก์ด ์งํ
๐ ๋ณต์กํ ์ธ์ด ์ง์๋ฅผ ์ดํดํ๊ณ , ์ด๋ฏธ์ง์์ ํด๋น ์์ญ์ ๋ถํ ํ๋ ํ์ ์ ์ธ ๋ชจ๋ธ!
๋ ผ๋ฌธ: LISA: Reasoning Segmentation via Large Language Model
๋ฐํ: CVPR 2024 (by CUHK, MSRA, SmartMore)
์ฝ๋: dvlab-research/LISA
์ฝ๋ฉํธ: LLM์ ์ธ์ด ์ดํด ๋ฅ๋ ฅ์ ์๊ฐ ๋ถํ ์ ์ ๋ชฉํ ํ๊ธฐ์ ์ธ ์ ๊ทผ!
โ ๊ธฐ์กด ์๊ฐ ์ธ์ ์์คํ ์ ํ๊ณ
๋๋ถ๋ถ์ ์๊ฐ ์ธ์ ์์คํ ์ ๋ช ์์ ์ธ ์ง์๋ ์ฌ์ ์ ์๋ ๋ฒ์ฃผ์ ์์กดํ์ฌ ๋์ ๊ฐ์ฒด๋ฅผ ์๋ณํฉ๋๋ค.
์ด๋ฌํ ์์คํ ์ ์์์ ์ธ ์ฌ์ฉ์ ์๋๋ฅผ ์ดํดํ๊ณ ์ถ๋ก ํ๋ ๋ฅ๋ ฅ์ด ๋ถ์กฑํฉ๋๋ค.
- ๋ช ์์ ์ง์ ํ์: ์ฌ์ฉ์๊ฐ ์ง์ ์ ์ผ๋ก ๋์ ๊ฐ์ฒด๋ฅผ ์ง์ ํด์ผ ํจ.
- ์ฌ์ ์ ์๋ ๋ฒ์ฃผ ์์กด: ์๋ก์ด ๊ฐ์ฒด๋ ์ํฉ์ ๋ํ ์ ์ฐํ ๋์์ด ์ด๋ ค์.
- ๋ณต์กํ ์ถ๋ก ๋ถ์กฑ: โ๋นํ๋ฏผ C๊ฐ ๋ง์ ์์โ๊ณผ ๊ฐ์ ๋ณต์กํ ์ง์๋ฅผ ์ดํดํ๊ณ ์ฒ๋ฆฌํ๋ ๋ฐ ํ๊ณ๊ฐ ์์.
โก๏ธ ์ด๋ฌํ ํ๊ณ๋ฅผ ๊ทน๋ณตํ๊ธฐ ์ํด, ๋ณต์กํ๊ณ ์์์ ์ธ ์ธ์ด ์ง์๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ์ด๋ฏธ์ง์์ ํน์ ์์ญ์ ๋ถํ ํ๋ โ์ถ๋ก ๋ถํ (reasoning segmentation)โ์ด๋ผ๋ ์๋ก์ด ๊ณผ์ ๊ฐ ์ ์๋์์ต๋๋ค.
โ LISA์ ํต์ฌ ํน์ง!
๐ 1. ์ถ๋ก ๋ถํ (Reasoning Segmentation)
- ๋ณต์กํ ์ธ์ด ์ง์ ์ดํด:
โ์ด ์ด๋ฏธ์ง์์ ๋ฏธ๊ตญ ๋ํต๋ น์ด ๋๊ตฌ์ธ์ง ๋ถํ ๋ง์คํฌ๋ฅผ ์ถ๋ ฅํ๊ณ ์ด์ ๋ฅผ ์ค๋ช ํ์ธ์.โ ์ ๊ฐ์ ์ง์ ์ฒ๋ฆฌ ๊ฐ๋ฅ - ์ธ๊ณ ์ง์ ํ์ฉ:
โ๋นํ๋ฏผ C๊ฐ ๋ง์ ์์โ ๋ฑ ์ค์ ์ง์์ ํ์ฉํด ์ ์ ํ ์์ญ ๋ถํ - ์ค๋ช
์ ๊ณต:
๋ถํ ๊ฒฐ๊ณผ์ ๋ํ ์ด์ ์ ์ค๋ช ์์ฑ ๊ฐ๋ฅ
๐ง 2. LISA ๋ชจ๋ธ ๊ตฌ์กฐ
- **
ํ ํฐ ๋์ **: ์๋ก์ด ํ ํฐ ` `๋ฅผ ํ์ฉํด, ์๋ฒ ๋ฉ ์์ฒด๋ฅผ ๋ง์คํฌ๋ก ํด์ํ๋ **embedding-as-mask** ํจ๋ฌ๋ค์ ์ฌ์ฉ - ๋ค์ค ๋ชจ๋ฌ LLM ํ์ฉ:
๋ํ ์ธ์ด ๋ชจ๋ธ์ ์ธ์ด ์ดํด ๋ฅ๋ ฅ์ ์๊ฐ ์ ๋ณด์ ๊ฒฐํฉ - ์๋ ํฌ ์๋ ํ์ต:
์ธ์ด ์ง์ + ์ด๋ฏธ์ง โ ์ง์ ๋ง์คํฌ ์์ฑ๊น์ง ์ด์ด์ง๋ ๊ตฌ์กฐ
๐ 3. ReasonSeg ๋ฒค์น๋งํฌ
- 1,000๊ฐ ์ด์ ์ํ ํฌํจ
- ์ธ๊ณ ์ง์, ๋ค์ค ํด ๋ํ, ์ค๋ช ๊ธฐ๋ฐ ์๋ต ๋ฑ ๋ค์ํ ํ๊ฐ ํญ๋ชฉ
- ๋ณต์กํ ์ถ๋ก ๋ฅ๋ ฅ ์ธก์ ๊ฐ๋ฅํ ์๋ก์ด ๊ธฐ์ค ์ ์
๐๏ธโโ๏ธ ํ์ต ๋ฐ ์ฑ๋ฅ
- ์ ๋ก์ท ์ฑ๋ฅ:
๋ณต์กํ ์ถ๋ก ๋ฐ์ดํฐ ์์ด๋ ๋๋ผ์ด ์ผ๋ฐํ ๋ฅ๋ ฅ ๋ฐํ - Few-shot ํ์ธํ๋ ์ง์:
๋จ 239๊ฐ์ ์ถ๋ก ๋ถํ ์ํ๋ก ์ฑ๋ฅ ํฅ์ - ๋ค์ํ ์์ฉ ์๋๋ฆฌ์ค:
๋ํํ ์์คํ , ๋ก๋ด ๋น์ , ์ธํฐ๋ํฐ๋ธ ์์ด์ ํธ ๋ฑ ๊ฐ๋ฅ
๐ ๋ง๋ฌด๋ฆฌ
LISA๋ ๋จ์ํ ๊ฐ์ฒด๋ฅผ ์ธ์ํ๋ ์์ค์ ๋์ด,
์ธ์ด์ ์ถ๋ก ์ ๊ธฐ๋ฐ์ผ๋ก ์ด๋ฏธ์ง์ ์๋ฏธ๋ฅผ ํด์ํ๊ณ ์๊ฐ์ ์ผ๋ก ์๋ตํ ์ ์๋ ๋ชจ๋ธ์
๋๋ค.
์ด๋ ์ธ๊ฐ-์ปดํจํฐ ์ํธ์์ฉ, ๋ก๋ด ๋น์ , ์ค๋งํธ UI ๋ฑ
๋ค์ํ AI ์์คํ
์ ์๋ก์ด ํ์ค์ด ๋ ์ ์๋ ๊ฐ๋ฅ์ฑ์ ์ ์ํฉ๋๋ค.