◀ 앵 커 ▶
인공지능 즉 AI기술은 언어 뿐아니라
시각 등 이미지까지 분석하는 성능이
얼마나 사람처럼 진화할 수 있는지에
성패가 달려 있습니다.
국내 연구진이 시각 성능을 크게 끌어올려
인공지능 기술을 한 단계 더 진화시킬
수 있는 기술을 개발했습니다.
최기웅 기자가 소개합니다.
◀ END ▶
컴퓨터에 한 이미지만 보여주고 자세한 설명을
요구했습니다.
2~3초 이내에 컴퓨터는 한 남자가 테니스
라켓을 들고 코트에 서 있고 또 어떤 색깔의
옷을 입고 있는지 이미지를 구체적으로
설명합니다.
국내 연구진이 개발한 이른바 멀티모달
대형언어모델 기술로 텍스트뿐만 아니라
이미지까지 분석·처리할 수 있는 인공지능
기술입니다.
특히 기존 기술보다 시각 성능을 획기적으로
끌어올렸고 단순히 이미지 분석 뿐 아니라
딥러닝을 통해 얻은 학습 효과로 심층적인
대답도 내놓을 수 있습니다.
해당 기술은 현재 관련 분야 다른 상업
모델보다 시각 해석 분야 성능이 뛰어난
것으로 평가받고 있습니다.
이병관 박사과정/카이스트 전기및전자공학부
"대형 언어모델 자체가 이건 사람이고 이건
배경이다 이런식으로 분리해서 알아챌 수 있도록 하는 기술이고요. 인지과학적인 요소에서
영감을 많이 받았는데요. 사람은 어떤 이미지를 봤을 때 물체가 어떤 물체가 있는지 판단을..."
해당 기술은 앞으로 모바일에 탑재돼 많은
이용자들이 실생활에서 활용하거나 장애인들을 위한 생활형 AI 등으로 폭넓게 활용될 수
있습니다.
노용만 교수/카이스트 전기및전자공학부
"언어에 대한 문맥 정보 비전에 대한 어떤
문맥 정보가 있기 때문에 그런 문맥 정보를
통해서 장애우한테 이런 도움을 주는 것이
충분히 가능하다고 봅니다."
특히 기술 경쟁이 치열한 해당 분야 상업
모델들이 비공개로 개발중이지만 국내 연구팀의 모델은 공개형으로 전 세계 연구자들에게
제공돼 인공지능 기술의 진화를 이끌 촉진제
역할도 기대되고 있습니다.
MBC뉴스 최기웅입니다.