AI 기반 오프라인 방문객 분석 솔루션 스타트업인 메이아이(대표 박준혁)가 컴퓨터 비전 및 인식 분야 국제컨퍼런스인 CVPR(Conference on Computer Vision and Pattern Recognition, 컴퓨터 비전 및 패턴 인식)에 제출한 논문이 채택됐다.
이번 연구에서는 AI를 이용한 사람-사물 인터랙션(Human-Object Interaction, HOI) 인식 기술과 관련된 것으로, 최근 들어 각광받고 있는 비전 트랜스포머(Vision Transformer) 계열의 인공지능 모델 구조를 HOI 분야에 이용할 때 기존 연구들에서 발생하는 문제들을 해결하여 더 높은 성능을 내도록 하는 새로운 모듈 및 구조를 제안했다. 비전 트랜스포머 모델이란 자연어처리 분야에서 소개된 최고 수준의 결과를 달성한 최신의 어텐션 기반(attention-based) 트랜스 포머 모델을 컴퓨터 비전 분야에 적용한 모델이다.
비전 트랜스포머를 HOI 분야에 직접 적용하게 되면 비전 트랜스포머의 이미지 패치 격자 분할 구조와 사람-사물의 위치 정보 간 정렬의 불일치가 일어나 이후 연산에 악영향을 미치게 된다. 메이아이 연구진은 이 문제를 해결하기 위해 MOA(Masking with Overlapped Area)라고 이름 붙인 새로운 구조의 모듈을 제안하고, 기존 그래프 뉴럴 네트워크를 개선하여 세계 최고 수준의 성능을 달성했다고 밝혔다.
박준혁 메이아이 대표는 “메이아이의 이번 연구 및 논문 발표는 인공지능 기반 오프라인 방문객 분석 솔루션 mAsh(매쉬) 제품을 고도화하는 과정에서 발생하는 실질적인 니즈를 해결하기 위해 시작한 연구가 완성된 결과”라며, “인공 지능 컴퓨터 비전 분야에서 R&D 역량을 계속해서 쌓아 세계적인 학회에서 꾸준히 성과를 알리며 당사의 AI 기술 및 솔루션을 지속적으로 고도화 해나갈 것"이라고 밝혔다.
이번 연구는 메이아이의 박지승 연구원, 박진우 수석연구원 등이 참여했다. 박진우 수석연구원은 “AI를 활용해 더 다양한 종류의 기능을 고객에게 제공하기 위해 노력한 과정에서 세계적으로 인정받을 수 있는 연구 성과를 내어 기쁘다”며, “이번 연구를 기반으로 실제 제품에 HOI 기술을 기반으로 한 분석 기능을 탑재하여 고객에게 새로운 가치를 제공할 수 있을 것으로 기대하고 있다”고 말했다.
CVPR은 매년 6월 전 세계적으로 유명한 컴퓨터 비전 및 패턴 인식 분야의 연구자들이 참가하는 대규모 학술 대회를 열고 있다. CVPR 2023은 오는 6월 18일부터 22일까지 캐나다 밴쿠버 컨벤션 센터에서 열린다.