메이아이가 세계 최고 인공지능 학회 CVPR(Computer Vision and Pattern Recognition, 컴퓨터 비전 및 패턴 인식)에서 논문이 채택되었습니다.
이번 연구에서는 AI를 이용한 사람-사물 인터랙션(Human-Object Interaction, HOI) 인식 기술과 관련된 것으로, 최근 들어 각광받고 있는 비전 트랜스포머(Vision Transformer) 계열의 인공지능 모델 구조를 HOI 분야에 이용할 때 기존 연구들에서 발생하는 문제들을 해결하여 더 높은 성능을 내도록 하는 새로운 구조의 모듈을 제안했습니다. 비전 트랜스포머 모델이란 자연어처리 분야에서 소개된 최고 수준의 결과를 달성한 최신의 어텐션 기반(attention-based)트랜스 포머 모델을 컴퓨터 비전 분야에 적용한 모델입니다.
다만 비전 트랜스포머를 HOI 분야에 직접 적용하게 되면 비전 트랜스포머의 이미지 패치 격자 분할 구조와 사람-사물의 위치 정보 간 정렬의 불일치가 일어나 이후 연산에 악영향을 미치게 됩니다. 메이아이 연구진은 이 문제를 해결하기 위해 MOA (Masking with Overlapped Area)라고 이름 붙인 새로운 구조의 모듈을 제안하고, 기존 그래프 뉴럴 네트워크를 개선하여 세계 최고 수준의 성능을 달성하였습니다.
메이아이 박준혁 대표는 “메이아이의 이번 연구 및 논문 발표는 인공지능 기반 오프라인 방문객 분석 솔루션 mAsh(매쉬) 제품을 고도화하는 과정에서 발생하는 실질적인 니즈를 해결하기 위해 시작한 연구가 완성된 결과”라며 “인공 지능 컴퓨터 비전 분야에서 R&D 역량을 계속해서 쌓아 세계적인 학회에서 꾸준히 성과를 알리며 당사의 AI 기술 및 솔루션을 지속적으로 고도화 해나갈 것"이라고 밝혔습니다.

이번 연구에는 메이아이의 박지승 연구원 주도로 수행되었으며, 메이아이에서 인공지능 기반 영상 분석 기술 개발을 이끌고 있고 이번 연구에도 함께 참여한 박진우 수석 연구원은 “AI를 활용해 더 다양한 종류의 기능을 고객에게 제공하기 위해 노력한 과정에서 세계적으로 인정받을 수 있는 연구 성과를 내어 기쁘다”며, “이번 연구를 기반으로 실제 제품에 HOI 기술을 기반으로 한 분석 기능을 탑재하여 고객에게 새로운 가치를 제공할 수 있을 것으로 기대하고 있다”고 말했습니다.

CVPR 학회는 매년 6월 전 세계적으로 유명한 컴퓨터 비전 및 패턴 인식 분야의 연구자들이 참가하는 대규모 학술 대회를 열고 있습니다. 올해의 CVPR 2023 국제학술대회는 6월 18일부터 22일까지 캐나다 밴쿠버 컨벤션 센터에서 열리며, 메이아이의 연구진도 직접 참가하여 전 세계 AI 연구자들과 교류할 계획입니다.
앞으로도 어제보다 오늘 더 성장하는 메이아이가 되겠습니다.
Jeeseung Park, Jin-Woo Park, Jong-Seok Lee, "ViPLO: Vision Transformer based Pose-Conditioned Self-Loop Graph for Human-Object Interaction Detection" CVPR 2023.
-Paper: https://arxiv.org/abs/2304.08114
-Code: https://github.com/Jeeseung-Park/ViPLO
고객 경험을 분석하는 솔루션,
매쉬에 대해 알아보세요.
▼ 관련기사

▼ 인공지능 분석 트랜드는 메이레터에서 확인하세요!