세계적인 AI 학회 ICLR이 인정한 메이아이의 방문객 분석 기술력
안녕하세요, 메이아이의 Content Editor 최창근입니다.
기쁜 소식을 전합니다. 메이아이가 세계 3대 머신러닝 학회 중 하나인 ‘표현 학습 국제학회(ICLR)’에 참여합니다. Machine Learning Research 팀의 송명서(제1저자), 박진우(제2저자) 연구원이 발표한 논문이 상위 5% Spotlight에 선정되었거든요. 논문의 제목은 「Exploring the Camera Bias of Person Re-identification」으로, 사람 재식별 모델의 카메라 편향 문제를 분석하고 이에 대한 해결책을 제시합니다.
이번 논문에서 소개한 기술은 메이아이 방문객 분석 기술의 정확도를 높였을 뿐 아니라, 이미지 분석 AI 분야에서도 의미있는 성과라고 하는데요. 이 논문의 핵심은 무엇이고 어떤 의미가 있는 걸까요? 인터뷰를 통해 쉽게 풀어봤습니다.
“매쉬의 핵심인 방문객 동선 데이터의 정확도를 높이는 데 기여했어요”
메이아이의 Machine Learning Research 팀을 소개해주세요.
박진우(이하 박): 메이아이가 컴퓨터 비전 인공지능 기술을 기반으로 방문객 데이터를 분석하는 데는 수많은 인공지능 모델이 필요한데요. MLR 팀에서는 메이아이의 여러 모델을 개발하고 발전시키는 일을 하고 있습니다. 가장 중점을 두는 부분은 방문객 동선 데이터의 정확도를 높이는 거고요.
송명서(이하 송): 저희 팀은 한마디로 요약하면 ‘멀티 카메라 멀티 피플 트래킹’ 문제를 풀기 위한 팀이에요. 매장 하나에 카메라가 여러 개 있고, 카메라마다 찍는 영상이 다른데요. 각 영상을 분석해 같은 사람끼리 묶어주는 알고리즘을 만드는 것이 저희 팀의 핵심 목표입니다.
이번 논문은 어떤 문제를 핵심으로 다뤘는지 소개 부탁드립니다.
송: 이번 논문은 ‘사람 재식별 모델(Person Re-identification model)’의 ‘카메라 편향’ 때문에 분석 정확도가 낮아지는 문제를 분석하고, 해결책을 제시하는 게 핵심이에요.
먼저 사람 재식별 모델은, 사람의 이미지로부터 그 사람의 고유한 정보(identity)를 추출하는 모델이에요. 이 정보를 바탕으로 한 매장에서 여러 CCTV에 걸쳐 등장한 같은 사람의 이미지를 매칭할 수 있어요. 그 덕분에 방문객의 동선 데이터를 뽑을 수 있는 거예요.
카메라 편향 문제는 같은 사람의 이미지를 묶을 때 생깁니다. 사람 재식별 모델이 같은 사람의 이미지끼리 매칭해야 하는데, 같은 카메라에 등장한 사람의 이미지에 가중치를 둬서 매칭하는 거죠. 이러면 서로 다른 사람을 같은 사람이라고 매칭하는 문제가 발생하고, 분석 정확도가 떨어져요.
카메라 편향 문제는 원래 알려진 현상인데요. 저희는 매쉬를 새로 도입한 공간, 즉 모델이 학습하지 않은 공간에 카메라 편향 문제가 더 잘 나타나는 걸 발견한 거예요.
이런 현상이 생기는 원인은 무엇이었나요?
송: 궁극적으로 이런 현상이 왜 일어났냐고 하면, 사람 재식별 모델이 이미지에 반영된 카메라 고유 정보를 사람 고유 정보와 완벽히 분간하지 못하기 때문이에요. 사람의 고유한 정보만 추출해야 하는데, 카메라와 연관된 정보도 함께 추출하는 거죠. 카메라와 연관된 정보라 함은 화각, 구도, 채도, 화질, 밝기 등을 말하고요.
카메라 편향 문제를 어떻게 해결하려고 하셨나요?
박: 저희가 머신러닝 모델을 돌릴 때는 정보의 속성을 측정 가능하게 정리하고(피처) 숫자로 바꾸는 ‘벡터화’를 진행하는데요. CCTV로 수집된 방문객의 이미지도 다 벡터화해서 처리해요. 이때 카메라 각각의 정보도 수치화한 뒤, 이미지 피처에서 빼주는 작업을 진행했습니다. 같은 기준으로 비교할 수 있게 만들어준 거예요.
송: 더 간단하게 말하자면요. A카메라에서 추출한 피처에서 A카메라의 공통 정보를 다 빼주는 거예요. B카메라는 B카메라대로 진행하고요. 이러면 모든 피처에서 편향이 사라지는 게 되는 거죠. 카메라 편향이 사라진 상태니까 이걸로 사람 재식별 모델의 정확도를 높일 수 있었고요.
이런 과정을 ‘피처 정규화’라고 해요. 학계에는 보고된 방법이긴 한데, 실제 현장에서 활용한 경우는 거의 없었어요. 저희는 이 방법을 메이아이 상황에 맞게 적용해 카메라 편향 문제를 해결했고, 해결 과정과 그 과정에서 얻은 인사이트를 논문에 실었어요.
“이번 논문처럼 방법론과 실용성을 모두 갖춘 경우는 드물어요”
회사 내부 프로젝트인데 어떻게 논문을 쓰고 발표하게 되었나요?
송: 원래는 논문을 쓰려고 시작한 건 아니었어요. 사람 재식별 모델의 정확도를 높이려고 했던 건데, 실제로 정확도가 굉장히 높아지는 결과가 나타났고요. 제품 퀄리티에도 임팩트가 컸고, 고객사의 매장을 분석하는 데도 도움이 많이 됐고요. 찾아보니까 머신러닝 연구 필드에는 관련 논문이 많이 없었어요. 학술적인 가치가 있겠다고 봤고, 회사 기술력도 자랑할 겸 논문을 쓰기로 했죠.
세계 3대 머신러닝 학회인 ICLR에서 상위 5% 이내 논문으로 뽑히는 성과를 냈습니다. 잘될 거라는 느낌이 있었나요?
박: 저는 논문에서 다룬 것들이 내부적으로 실험도 잘 됐고, 실제로 효과도 커서 잘될 것 같다는 느낌이 더 컸습니다.
송: 저는 처음 학회에 논문을 낼 때는 반반이었는데요. 논문에 대한 첫 리뷰를 받았을 때 점수가 굉장히 좋은 거예요. 제가 썼던 논문 중에 가장 높았어요. 그때 잘될 것 같다는 느낌을 받았어요.
이번 논문이 메이아이의 제품 경쟁력 차원에서 어떤 의미가 있을까요?
박: 제가 알고 있는 한 국내외 경쟁사를 모두 포함해서 비교했을 때, 메이아이가 방문객 동선 데이터를 가장 좋은 퀄리티로 가공해서 고객사에 제공합니다. 유일하다고 생각해요. 동선 데이터의 핵심 중 하나가 이번 논문에서 다룬 사람 재식별 기술이고요. 이번 논문으로 메이아이가 방문객 동선 분석 분야를 주도하는 점을 입증해서 의미가 있다고 보고 있어요.
머신러닝 연구 차원에서는 어떤 의미가 있는지도 궁금합니다.
송: 머신러닝 분야에서 나오는 논문 대다수는 방법론을 제안하는 데서 그쳐요. 학술적인 가치는 있지만 실제 현장에서 쓰이지 않는 거죠. 하지만 이번에 발표한 논문에서 다룬 기술은 저희 회사 제품에 실제로 활용됐고, 큰 성능 향상으로 이어졌고요. 방법론에 더해 실제 비즈니스 현장에 적용하는 과정과 결과까지 소개해 가치가 높아요.
“실용성과 효율성을 잡는 AI 모델을 연구하고 싶어요”
4월 말에 ICLR 2025 학회에 참석하러 가잖아요. 어떤 점을 기대하고 있으신가요?
박: 관심 분야의 연구를 발견하고 전 세계의 연구원과 이야기를 자유롭게 나누는 게 가장 기대돼요. 이메일로 물어보지 않고, 연구에 대해 바로 물어보고 바로 답변을 들을 수 있거든요. 여담이지만 메이아이 홍보도 하고요.
송: 저도 다른 연구원들을 실제로 만나서 디스커션하는 걸 기대하고 있어요. 제가 만나는 사람들과도 물론 디스커션할 수 있지만 풀이 한정돼 있잖아요. 학회에서는 다양한 대학원생과 교수를 만나서 기술적으로 깊이 있는 이야기를 할 수 있고요. 이번 논문을 다른 사람에게 발표하고 의견을 들어볼 수 있는 점도 기대가 돼요.
두 분은 원래 컴퓨터 비전 분야의 인공지능을 연구하고 싶었던 건가요?
송: 실제 현장에서 임팩트를 내는 분야를 찾다가 여기까지 왔는데요. 처음에는 학교에서 추천 시스템을 연구했어요. 넷플릭스·쿠팡 같은 데서 본 적 있을 거예요. 실용적이지만 연구실에서는 수치 데이터로만 확인할 수 있다 보니까, 직접 결과물을 보는 분야를 하고 싶었어요.
그러다 이미지 스타일 변환 분야를 연구했고요. 하다 보니 좀 더 실용적인 문제를 풀고 싶었고, 성능에 대한 평가도 정확히 하고 싶었어요. 이미지 스타일 변환 결과물은 품질을 느낌으로는 알지만 수치화해서 평가하기 어렵거든요. 그래서 이미지 분야이면서 실용적이고, 성능을 평가하기도 좋은 컴퓨터 비전 분야까지 왔습니다.
박: 저는 대학원에 가면서 인공지능 연구를 시작했고요. 처음에는 인공지능 모델의 속도를 올리고 비용은 줄이는 경량화 쪽을 주로 했습니다. 연구를 시작할 때만 해도 생각보다 초창기였기 때문에 새로운 아이디어를 내고 반영할 기회가 많아서 굉장히 즐거웠어요.
그러다 좋은 기회가 있어서 당시 같은 연구실 동료였던 준혁 님과 메이아이를 창업했고, 그 과정에서 메이아이 제품에 필요한 다양한 Object Detection, Object Tracking 같은 컴퓨터 비전 분야 연구를 본격적으로 시작했어요. 처음에는 공부해야 하는 것도 많고 시행착오도 많이 겪었지만, 제품이 만들어지는 과정에서 각 분야에 어떤 문제가 있고, 어떤 해결책이 있는지 많이 배웠습니다.
마지막으로 앞으로 어떤 연구를 하고 싶으신지 말씀 부탁드립니다.
송: 실용적인 애플리케이션으로 이어지는 연구를 계속해서 해나가고 싶습니다.
박: 모델의 자유도를 높이는 걸 고민하고 있어요. 메이아이에서는 언어 모델이랑 컴퓨터 비전의 이미지를 결합해보고 싶고요. 특정 행동을 하는 사람을 텍스트로 명령해서 묶어내는 걸 상상할 수 있는 거죠. 사실 라벨링을 하면 해결되긴 하지만 사람의 모든 행동을 라벨링할 수 없으니까요. 비전 랭귀지 모델(Vision Language Model)을 쓰면 일일이 라벨링을 하지 않아도 되니까 효율성이 높아지거든요. 이런 쪽으로 한번 접근해보려고 합니다.
메이아이의 방문객 데이터 분석 솔루션은 세계 Top급입니다
인공지능 기술을 활용해 방문객 분석을 하는 업체는 많습니다. 하지만 세계 Top3 머신러닝 학회에 논문을 발표하고 상위 5%에 선정되는 연구원과 제품을 만드는 곳은 메이아이를 빼곤 찾아보기 어렵습니다. 해당 기술은 논문 발표 전 매쉬에 적용돼 고객사에게 제공되고 있고요.
방문객 데이터 분석 솔루션을 도입할까 고민 중이라면 ‘기술력을 가장 먼저’ 따져보세요. 세계 최고 수준의 기술력은 정확도를 담보하고, 정확해야 매장 상황을 제대로 들여다볼 수 있기 때문입니다. 더 궁금한 내용은 아래 배너를 클릭해 서비스 소개서를 받아보거나, 채널톡으로 문의 부탁드립니다. contact@may-i.io로 문의하셔도 좋습니다. 최선을 다해 답변드리겠습니다.