인공지능 예측은 왜 빗나갔을까? - 데이터 신문기사 읽기
#Data, #AI
BLOTER - [IT무비] AI의 빗나간 예측…”재개봉하면 ‘맘마미아2’가 1위”
내용을 요약하자면, COVID-19 의 영향으로 개봉할 신작이 없기 때문에 기존의 영화를 재개봉 해야 하는 상황.
이게 기존에 인기가 있었던 영화를 재개뵹하면 될 것이라고 생각하지만 인기가 많았던 영화는 이미 본 사람들이 많기 때문에 오히려 모객이 힘들다고 한다.
여기에서 CJ CGV 에서는 재미있는 시도를 한다.
CGV는 재개봉이 활발했던 올해 2~5월 자료를 활용해 영화 선정 알고리즘을 자체 개발했습니다. 재개봉작 선정을 위해서 최초 개봉 시 관람객 특성, 재개봉 관람객 수, 장르나 감독 등의 특징, 관람객 반응, 케이블 영화채널 편성 현황 등 100여가지 변수를 투입했습니다. 이렇게 얻은 자료을 바탕으로 파이썬(Python)과 마이크로소프트 애저(Azure)에서 제공하는 머신러닝 알고리즘을 활용해 예측 결과를 얻었습니다.
대부분의 빅데이터나 인공지능의 신화 (대표적인 예) 와는 다르게 실제로 선택된 영화를 개봉도 했다.
CGV, 머신 러닝 기법 활용한 ‘빅데이터 영화 추천’ 기획전 진행
다만 결과가 아쉽다.
전반적으로 당초 기대치보다는 낮았습니다. 또한 AI가 1위를 할 것으로 예상한 맘마미아2는 오히려 꼴찌를 차지했고요.
왜 이런 결과가 나왔을까?
CGV 측은 신규 영화 개봉이 어려웠던 시기의 데이터를 기반으로 학습한 모델을 ‘살아있다’, ‘반도’ 등 기대작들이 개봉한 시기에 적용한 것이 원인이라고 보기도 합니다. 당초 설정했던 환경 및 조건과는 차이가 있었기 때문에 그 효과를 제대로 평가할 수 없었다는 것이죠.
영화 추천으로는 Netflix prize 를 비롯하여 실제로 많은 서비스들에서 실제로 구동이 되고 있으나 대부분은 스트리밍 서비스를 기반으로 연구가 되었을 것이라 영화관은 생각보다 다른 문제였을 것이라 생각된다.
개인적으로는 올해 2~5월의 3개월의 자료가 부족한게 아닐가라는 생각이 드는데 이건 정보 전달 중에 누락이 된게 아닐지 생각이 들고, 이런 시도가 많아지고 성공사례도 많아지면 좋겠다.