[와이파일] 온택트와 넷플릭스, 그리고 빅데이터

[와이파일] 온택트와 넷플릭스, 그리고 빅데이터

2021.02.02. 오후 2:00
댓글
글자크기설정
인쇄하기
'온택트 시대'에 OTT 서비스 급성장 추세
넷플릭스, 빅데이터 활용해 초기 기선 제압
'데이터 3법'에도 국내 빅데이터 산업 발전은 아직
"산업 발전과 개인정보 보호에 정치적 리더십 발휘해야"
AD
코로나19 시대입니다. 언택트, 그러니까 비대면 시대인 만큼, 많은 분이 어려움을 겪고 있죠.

[와이파일] 온택트와 넷플릭스, 그리고 빅데이터


문화예술계도 마찬가지입니다. 영화관에 가서 영화 한 편 즐기는 것이 사치인 시대니까요.

언택트가 길어지면서 세상은 빠르게 '온택트'로 전환하고 있습니다. 온택트는 언택트(Untact)와 온라인(Online)을 합한 신조어죠. 직접 대면이 아닌 온라인을 통한 대면을 뜻합니다.

문화계와 미디어 업계도 온택트에 주목합니다. 대표적인 것이 바로 OTT 서비스입니다.



◆ 셋톱박스를 넘어선 'OTT'

OTT(Over The Top)가 뭘까요? Top, 그러니까 셋톱박스를 넘는다는 뜻이랍니다. 그럴 듯하죠? TV에 붙어있는 셋톱박스에서 벗어나 인터넷을 통해 어디서나, 언제든지 원하는 미디어에 접근할 수 있는 서비스입니다.

요즘 이 OTT 사용하시는 분 많을 겁니다. 편하게 미디어를 볼 수 있다는 장점에 더해 훌륭한 자체 제작 콘텐츠가 주목받고 있죠. 또, 코로나19 시대에 제때 개봉하지 못한 영화가 잇달아 OTT를 개봉 수단으로 택하면서 더욱 주목받는데요, 대표적인 OTT는 역시 넷플릭스고요, 여기에 웨이브, 왓챠, 아마존 프라임 비디오 등이 치열하게 경쟁하고 있습니다.


◆ '빅데이터'에서 나오는 넷플릭스의 강점

그런데 넷플릭스를 이용하다 보면 눈에 띄는 점이 있습니다. 바로 사용자에게 콘텐츠를 추천해준다는 점이지요. 아예 무작위 재생으로 사용자 취향에 맞는 영상을 틀어주기도 합니다. 추천 기능은 검색에서도 적극적으로 사용하는데요, 넷플릭스가 보유하지 않은 작품을 검색하면, 비슷한 성격의 콘텐츠를 추천해주는 방식이죠. 호불호는 갈리는 것 같던데요, 저는 일단 나름대로 만족하며 활용하고 있습니다.

넷플릭스는 이 추천 알고리즘(문제 해결을 위한 절차)에 여러 데이터를 활용합니다. 시청자의 그룹을 나누고, 패턴을 분석하고, 방대한 콘텐츠를 분류하는 등을 말하죠. 한마디로 정리하자면 바로 '빅데이터'를 활용한다는 것입니다. 넷플릭스만이 아니라 후발주자도 사용하는 기능이죠.

넷플릭스는 빅데이터를 적극적으로 활용한다는 점으로 유명합니다. 추천은 물론이고 제작에도 써먹죠. 자체 제작 드라마(넷플릭스 오리지널)인 정치 드라마 '하우스 오브 카드'가 대표적인 사례입니다. 주목받을 만한 작품(하우스 오브 카드는 영국 소설이 원작입니다.)과 시청자가 좋아할 만한 연출자, 배우를 선정하는 데 빅데이터의 도움을 받은 것이지요. 결과적으로 대성공. 오늘날의 넷플릭스를 만드는 일등 공신이 됐습니다.



◆ '방대'하고 '다양'한 데이터를 '빠르게'

앞서 몇 차례 '빅데이터'라는 단어를 언급했습니다. 그렇다면 대체 빅데이터가 무엇일까요? 말 그대로 방대한 양의(BIg) 데이터(Data)입니다. 그 특징으로 흔히 '3V'를 꼽는데요, 바로 규모(Volume), 속도(Velocity), 다양성(Variety)을 말합니다.

우리가 운전할 때 쓰는 내비게이션으로 예를 들어보죠. 길만 알려주는 게 아니죠. 도로 상황을 분석해 추천 경로를 알려주고, 우회 도로도 안내해줍니다. 이를 위해선 현재 도로를 다니는 무수히 많은 자동차의 운행 정보(규모)를 수집해, 빠르게(속도) 뒤 차량에 알려줘야 합니다.(데이터를 분석하는 데 한 시간이 걸린다면 도로 정보에 아무 의미도 없겠죠.) 또, 정확한 안내를 위해선 앞 차량의 운행 정보는 물론이고, 경찰이나 제보 등도(다양성) 활용해야겠죠. 이 가운데 하나라도 빠지면 지난해 폭우 사태로 교통이 통제됐을 때처럼, 내비게이션이 제 역할을 하지 못하고 도로가 대혼란 상태가 될 겁니다.

빅데이터 권위자인 조성준 서울대학교 산업공학과 교수는 빅데이터에 대해 '많아도 괜찮아, 빨라도 괜찮아, 다양해도 괜찮아'라고 설명합니다. 방대하고, 빠르고, 다양한 데이터라도 소화할 수 있는 기반이 기본적인 조건이라는 것이지요.

◆ 무궁무진한 가능성의 '빅데이터'

빅데이터는 다양한 영역에서 활용됩니다. 직원 채용도 물론이죠. 유명한 것은 미국의 사무기기 제조 회사인 '제록스'입니다. 콜센터 직원을 선발하면 초기 교육비가 들어가겠죠.(=비용) 하지만 직원의 조기 퇴사율이 높아 고민하던 제록스는 이력서와 적성검사 데이터를 분석하기 시작합니다. 그 결과 특정한 성격 유형에 속하는 사람이나 집이 회사에서 먼 사람 등의 조기 퇴사율이 높다는 점을 발견했죠. 이를 이용해 신입 사원을 추려냈더니 조기 퇴사율이 20% 줄었다고 합니다. 사실 지금 거의 모든 기업이 진행하는 적성검사 역시 이런 측면과 유사합니다.

빅데이터는 인공지능, AI(Artificial Intelligence) 시대의 핵심이기도 합니다. 요즘 인공지능에는 주로 '기계학습'이라는 기법이 사용되는데요, 막대한 양의 데이터를 입력하고, AI가 이를 통해 문제를 해결하는 방법을 스스로 깨우치도록 하는 방법입니다. 우리에게 유명한 바둑 프로그램 '알파고' 역시 어마어마한 양의 바둑 기보를 통한 학습으로 바둑계에 파란을 일으켰습니다. 요즘은 아예 AI로는 구현하기 어렵다고 생각했던 예술 영역으로까지 차근차근 진출하고 있습니다.

[와이파일] 온택트와 넷플릭스, 그리고 빅데이터


조성준 교수는 OTT 서비스를 예로 들어 "과거 방송은 같은 시간에 미디어 한 개만 전달할 수밖에 없었지만, 이제는 열리면서 시간과 공간의 제약이 사실상 사라졌다"며 "서비스와 그 데이터를 이용한 파생 서비스가 개인화될 기반이 생긴 것"이라고 설명했습니다.

◆ 가능성은 있지만…여전히 넘기 힘든 '벽'

빅데이터가 만든 시간과 공간의 제약이 사라진 개인화의 시대. 이 말만 들어도 빅데이터의 가능성이 어마어마할 것이라는 건 쉽게 예상할 수 있을 겁니다. 심지어 제한도 없습니다. 갈수록 더 많은 양의 데이터가 더 빠르게 만들어지니까요. 영토에 제한이 없는 셈이죠. 그런데 국내에선 여전히 빅데이터 산업이 걸음마 단계에 멈춰 있습니다. 규제가 가장 큰 걸림돌입니다.

규제 수위를 낮추는 데이터 3법이 국회 문턱을 넘기 전 한국은행 관계자를 만난 적이 있습니다. 이 분이 재미있는 말씀을 하시더군요. 내부에서 빅데이터 활용 방안을 찾고 있는데(한국은행에선 국내 경제와 관련한 다양한 통계를 집계합니다.) 쉽지 않다고. 개인정보 보호법에 막혀서 통계청으로부터 원본 자료를 받지 못한다는 겁니다. 국가 기관이 이런데, 민간 기업은 어떨까요. 지금은 데이터 3법이 통과됐지만, 글쎄요. 크게 상황이 달라진 것 같지는 않습니다.

최근 생명보험협회에서 기자간담회를 열었습니다. 정희수 협회장은 보험 상품 개발 등을 위해 공공 의료 데이터를 활용할 수 있도록 해달라고 호소했죠. 과거 보험사는 국민건강보험공단과 건강보험심사평가원이 가진 공공 의료 데이터를 받아 상품을 개발해 왔습니다. 하지만 2017년 이후 의료 데이터 제공이 중지됐죠. 데이터 3법이 처리됐지만, 아직 의료 데이터를 받아보진 못하고 있습니다.

데이터가 없다면 어쩔 수 없는 노릇이지만, 방대한 양의 데이터가 이미 국가 기관에 있어도, 규제의 벽에 막혀 여전히 잠에서 깨어나지 못한 셈이지요.

조성준 교수는 "데이터 3법 이후 빅데이터 활용이 예전보단 다소 개선됐지만, 여전히 현장에선 체감하기 어려운 경우가 많다"며 "가명화한 자료를 누가 관리하고 어떻게 가명으로 만드는지도 논란거리"라고 지적했습니다.

시민단체인 '규제개혁 당당하게'의 대표 활동가인 구태언 변호사는 "해당 산업이 제대로 시작하기 전에 적용됐던 사전 규제가 데이터 3법으로 어느 정도 해소됐다"면서도 "여전히 활용에 제약이 많아 이미 다량의 데이터를 보유한 대기업에 유리하고 스타트업은 불리한 구조가 고착화하진 않을지 우려된다"고 지적했습니다.


◆ "활용과 규제 사이의 절묘한 줄타기 필요"

다만 개인정보 보호의 중요성도 잊어선 안 되겠죠.

뉴욕타임스에 실렸던 기사를 인용해보겠습니다. 한 남성이 슈퍼마켓을 찾아 항의했습니다. 자신의 고등학생 딸에게 유아용품 할인 전단이 온 것이죠. 왜 고등학생에게 이런 전단을 보내 임신을 부추기느냐고 항의한 남성. 슈퍼마켓 매니저는 남성에게 사과한 뒤 며칠 뒤 다시 전화를 걸었습니다. 한 번 더 사과하기 위해서죠. 그런데 뜻밖의 대답이 돌아왔습니다. 반대로 사과를 받았거든요. 알고 보니 이 남성의 딸은 진짜로 임신한 상태였습니다. 부모도 모르는 사실을 슈퍼마켓이 알고 있었던 거죠.

어떻게 알았을까요? 이 슈퍼마켓은 빅데이터를 이용해 고객의 구매 행태를 분석하고 있었거든요. 이를 통해 고객 중 임신한 것으로 추정되는 여성을 가려 전단을 보냈던 것입니다. 빅데이터가 얼마나 유용한지를 보여주지만, 다소 섬뜩한 느낌을 주는 것도 사실입니다. 얼마든지 악용될 수 있다는 점을 강력히 암시하고 있기 때문이죠.


무한한 가능성과 무한한 위험성을 동시에 가진 것이 빅데이터입니다. 위험성만 고려해 찍어 누르기에는 잠재력이 너무 아깝죠. 앞서 가는 외국 사례와 비교하면 우린 여전히 갈 길이 너무나 멉니다. 반면 가능성에만 집중하다 보면 빅데이터가 어느 순간 조지 오웰의 '1984'에 나오는 '빅 브러더'가 될 수 있습니다. 이 중심을 잡아야 하는 것은 입법 권한을 가진 국회입니다. 아쉽게도 지금까지 빅데이터를 둘러싼 국회의 움직임에는 빅데이터 규제론자도, 규제 완화론자도 만족하지 못하는 것 같습니다. 새로운 가치를 창출하기 위한 국회의 정책적인 역할을 기대해 봅니다.

조태현[choth@ytn.co.kr]


[저작권자(c) YTN 무단전재, 재배포 및 AI 데이터 활용 금지]