이제 지난번 이야기에 이어서 한창 이야기가 많이 나오고 있는 빅데이터에 대해서 두번째 이야기를 해볼까 합니다.
지난번에 빅데이터 이야기를 하면서 어쩌면 잠깐 언급 했었는지는 모르지만 우리는 유행이라는 측면에서 자유롭지는 못하기에, 최근 AI가 유행하면 AI에, 빅데이터가 유행하면 빅데이터에, 딥러닝이 유행하면 딥러닝에 관심을 갖게 되는 것 같습니다.
하긴, 뭐 대중에게 이런 관심과 흥미를 일으킨다는 것도 어떻게 보면 마케팅의 일환이므로 잘못되었다는 생각을 갖고 있다는 이야기는 아닙니다. 하지만 중요한 것은 너무나 흥미위주로 이야기가 나오다 보니 그 실체보다는 만들어진, 흘러다니는 이야기로 인해서 잘 못 판단하는 경향이 많다는 점이 어쩌면 전문적으로 마케팅과 소비자를 이해하는 직업을 갖고 있는 사람으로서는 좀 불편한 부분이 있다는 것이죠.
우선, 지난번 8번째 이야기에서 나온 내용들이 많은 부분 맞는 내용도 있고, 또 어떻게 보면 좀 딱 맞지 않는 내용도 있습니다. 앞서 이야기 했던 딥러닝을 한번 볼까요?
음... 우리는 딥러닝이 이제는 세탁기와 냉장고 청소기 에어컨 등에 적용되는 시대에 살고 있습니다. 하지만 정말 이런 제품들에도 딥러닝이 필요한 걸까요?
아.. 물론 필요없다는 이야기는 아닙니다. 정말 되면 좋은거죠.. 하지만 현재 정말 딥러닝이 되는가 하는 부분에 있어서는 의문이 많이 가는 상황입니다.
어쩌면 마케팅의 측면에서 소비자들이 어디서 들은 듯한 기능을 넣었다는 혹세무민의 기법으로 사용되는 일들이 많을까 우려하는 것 일 뿐입니다. 물론 LG전자야 그렇게 하시지는 않았을 것이라고 믿습니다.
이런 Deep Learning만이 아니라.. 빅데이터의 세계에도 많은 사례들이 나오고 있습니다. 실제로 빅데이터를 사용하는 입장에서도 아니면 또 빅데이터를 만들고 다루고 제공하는 입장에서도 많은 준비와 학습이 필요할텐데 또 그 조건과 환경이 엄청나게 복잡하고 엄격해야 믿을 수 있을텐데 과연 그것이 잘 진행될 수 있을까요?
제가 너무 부정적인 관점에서 이야기 하는 것 같아서 제가 AI, 딥러닝, 빅데이터에 대해 부정적인 빅브라더의 출현을 걱정하는 사람중의 한명인것 처럼 오해하지는 말아주시기 바랍니다. 저는 그런 충분한 자료를 토대로 고객을 이해하고 소비자의 행동을 예측하는데 있어서 누구보다도 열린 마음으로 분석하고 공부하고 적용하는 것을 좋아하는 사람입니다. 단지, 그럴듯 하지만 실제로 그렇지 않은 부분에 대해서 너무 사람들을 우습게 보는 많은 매체와 기고하시는 분들이 있을까봐 걱정스러운 부분들이 있을 뿐입니다.
빅데이터는 사실 정부와 공공기관처럼 모든 인적인 자료와 사용자료를 축적하고 관리할 수 있는 단체 그리고 전체 국민을 대상으로 수집하는 자료에 대해서는 그 실용성이 어느정도 검증되어지고 있는 것이 사실입니다.
하지만, 실무를 하는 입장에서 대표님이나 높으신 분들이 갑자기 오셔서 이젠 딥러닝의 시대~! 그리고 빅데이터의 시대인데 도대체 우리 회사는 그렇게 많은 데이터가 있는데 어디다 그 데이터를 사용하고 있는거야?! 시대에 뒤떨어지지 않으려면 그런 기술발전의 조류를 따라서 가야 하는거 아닌가?!! 이렇게 닥달을 하시면 참으로 곤란할 경우가 많이 있습니다.
예를 들어보면, 저희 회사가 영화관이라고 치고.. 영화 예매를 하는 고객들이 들어옵니다. 그 고객들의 정보는 남/여, 연령, 생일, 그리고 전화번호, 이메일, 주소(정확하지는 않지만)등이 있죠 그 분들이 인터넷에 접속해서 티켓을 예매합니다. 자.. 이렇게 예매를 하면 어떤 카드를 사용하셨는지 그리고 어떤 경로로 예매를 하셨는지(로그데이터가 발생하니까) 얼마나 자주 영화를 보시는지, 언제 보시는지, 몇 명이서 보시는지 등등등의 데이터가 쌓이게 됩니다.
자... 그럼 이제 어떻게 이 데이터를 이용해야 할까요? 음... 우리는 고객이 남기신 정보를 가지고 그 분을 예상하고 이미지를 그리게 됩니다. 이 고객은 몇명을 기준으로 예매하는 구나... 이 카드를 주로쓰네... VIP등급이 되는걸보니 엄청 많이 영화를 보는 사람이구나.. 머 이런 내용이죠.. 근데.. 이데이터는 빅데이터 일까요? 아닙니다.. 사실 이런 데이터는 빅데이터가 아니고 CRM데이터 입니다.
빅데이터 만큼 데이터양이 많지 않죠... 그건 그렇다 치고, 이 정보들은 이 고객의 활동을 모두 담고 있는 정보가 아닙니다. 보통 일반적으로 영화관의 평균 관람회수는 약 3회 정도 되지만 우리 영화관에 오시는 이분이 보시는 영화가 연간 1회라고 해서 1회만 보시는 지는 알 수 가 없죠.. 흠... 게다가 몇명이 보는지도 다른 영화관에 가실 때와 다르게 할 수 도 있고 카드도 여러장 있을테니.. 음... (확신이 안됩니다.)
결국, 우리는 빅데이터에... 근처도 못가본 자료를 그럴듯 하게 윗분에게 보고 드리는 상황을 또다시 연출하게 됩니다. 카드회사들이 가지고 있는 빅데이터가 참 많은 데이터가 있는데요.. 어쩌면 유통업체에서 갖고 있는 데이터도 그렇죠.. 생선한마리 산 것 까지 데이터가 있으니까요... 하지만 실제로 사용하는 일은 너무나 어렵고 험란합니다.
왜냐? 그 사람의 행동을 얼마나 반영하고 있는지 모르기 때문이죠... 전체 사용, 전체 구매 중에서 고객이 그 매장에서만 그 카드로 얼마를 사용하는지를 정확하게 모르는데 고객의 특성을 반영한다고 누구도 이야기하지 못합니다. 그런데 그럴듯 하게 보고서는 내야하니 미치고 팔짝 뛸 일이죠..
제 은사께서, 얼마전에 유통데이터(할인점)를 얻으셨다고 좋아하시던데(제 은사님은 유통부문에서 유명하신 교수님 이시거든요) 실제로 얼마후에 분석할 내용이 거의 없다고 하시며 그냥 기본 데이터 외에는 사용하기 어렵다는 말씀을 하시더군요..
오늘의 결론은, 물론 빅데이터도 중요하고 AI도 중요하지만 내용을 잘 이해하고 자신의 사업에 기업에 어울리는 자료로서 활용할 수 있도록 해야하고 혹세무민하는 무서운 날강도들을 조심해 보자.. 라는 이야기를 하고 싶었습니다.
그럼, 가지고 있는 자료를 통해서라도 소비자를 더 잘 이해할 수 있도록 노력하는 한주간이 되시길 바랍니다.
야갤이 윤태 작가님의 더 많은 글 '보러가기'