‘It’s DATA, Stupid!’ 

빌 클린턴 대통령의 유명한 한 마디인 문제는 경제야!’를 살짝 바꿔 봤습니다. 데이터 없이는 보고도, 의사결정도 하기 어려울 정도로 데이터의 중요성은 증대되고 있습니다. 하지만 막상 어떻게 데이터를 수집하고, 어떻게 분석하며, 어떻게 인사이트를 도출할지 고민이 많습니다. 게다가 인공지능의 시대에 더 막연한 과제가 되었습니다.

SKT Data Analytics를 이끌고 있는 정도희 그룹장에게 인공지능 시대에 어떻게 데이터를 가치 있게 활용할 수 있을지에 대해 들어봤습니다.

 

Data

데이터 기술을 비즈니스에 적용하여 업무를 개선하고 혁신하는 데이터 기술 응용 전문가’. ‘Data Business-Person’을 이렇게 정의할 수 있습니다. 데이터 기반 의사결정과 업무 수행은 중요합니다. 더 많은 Data Scientist를 필요로 합니다. 그런데 데이터에 대한 인식 차이가 존재합니다. 사람들이 각자 말하는 데이터의 개념 역시 같지가 않습니다.

 

인공지능

인공지능의 명확한 정의가 없습니다. 당연합니다. 인공지능이 할 수 있는 일의 범위가 매일 달라지고 있기 때문입니다. 인공지능의 정의 보다는 그 구성 요소가 더 중요하다고 생각합니다.

 

Ÿ   Machine Learning

Ÿ   Natural Language Processing

Ÿ   Computer Sensing

Ÿ   Robot Engineering

 

자세히 보면 레벨이 다른 것을 알 수 있습니다. Machine Learning을 활용해 할 수 있는 일들입니다. Machine Learning을 한 마디로 말하면, 기계가 데이터로부터무언가를 학습하는 것입니다. 데이터가 없으면 할 수 있는 게 없다는 뜻입니다. 기존의 Programming은 다음의 순으로 진행됩니다. 1) 2)는 사람이, 3) 4)는 기계가 수행합니다. 

1) 처리 방법 만들기

2) 처리 방법 입력

3) 처리

4) 처리 결과 표시 

Machine Learning은 다릅니다. 1)은 사람이 2), 3), 4)는 기계가 수행합니다. 가장 큰 차이는 처리 방법을 만드는 주체가 사람에서 기계로 바뀌었다는 점입니다. 

1) 원하는 결과 데이터 입력

2) 학습해 처리 방법 만들기

3) 처리

4) 처리 결과 표시 

남성 셔츠를 타겟팅 한다고 가정해 봅니다. 마케팅 부서 구성원들의 생각, 경험, 아이디어, 데이터 분석을 모읍니다. 타겟팅 대상 추출을 위한 Rule을 생성합니다. Rule에 따라 타겟팅 대상을 결정합니다. Rule에 벗어난 고객은 버립니다. 문제가 몇 가지 있습니다. 구성원들의 능력이 부족하면 Rule은 빗나갈 수 있습니다. 같은 조건이 반복적으로 통할 가능성은 높지 않습니다.

Machine Learning은 다른 방식으로 타겟팅을 합니다. 성별, 연령, 지역 등 구매 고객 데이터를 Input으로 사용해 학습합니다. 각 속성의 기여도를 숫자로 분석해 Feature (Factor) 를 추출합니다. 전체 고객 데이터에 대해 구매 확률을 계산합니다. Rule에 벗어나는 고객은 없습니다.

Supervised Learning의 예입니다. Training data가 구매 고객의 데이터이므로 Label을 제공했기 때문입니다. Unsupervised Learning의 예는 고객 분류입니다. 정답이 없는 문제를 Clustering 등을 통해 푸는 것입니다. 좌표의 거리를 계산해 가까운 거리에 모여 있는 값들을 모으는 것이 Clustering입니다. , Cluster에 대한 의미 부여는 사람이 합니다.

Reinforcement Learning은 기계가 Task를 잘 수행하면 보상을 하는 것입니다. 기계가 진화하며 이상적 행동을 학습하게 됩니다. 바둑의 경우 이기는 착수를 하면 (+) 점수를, 지는 착수를 하면 (-) 점수를 주는 것입니다.

 

인공지능 시대의 일하기

인공지능 기술은 앞으로 더욱 빨리 범용화될 것입니다. 기술을 배우고 적용하는 것이 어려운 것은 아닙니다. 관건은 기존의 일하는 방식을 뛰어넘는 것입니다. 사람들은 자신이 합리적이라 오해하기도 합니다. 조직을 바꾸기도 쉽지 않습니다.

데이터 하면 대부분 기술적 데이터 분석 Descriptive Data Analysis 를 생각합니다. 기술적 데이터 분석이 전부는 아닙니다. 가설을 찾아 나가는 탐색적 데이터 분석 Exploratory Data Analysis , 예측 분석도 활용할 수 있습니다. 데이터와 분석. 떨어질 수 없는 단어입니다. 분석만으로 Transformation을 할 수는 없습니다. 데이터의 활용을 통해 데이터의 가치를 높이고, 프로세스를 변경할 수 있도록 해야 합니다.

 

Implication

항상 의심하고 비판적 사고를 유지하기 

데이터를 잘 활용하고 의미를 도출해 보는 과정이 의심하는 좋은 방법이라는 의미로 들렸습니다. 데이터가 만능은 아닐지라도, 우리가 업무를 수행하고 의사결정을 하는 방향성을 변경할 필요가 있다는 사인을 줄 때 간과하지 않고 살펴 보는 자세가 인공지능 시대의 데이터 활용법이라는 생각이 들었습니다.



티스토리 툴바