[Session 4] Smart Convergence with Big Data

공공, 비즈니스, 의료, 통신, 물로, 금융 사업과 Big Data와의 만남에 대해 이야기하였습니다.

 

(12) Mobile and PC: Converged Experience, Converged Management
/VMware, Kevin Strohmeyer (Senior Director of Product Marketing for Workspace Services)

사용자 경험, 서비스 활용방안, 관련 정책이 모바일 클라우드 기술 발전 및 보안의 핵심을 언급했습니다.

기업 및 기관의 업무에 개인용 모바일 기기 사용이 보편화 되면서 업무용 기기 뿐만 아니라 개인의 기기에서도 데이터 처리가 확산되는 추세 → 신규사업의 기회

사례 [Home Depot] : 모바일 단말을 통해서 입출고 현황 등 다양한 Business Process 상의 정보를 통합관리하고 있으며, 지점에서는 상품 재고, 위치, 고객 결제내역 등 면밀한 고객 서비스를 제공을 지원하는 Cloud 기반 모바일 솔루션을 도입

 

(13) Battle for the driver seatthe new incar battle field
/ Park TAG, Silvan Rath (CEO) 

자동차 + IT 융합 산업 발전으로 인한 서비스 시장이 활성화될 전망을 예상했습니다.

자동차 제조 업체 (OEM)은 디지털 시대에 대응하기 위해 다양한 데이터 기반 서비스를 계획하고 있으며, MNO 기업 또한 자신들의 M2M 전략을 자동차 산업에 접목하는 움직임

스마트폰과 자동차 연결의 기술 기준 또한 정립되며, 스마트 ‘In-Car’ 서비스 제공자에 우호적인 환경에 들어섬

Spotify 같은 경우 블루투스 기반 뮤직 스트리밍 서비스, Glympse는 네비게이션을 기반으로 한 SNS 서비스, AppLinks Ford社와 협력하여 보이스 인식을 통한 SNS, 라디오, 뮤직 스트리밍 등과 같은 다양한 서비스 컨트롤 기능을 제공

2025년에는 이러한 형태의 스마트폰 기반 서비스를 바탕으로 In-Car 서비스가 발전하여 모든 자동차들이 연결될 전망

 

(14) Utilization of Big Data as Biz. Enabler
/ SK C&C, 이원석 컨설팅 본부장

Big Data는 기술 자체가 아닌 경영 가치향상을 위한 혁신의 도구이며, 기타 ICT 신기술을 접목/활용 기업의 경쟁 우위 확보가 가능함을 중점적으로 언급했습니다.

과거 기업이 제품 및 가격 위주 경쟁 vs. 현재는 과잉 공급, 저성장 장기화 등의 경영환경 변화에 따라 부가가치 경쟁이 심화. 기술 환경 발전함에 따라 Big Data’가 다양한 ICT 트렌드와 접목한 경영 혁신의 도구로 부상

M2M/IoT, Cloud, Mobile과 같은 ICT 신기술이 Big Data와 결합 에너지/화학, 반도체/제조, 통신, 유통 등 다양한 산업 영역에서 활용 가능, 이미 국/내외 선도 기업들은 Big Data를 경쟁 우위 확보의 Biz. Enabler로 활용 중

 (제조 분야) M2M/IoT를 통해 수집한 Machine Data를 분석하여 실시간 공정 운영 모니터링, 장애 예측 및 계획/운영 최적화 등에 활용

 (유통 분야) 고객 경험의 전 Life Cycle을 기반으로 수집된 Data를 분석하여 고객에 대한 심화 Insight 발굴을 통해 마케팅 경쟁력 강화 () 상품 추천, 편의 서비스 제공, 잠재 고객 발굴 등이 기존에 불가능 했던 다양한 마케팅 활동에 활용 가능

 <사진1> SK C&C 이원석 컨설팅 본부장의 세션 발표 모습. Big Data의 비즈니스 활용 측면에 대한 내용으로 구성

 

(15) Big Data & Smart Data

/Daumsoft, 최재원 이사

‘스마트’ 데이터는 양과 품질이 아니라, 왜곡된 데이터를 제거해 분석의 정교함을 높이는 것이 핵심이라고 말했습니다.

Big Data의 양보다 데이터의 가치가 중요함(‘스마트’ 데이터)

스마트 데이터란 단순히 데이터의 품질을 의미하는 것이 아니라, 필터링을 통해 걸러질 수도 있고, 생성부터 데이터의 객관적 유효성을 보장 () 웹 상에서 맛집에 대한 데이터를 긁어 모을 때 식당 분석을 전문으로 하는 파워 블로거 글을 얼마나 차단할 수 있느냐가 결과에 결정적인 영향을 줌

사례 1: 모방송사의 경우 기존에는 SNS, 블로그 등 웹 상에서의 키워드 중심 Buzz 량과, 시청률 상관관계 분석 위주로 이루어졌음. 하지만 이제는 심층분석을 위해 특정 프로그램에 대한 시청자 감성 Point를 찾아 그들이 원하는 감성과 느낌에 대한 예측을 하여 Insight 제공 가능

 

[Session 5] Data Technology and Techniques

다음 세대의 Big Data 플랫폼, 데이터 마이닝, 인공지능, 데이터 시각화 등에 대한 내용이었습니다.

 

(16) Data Processing in the Internet of Things
/ MapR, Martin Darling (Vice President of Asia Pacific/Japan)

스마트’ 데이터는 양과 품질보다, 비즈니스 목적과 니즈에 부합하는 Insight를 제공이 중요함을 역설했습니다.

2020년까지 커넥티드 디바이스의 수는 연간 약 100억 개에 이를 것이며, 500억 개의 연결된 디바이스가 존재할 것으로 예상. 이에 따라 통신 량이 증가하고, 연결 디바이스들은 데이터 인프라 재검토 필요

Big Data PoC(proof of concept)는 거의 모든 종류의 기술을 통해 가능하나, IoT 데이터의 처리 기능은 소프트웨어, 하드웨어 및 네트워크 간의 통합된 접근 방식이 요구됨

이러한 통합된 시스템 없이는 막대한 비용 또는 시간이 소요되며, 이와 같은 문제의 해결은 기업에 적합한 데이터 엔지니어링 인프라 구축으로 가능

<사진2> MapR의 세션 발표 모습 

(17) Trends and Challenges in the Hyper-connected World
/ Akamai, Neil Cohen (VP of Product Marketing)

초연결사회에서 중요한 Big Data 기술은 ‘문제 대응’하는 측면에서 사업기회 포착에 활용해야 합니다.

Akamai는 웹 사이트 상에서 안정적인 인터넷 속도와 보안을 지원해주는 서비스를 제공

. 인터넷 속도 보장

- 온라인 게임, 동영상, SNS 등의 웹 서비스 과정에서 갑자기 사용자가 몰리면 Traffic 과부하가 발생됨

- 세계 각국에 포진되어 있는 여러 IDC 센터를 이용하여 Traffic을 분산처리로 안정적 인터넷 속도 보장

. 웹 공격에 대한 보안

- 디도스 공격처럼 웹 페이지의 취약점을 노린 사이버 공격이 빈번해지고 있음

- Akamai의 분산처리 기술과 고도화된 보안관제 솔루션을 통해 대규모 공격에 대응

Akamai 서비스의 중요성 대두

. 초 연결사회에 진입하면서, 웹 서비스의 비대화

- 웹 서비스에 실리는 Contents의 용량이 커지고 있고, 3rd Party를 통해 들어오는 Contents도 증가

- 고객의 웹 사이트 접근 경로도 복잡해지고 있는 상황

- 이는 웹 서비스의 성능을 저하시키는 요인으로 작용

. 사이버 공격의 수위 강화

- 과거 해커 개개인의 호기심, 재미 차원에서 사이버 공격 vs. 최근 정치적인 목적을 띄면서 공격의 수위 증가, 악의적인 의도 포함

- 공격 방지를 위해서 Big Data 분석과 보안 노하우를 공유 필요(웹 사이트의 모든 접근 모든 데이터에 대응불가)

 

(18) Apache Tajo: Next Generation Big Data Warehouse
/ Gruter Inc, 정재화 (책임 연구원)

하둡 기반의 Big Data Warehouse System Tajo의 발전 방향에 대해 소개했습니다.

Apache Tajo는 강력한 분산처리 능력, 쿼리 최적화 알고리즘 등을 갖춘 하둡 기반의 Big Data Warehouse System으로, 최근 0.9.0 버전 배포

Tajo는 글로벌 오픈소스 재단인 아파치의 최상위 레벨 프로젝트로 등록(http://tajo.apache.org/)되어 있으며, 그루터, 고려대학교, 링크드인(LinkedIn), NASA, 호튼웍스(HortonWorks), 인텔(Intel) 등 다양한 회사의 개발자 참여

Tajo의 아키텍쳐는 크게 Client, Master Server, Catalog Store (DBMS, HC Catalog), 그리고 Slave Server로 구성

아마존 웹 서비스(AWS) 기반의 Tajo 서비스 사례: TaaS (Tajo as a Service)와 개인 클라우드 영역 (TaaS Metastore, Bucket, Cluster (Master/Worker) + User Data)로 구성

 

(19) ARN Application Development
/ Hortonworks, Jeff Markham (Technical Director, APAC)

비정형 데이터를 시각화하여 손쉬운 이해와 신속한 의사결정 추진, 효율적인 시스템을 설계로 데이터 처리 소요 시간을 줄일 수 있습니다.

YARN은 하둡 2.0의 핵심적인 구성요소로써, 배치처리의 제약에서 벗어나, 실시간, 스트림 처리 등 다양한 형태의 작업을 수행 가능 기술

2014 6월 기준으로 맵리듀스, 테즈(Tez), 스파크, 리프(REEF), 스톰, 슬라이더 등 다양한 프레임워크들이 YARN에서 동작

테즈(Tez): 피그, 하이브, 캐스케이딩 등 다양한 언어의 맵리듀스를 대체하여 응답시간을 줄이고, 시간당 처리 용량 증가

리프(REEF): 서울대학교의 전병곤 교수팀이 마이크로소프트, UCLA 연구팀과 함께 만든 기계 학습, 그래프 처리, 실시간 처리용 YARN 기반 프레임워크

슬라이더: 장기 생존 응용프로그램을 쉽게 하둡에서 돌릴 수 있는 프레임워크로, HBase, 아큐뮬로, 스톰, JBoss 등 다양한 기존 응용프로그램들을 지원

 <사진3> 컨퍼런스 행사장 입구. 주위에 각 사의 제품을 소개하는 전시부스도 마련됨

 

[Implication]

첫째, Big Data 산업의 고부가 가치 주목 및 공공 및 민간 분야의 데이터를 활용한 신규 사업기회를 적극적으로 모색해야 합니다. 또한 양질의 데이터를 많이 확보하고 이를 Biz. Process 와 연결하는 것이 중요하며, 데이터 수집 뿐만 아니라 기업들은 그 데이터를 어떻게 활용하여 어떠한 결과를 창출해낼 지에 대해 고민해야 할 것입니다. Big Data 기술은고객의 근원적 문제점을 해결하고, ‘고객사의 Biz Value를 주는 것을 목표로 삼아야 합니다.

둘째, 국내 및 해외 Big Data 시장의 활발한 교류 및 진출이 필요하며 국내외 Big Data 관련 사업을 한 곳에 모을 수 있는 Market Place가 필요합니다.

셋째, 데이터 활용과 더불어 보안(Security), 개인 정보 보호(Privacy)이슈에 대한 기준, 규정 수립이 필요하며 기업의 적극적인 참여가 뒷받침되는 것을 기대합니다.

넷째, Big Data 산업에서는 가치 창출을 위한 업체간 전략적 제휴가 필요하며, 제휴 방향성의 기준은고객의 요구와 가치 극대화라고 할 수 있습니다.