사용자 삽입 이미지
“하둡은 Ad-Hoc 쿼리 구현이 어렵고 실시간 분석에 적합하지 못했고, NoSQL은 복잡한 형태의 데이터 분석이 어렵다는 단점이 있었습니다. 이 때문에 그린플럼 DB에 주목하게 됐고, 이들을 효율적으로 함께 사용할 수 있는 방안을 고려하게 됐죠.”

국내 대표적인 인터넷 서비스 기업인 다음커뮤니케이션은 다양한 오픈소스를 활용하기로 유명합니다. 최근 화두가 되고 있는 빅데이터 분석에 있어서도 마찬가지입니다.

다음은 이미 지난 2009년 대용량의 데이터를 활용해 검색 품질을 높이기 위해 하둡과 NoSQL을 도입했으며, 지난해부터는 EMC의 그린플럼을 도입해 다차원, 심층적 분석을 가능하게 했다고 합니다.

다음커뮤니케이션 데이터기술팀 엄준식 팀장은 최근 한 컨퍼런스에서 그런플럼을 활용한 자사의 빅데이터 적용 사례에 대해 발표했는데요.(공교롭게도 같은날 검색품질팀에서는 또 다른 개발자 컨퍼런스에서 하둡을 활용한 사례에 대해서 발표했군요)

그에 따르면 다음은 지난해부터 정형데이터와 비정형데이터가 혼재된 웹 로그의 빠른 통계 분석을 위해 대용량 데이터 병렬처리 플랫폼인 ‘하둡’과 비관계형 데이터베이스(DB) ‘NoSQL’을 분석 플랫폼인 ‘그린플럼’과 연동하는 프로젝트를 시작했는데요.

처음에는 하둡과 NoSQL 만으로 이를 모두 구현하려고 했으나 하둡의 경우 Ad-Hoc 쿼리 구현이 어려워 개발자들의 역량이 많이 필요했고, 데이터 처리에 초점이 맞춰져 있다보니(배치지향 프러임워크) 실시간 데이터 분석에는 적합하지 못했다는 것이 그의 설명입니다

또한 NoSQL은 복잡한 형태의 데이터 분석이 어렵고, 특정 조건에 부합하는 솔루션 선택이 중요하는 등 지속적인 리뷰 필요가 필요한 솔루션이라고 판단했다고 밝혔습니다.

그러던 와중에 그린플럼 데이터베이스에 주목하게 됐는데, 이는 우선 포스트그레SQL와 대규모병렬처리(MPP) DBMS이 통합된 우선 오픈소스 DB이고 데이터웨어하우징(DW)과 비즈니스인텔리전스(BI) 기능이 포함됐다는 것이 장점으로 꼽혔다는 설명입니다.

그는 “웹 서버의 모든 로그 데이터를 하둡과 NoSQL로 1차 집계, 처리하고 이를 다시 그린플럼으로 저장, 분석해 심층적이고 다차원적인 분석이 가능하도록 구성했다”고 설명했습니다.

우선 정형데이터(RDB)와의 및 NoSQL 솔루션인 스톰과 카산드라, 하둡과의 연동을 통해 1차 집계된 결과를 그린플럼으로 보내 다차원 심층 분석을 가능하게 했는데 이를 통해 실시간 콘텐츠 검색 결과에 대한 집계에 가능하게 됐다는 분석입니다. 이렇게 가공된 데이터는 현재 다양한 서비스의 고객 성향 분석과 마케팅에 활용하고 있습니다.

그는 “그린플럼의 병렬처리 기능을 통해 빅데이터를 빠른 시간에 로딩 및 통계처리가 가능하게 됐고, 무엇보다 그동안 사용했던 SQL을 그대로 사용하면서 데이터 분석이 가능해졌다”고 강조했습니다.

특히 그린플럼의 경우 x86 서버만으로 구성이 가능한데, 다음은 기존에 사용하던 x86 서버를 활용해 상대적으로 저렴한 비용 및 고확장성의 분석 시스템 구축이 가능했다고 밝혔습니다. 추후 데이터양이 늘어나더라도 x86서버만 추가하면 되기 때문에 손쉽게 용량 확장이 가능하기 때문입니다.

한편 그는 이를 위해선 무엇보다 인력 확보가 중요하다고 강조했습니다.

엄 팀장은 “최근 많은 기업이 빅데이터 이슈를 놓고 고민하고 있는데, 우리과 같이 데이터 사이즈가 많은 기업이라면 하둡과 NoSQL의 연동을 생각할 수 밖에 없을 것”이라며 “다만 이때 놓쳐서는 안되는 것이 이러한 기술들은 계속해서 변하기 때문에 이를 지속적으로 리뷰할 수 있는 인력 확보가 중요하다”고 말했습니다.

이어 그는 “확보한 인력에 대해서도 잘 보존, 유지하는 것이 필요하며 만약 이것이 쉽지 않고 데이터양이 많지 않다면 차라리 어플라이언스 형태로 도입하는 것도 고려하라”고 덧붙였습니다.

이밖에도 그는 “빅데이터 분석을 위해선 부서 간, 구성원 간 협업이 중요한데, 이를 위해 협업 솔루션을 도입하는 것도 검토하라”고 조언했습니다. 현재 다음의 경우, EMC의 협업솔루션인 코러스를 리뷰하고 있다고 밝혔습니다.
2012/11/19 15:45 2012/11/19 15:45
사용자 삽입 이미지

기업용 외장형 스토리지 선두 업체로 잘 알려져 있는 EMC의 인수합병(M&A) 행보가 무섭습니다.

지난 6일(미국 현지시간) EMC는 데이터웨어하우징(DW) 전문업체인 그린플럼을 인수하면서 관련 시장에서의 변화를 예고하고 나섰습니다.

EMC는 그린플럼의 소프트웨어 기반 DW 어플라이언스 제품을 자사의 하드웨어 및 솔루션과 결합해 통합 제공하겠다는
방침입니다.

특히 기업 내부에 구축되는 프라이빗 클라우드 컴퓨팅 내에서 관리되고 있는 대용량 데이터 처리를 위한 다양한 솔루션을 구비해, 진정한 정보 인프라스트럭처 제공업체로 굳혀 나가겠다는 야심으로 보입니다.

그동안의 EMC 인수합병 행태를 살펴보면, 추구하고 있는 방향이 매우 일관됨을 알 수 있습니다.

지난 2003년 백업 및 아카이빙 소프트웨어 업체인 레가토 시스템즈를 인수한 데 이어 다큐멘텀과 VM웨어를 인수하며 콘텐츠 관리 및 가상화 솔루션을 확보했으며, 그 이후에 스마츠, 레인피니티, 캡티바, 카샤 등을 잇달아 인수합병했습니다.

이윽고 2006년에는 보안업체인
RSA시큐리티를 비롯해, 데이터중복제거 업체인 아바마테크놀로지스, 네트워크 인텔리전스 등을 인수했지요.

또 작년에는
중복제거솔루션업체인 데이터도메인와 소프트웨어 플랫폼 및 솔루션 전문업체인 패스트스케일 테크놀로지를 인수했고, 올초에는 버넌스·리스크관리·컴플라이언스(GRC) 업체인 아처 테크놀로지스를 먹어삼켰습니다.

여기에 최근 그린플럼을 추가하며 그야말로
정보(데이터)가 있는 곳에 EMC 제품이 있다는 자사의 캐치 프레이즈를 여과없이 보여주고 있습니다.

이처럼 EMC가 단순히 스토리지를 판매하는 하드웨어 업체에서 벗어나 소프트웨어 및 서비스 업체를 꾸준히 인수하는 이유는 전사적인 정보 인프라스트럭처 기업으로 포지셔닝함에 따라, 클라우드 컴퓨팅 시장에서 견고하게 자리잡기 위함으로 보입니다.

물론 자체의 소프트웨어 기술 개발도 이어지고 있지만, 적극적인 인수합병이 기술확보에 큰 기폭제로 작용하면서 관련 시장에서 주도권을 잡아가고 있는 것이지요.


지난 2000년까지 EMC는 단순 스토리지 박스만을 팔던 회사였지만, 최근 관련 매출 비중은 점차 낮아지고 있으며, 소프트웨어, 서비스 매출 비중이 하드웨어를 뛰어넘은지 오래입니다.


그렇다고 하더라도 여전히 EMC 포트폴리오의 근간은 스토리지 제품이며, 인수나 자체 개발하는 소프트웨어는 이를 지원하는 개념으로  이른바  

‘풀 패키지’ 개념으로 고객사에 제공하고자 하는 의지가 매우 강하다고 할 수 있겠습니다.


EMC가 지난 2003년 이후로 기업 인수합병에 투자한 금액이 현재까지 110억 달러 이상이라고 하니, 가히 그 규모를 짐작할 만 합니다.

EMC의 현재 시가총액이 약 390억 달러인 점을 감안하면  만만치 않은 비용이죠.


EMC의 M&A는 여전히 현재 진행형으로 보입니다.

관련 솔루션이나 보안 등 스토리지 및 정보관리의 핵심 기술이나 핵심사업 분야를 보완할 수 있는 분야에 대한 인수·합병은 지속적으로 추진한다는 것이 EMC의 M&A 전략이니까요.

예전에 만났던 한 EMC 본사 임원은 “EMC는 모든 고객에 대해 저장, 관리, 보호, 공유라는 4가지 측면에 초점을 맞추고 있으며, 이 4가지를 근거로 관련 기술 개발 및 인수작업을 진행한다는 것이 원칙”이라고 말한 바 있습니다.

인수를 하더라도 RSA시큐리티나 VM웨어처럼 독자적인 비즈니스를 수행하거나, 때에 따라 EMC와 통합 운영하면서 시너지를 내고 있지요.

한편 업계에는 EMC 스스로가 인수합병 대상이 될 수도 있다는 루머도 심심찮게 나돌고 있습니다.


현재 긴밀한 협력관계에 있는 델이나 시스코, 오라클 등과의 인수합병 소문이 그것인데요. 그러나 이미 덩치(?)가 너무 커져버린 만큼, 쉽지가 않을 것이라는 얘기들이 주를 이루긴 합니다.

먹느냐, 먹히느냐. 엔터프라이즈 시장에서의 인수합병(M&A) 행보는 계속해서 관심 대상이 되고 있습니다.
2010/07/08 16:48 2010/07/08 16:48