druid 예제


0 Flares Filament.io 0 Flares ×

MongoDB에 있는 데이터가 마이그레이션되었습니다. MongoDB에 저장된 이 데이터는 약 60GB의 디스크 공간을 사용하고 있었고, 드루이드 내부에서 인덱싱되었을 때 동일한 데이터는 600MB만 을 나타냈습니다. 그래. 100배 적은 수납 공간! 저는 약 2년 전에 드루이드(http://druid.io)를 발견했습니다. 드루이드는 데이터를 변경할 수 없는 “세그먼트”에 저장합니다. 세그먼트에는 구성된 기간 동안의 모든 데이터가 포함됩니다. 기본적으로 세그먼트에는 일별 데이터가 포함되지만 더 높거나 낮게 설정할 수 있습니다. 따라서 구성에 따라 세그먼트 세분성이 “day”인 경우 위의 데이터는 단일 세그먼트에 있거나 세분성이 “분”인 경우 두 개의 서로 다른 세그먼트에 있을 수 있습니다. 세그먼트 세분성 옆에는 “쿼리 세분성”도 있습니다. 드루이드에서 데이터가 롤업되는 방법을 정의합니다. 위의 예제를 통해 분석가는 세그먼트의 단일 등록 이벤트가 아니라 집계에 대해 신경 쓰지 않을 수 있습니다. 따라서 쿼리 세분성에 따라 위의 데이터에 대한 다음 결과를 얻을 수 있습니다.

내암시의 사람들은 우리를 위해 이것을 정말 쉽게 만듭니다. 로컬 설정에 대한 빠른 시작 가이드에 따라, 우리는 이러한 명령을 실행해야합니다 : 이 게시물은 드루이드 무엇인지 설명합니다, 당신이 걱정해야하는 이유, 어떻게 작동하는지에 대한 높은 수준의 개요, 시작하고 1 초 미만의 쿼리를 달성하는 방법에 대한 몇 가지 정보 시간! 당신은 또한 내 향후 게시물에 대 한 알림을 내 블로그에 가입할 수 있습니다., 아마 그냥이 게시물 보다 드루이드에 대 한 자세한 이야기, 또한 드루이드 클래스에 대 한 업데이 트를 게시. 그리고 이렇게 우리의 여행을 마무리! 드루이드의 실시간 섭취, 드루이드 의 문의, 드루이드의 문제 해결에 어떻게 활용할 수 있는지 에 대해 한두 가지를 배웠으면 좋겠습니다. 추가 질문이 있는 경우 Google 그룹 페이지에 자유롭게 게시할 수 있습니다. 드루이드는 실시간 스트림 수집 및 초 이하 쿼리를 통해 빠른 데이터 컨텍스트에서 온라인 분석 처리(OLAP) 기능을 약속합니다. 이 포스트에서는 드루이드의 기본 개념을 소개하고 도구의 실천을 소개합니다. 이 자습서에서는 설치 후 드루이드와 함께 제공되는 2015년 위키백과 샘플 데이터 집합을 사용하여 데이터를 드루이드에 저장한 다음 질문에 답하기 위해 데이터를 쿼리합니다. 이 스크립트는 드루이드 대군주에게 수집 작업을 게시하고 데이터를 쿼리할 수 있을 때까지 드루이드를 조사합니다. 데이터 롤업은 저장소 용량을 상당히 절약할 수 있지만 물론 개별 이벤트를 쿼리할 수 있는 기능을 잃게 됩니다. 이제 드루이드의 기본 데이터 구조에 대해 알아보겠습니다.

솔직히 말해서, 드루이드는 “아주 짐승”입니다. 보유하고 있는 데이터의 양에 따라 초 이하의 쿼리 시간을 유지하려면 꽤 큰 인프라가 필요할 수 있습니다. 자습서 패키지에는 빠른 시작/자습서/위키백과 최상위 페이지-sql.json에서 위에 표시된 SQL 쿼리가 포함된 예제 파일이 포함되어 있습니다.