전통문화대전망 - 전통 미덕 - 실천사례 | 알리바바 원데이터를 활용해 데이터 지표 시스템을 구축하는 방법은 무엇인가요?

실천사례 | 알리바바 원데이터를 활용해 데이터 지표 시스템을 구축하는 방법은 무엇인가요?

서문:

OneData를 설립하기 전에 Alibaba Data에는 30,000개 이상의 지표가 있었는데, 그 중 동일한 이름이더라도 정의가 일치하지 않았습니다. 이는 중견기업의 경우에도 마찬가지입니다. 데이터의 양이 늘어나면 지표체계 없이 관리하면 다양한 문제가 발생하게 됩니다.

1. 비표준 지표로 인한 문제

데이터 지표의 개념 = 0이면 사업 측에서 "내 생각"에 따라 일을 수행하므로 측정하기가 어렵습니다. 그 효과.

제품 디자인 및 운영 학생들은 일반적으로 다음과 같이 말합니다. 우리가 출시한 이 새로운 기능을 사용자들이 좋아할 것 같고, 새로운 활동이 매우 효과적일 것이라고 생각합니다... 그러면 리더는 다음과 같이 묻습니다. "느낌"의 기초? 사용자가 이 새로운 기능을 좋아하는지 여부를 측정하는 방법은 무엇입니까? 활동이 효과적인지, 얼마나 많은 사람이 참여했는지, 얼마나 많은 전환이 이루어졌는지 판단하는 방법은 무엇입니까?

그런 질문을 받으면 디자이너들은 사실 헷갈리고 헷갈리는데요, 왜 디자인을 했는지는 묻지 마세요. 그냥 다른 경쟁 제품에도 이 기능이 있으니 우리도 한다고만 대답하면 되는데... 당신도 속은 것 같나요?

그러나 많은 제품 관계자들은 전통적인 블라인드 디자인과 표절 디자인의 시대가 지나고, 디지털 제품의 시대가 도래했음을 깨닫고 데이터 지표를 활용하기 시작했다. 비즈니스 결정을 지원합니다. 그래서 다음 단계에 돌입하기 시작했는데...

이때 데이터 지표 개념=0.5, 단일 포인트 데이터 지표는 있지만 전체적인 비즈니스 문제를 보기는 어렵다.

이 경우 우리는 일반적으로 떠오르는 비즈니스 지표를 무엇이든 사용합니다. 예를 들어 Shence와 Umeng 데이터 분석 제조업체는 일반적으로 GMV, 일일 활성 사용자, 월간 활성 사용자, PV, UV, 페이지 체류 시간 등과 같은 데이터를 사용하므로 제품 디자이너가 먼저 복사한 다음 결합했습니다. 때로는 몇 가지 지표를 생각한 다음 하나씩 추가하기도 합니다.

온라인 차량호출을 예로 들면, 오늘날 GMV가 50% 감소한 이유는 무엇입니까? 분석가들은 다음과 같이 대답했습니다. 전염병의 영향으로 승객의 주문 건수가 20% 감소했습니다.

이것이 현재 플랫폼의 지표인데 나머지 30%는 어떨까요? 문제의 원인은 무엇입니까? 그래서 분석가들은 수치를 확인한 결과 온라인 운전자와 주문 접수 운전자의 수가 30% 감소한 것을 발견했습니다. 그래서 그들은 일련의 의사소통과 논의 끝에 서둘러 이 두 가지 지표가 비즈니스에 미치는 영향을 간략하게 설명했습니다. 조정, R&D 팀이 임시 추가되었습니다.

이 접근 방식의 문제점은 무엇입니까? 1) 지표 수정 비용이 높다. R&D팀은 데이터를 재수집, 정리, 저장해야 합니다. 2) 가치 정의가 불분명하고 데이터가 부정확합니다. 3) 지표는 정의기준이 부족하여 다양한 부서에서 이해하기 어렵다. 예를 들어, 이름은 같지만 의미가 다른 경우도 있습니다. 예를 들어, 모두 등록된 운전자라고 합니다. 성공적인 프랜차이즈는 등록된 운전자라는 것입니다. 4) 높은 저장, 컴퓨팅, R&D 비용: 통일된 표준화된 관리가 이루어지지 않아 반복 계산을 위한 자원 낭비가 발생하며, 데이터의 수준과 세분성이 명확하지 않아 반복 저장이 심각합니다.

2. OneData 지표 사양 이해

지표 시스템을 미리 설계하지 않으면 많은 문제가 발생하는데, 지표 본체 디자인 프로세스는 무엇입니까? 표시 시스템의 표준화된 설계를 보장하는 방법은 무엇입니까? 먼저 Alibaba가 지표 사양을 어떻게 공식화하는지 살펴보겠습니다.

이론적 기반으로 차원 모델링을 사용하여 버스 매트릭스를 구축하고 비즈니스 도메인, 데이터 도메인, 비즈니스 프로세스, 메트릭/원자 표시기, 차원, 차원 속성, 수정자, 수정 유형, 기간 및 파생 항목을 정의합니다. 지표. 잠깐.

비즈니스 도메인

: 데이터 도메인보다 고차원적인 비즈니스 분할 방법으로, 특히 대규모 비즈니스 시스템에 적합하며, 비즈니스 부문 간 지표나 비즈니스의 중복이 적습니다. 예를 들어 자동차 사업 부문에는 여객 터미널과 운전자 터미널이 포함되고, 전자상거래 사업 부문에는 쇼핑몰과 리베이트 모듈이 포함됩니다.

비즈니스 프로세스

: 비즈니스 프로세스는 주문, 결제, 평가 및 기타 비즈니스 프로세스/이벤트 등 분리할 수 없는 행동 이벤트로 요약할 수 있습니다. 여기의 이벤트는 매장된 이벤트와 유사합니다. 자세한 내용은

"매장된 이벤트 디자인"을 참조하세요.

이 일련의 용어를 본 후 많은 사람들이 혼란스러워할 수 있습니다. 간단히 말해서, 다양한 비즈니스를 분류하는 것입니다. 비즈니스 프로세스도 이해하기 쉽습니다. 이는 비즈니스 흐름도를 그리는 것과 같습니다.

그렇다면 데이터 도메인은 누구입니까?

데이터 도메인

: 밀접하게 관련된 데이터 주제의 모음입니다. 이는 비즈니스 개체에 대한 고도로 일반화된 개념 수준 분류입니다. 간단히 말해서 데이터 도메인은 데이터를 저장하기 위해 컴퓨터 바탕 화면에 다른 폴더를 만드는 것과 유사합니다.

치수, 치수 속성 및 수정 사항을 어떻게 이해합니까? 그것은 무엇에 사용됩니까?

차원

: 비즈니스의 속성 유형을 반영하는 데 사용되는 측정 환경입니다. 언제, 어디서, 어떤 수준인지 보세요.

측정기준 속성

: 측정기준 속성은 측정기준에 속하며 측정기준의 특정 설명과 동일합니다. 예를 들어 사용자 측정기준의 성별은 남성 또는 여성입니다.

수정자

: 통계 차원 이외의 지표에 대한 비즈니스 시나리오를 나타냅니다.

수정 유형

: 수정자의 추상적 구분.

간단히 말해서 차원과 수정은 원자 표시기의 일부 제한 조건으로 이해될 수 있습니다. SQL을 아는 사람은 일반적으로 SQL을 작성할 때 where 문 뒤에 배치됩니다.

지표/원자적 지표

: 원자적 지표는 지표와 동일한 의미를 갖습니다. 특정 비즈니스 행동 이벤트에 따른 지표는 등록 수와 같이 비즈니스 정의에서 분할할 수 없는 지표입니다.

기간

: 지난 30일, 자연 주, 현재 날짜 등 데이터 통계의 기간 또는 시점을 명확히 하는 데 사용됩니다.

지표 유형

: 원자 지표와 파생 지표가 포함됩니다. 원자 표시기 = 행동 이벤트 + 측정 파생 표시기 = 하나의 원자 표시기 + 여러 수정자 + 기간

예: 원자 표시기 = 완료된 주문 수, 파생 표시기 = 과거에 iOS 승객이 완료한 주문 수 기간 = 거의 1주, 수정자 = iOS, 차원 = 승객, 원자 표시기 = 완료된 주문을 포함합니다.

3. 자체 지표 시스템 사양 개발

다음으로 Alibaba의 onedata 데이터 표준을 참조하여 온라인 차량 호출 시스템에서 데이터 지표를 구축합니다.

사업배경: 차량호출 사업은 전체 온라인 차량호출 사업의 핵심으로, 지표에 대한 정의가 불규칙하여 사업측에서 새로운 지표를 제시하는 경우가 많습니다. , 기술적인 수정이 어려운 문제로 현재 사업 전반의 관점에서 지표체계를 재구축할 필요가 있습니다.

사업 목표: 지표 시스템을 표준화하고 지표 추출 효율성을 향상시킵니다.

조치: 지표 시스템 구축 과정에서 첫 번째 조치는 지표 분류를 명확하게 하고 지표 명명 방법을 제한하여 각 지표를 이름으로 알 수 있도록 하고 커뮤니케이션 비용을 줄이는 것입니다. 건설 지수 시스템을 표준화하려면 Alibaba의 지표 부문을 참조하십시오.

1단계: 비즈니스 요구 사항 조사 및 비즈니스 프로세스 분석

1. 비즈니스 요구 사항 조사

시작하기 전에 적절한 비즈니스 조사는 지표 시스템 구축의 기초입니다. 지표체계구축사업을 위해서는 각 사업주체별로 구체적인 사업을 세부적으로 이해하고 핵심사업프로세스를 정리하는 것이 필요하다.

수요 수집은 정량적 수집과 정성적 수집의 두 가지 유형으로 나눌 수 있습니다. 비즈니스 요구 사항을 광범위하게 수집하기 위해 정량적 설문 조사 설문지를 발행하고, 비즈니스 적용 시나리오와 핵심 요구 사항을 심층적으로 탐색하기 위해 정성적 사용자 인터뷰를 실시합니다. 세부 요구사항 수집 및 분석 방법에 앞서

"요구사항 수집 및 요구사항 분석"

이 글은 이전에 작성한 글이므로 여기서는 더 이상 확장하지 않고 참고용으로 활용하시기 바랍니다. .

2. 비즈니스 프로세스 분석

Alibaba onedata의 모범 사례에 따르면 비즈니스 프로세스는 분할할 수 없는 행동 이벤트로 요약할 수 있습니다. 데이터 간의 논리적 관계와 흐름을 정리하기 위해서는 먼저 사용자의 비즈니스 프로세스와 비즈니스 프로세스에 관련된 데이터 시스템을 이해해야 합니다.

다음은 운전자 터미널과 여객 터미널의 업무 프로세스와 데이터 지표를 정리하기 위해 온라인 승차공유 시스템을 예로 든다.

고객 프로세스는 등록/로그인, 주문, 서비스, 결제, 평가/고객 서비스 불만 사항으로 나눌 수 있습니다.

핵심 프로세스에서 생성되는 비즈니스 지표: 1) 등록/로그인 단계: 신규 사용자 수, 사용자 수, 다양한 채널의 사용자 수 2) 주문 단계: 주문량, 신규 사용자 주문량 , 기존 사용자의 주문량, 도시별 주문량 데이터, 모델별 주문량 데이터, 성공한 사용자 수 3) 의사결정 단계: 교섭 주문 수, 비협상 주문 수, 협상 주문 수 의사결정 단계에서 사용자가 적극적으로 취소한 주문, 의사결정 단계에서 타임아웃 발생 취소 건수, 가격 인상 완료 주문 수, 가격 인하 완료 주문 수 4) 서비스 단계: 성공적으로 주문한 사용자 수 , 주문기간, 주문성공률, 완료주문량, 주문완료율, 완료주문수 5) 결제단계 : 주문금액, 평균주문금액, 주문할인금액, 청구차액 6) 평가단계 : 긍정평가율, 부정평가 rate

동인 비즈니스 프로세스는 다음과 같이 나눌 수 있습니다:

비즈니스 프로세스에서 생성된 핵심 비즈니스 지표: 1) 등록/로그인 단계: 등록된 사용자 수, 신규 사용자 2) 프랜차이즈 단계: 심사 제출 사용자 수, 심사 통과 사용자 수, 신규 등록 드라이버 수, 누적 등록량, 기존 드라이버 수, 신규 드라이버 수량 3) 주문 접수 단계: 온라인 드라이버 수, 수 주문 청취 운전자 수, 유효 주문 청취 운전자 수, 낙찰자 수, 낙찰률, 일일 평균 낙찰자 수 4) 의사결정 단계: 의사결정 단계에서 운전자가 취소한 주문 건수 5 ) 서비스 : 서비스 평균거리, 평균시간, 빈운전 평균거리, 빈운전 평균시간 6) 평가 : 운전자 긍정평가율, 운전자 부정평가율, 평균 별점 7) 탈퇴 : 운전자 잔액, 탈퇴횟수, 금액 탈퇴

명확하게 사용자의 비즈니스 프로세스 이후 비즈니스 분석 및 의사결정에 따라 데이터 도메인을 분할하고, 특정 비즈니스 프로세스를 해당 데이터 도메인 아래로 분해해야 합니다.

2단계: 데이터 도메인 분할

데이터 도메인: 밀접하게 관련된 데이터 주제의 모음입니다. 비즈니스 객체에 대한 고도로 일반화된 개념 수준 분류입니다. 데이터 관리 및 적용을 용이하게 합니다.

이는 데이터를 분류하기 위해 컴퓨터 바탕 화면에 여러 폴더를 만드는 것과 유사하며 데이터를 분류하는 것과 같습니다. 우리의 데이터는 마케팅, 운영, 고객 서비스, 위험 통제 및 기타 인력과 같은 다양한 비즈니스 인력을 위한 것이며 그들이 집중하는 비즈니스 모듈은 매우 다릅니다.

그리고 우리 기술진도 각종 데이터 지표를 제공해야 하는데 업무 효율이 낮고 서버 컴퓨팅 비용이 많이 든다. 매우 느리고) 비즈니스 담당자가 적시에 데이터를 얻기가 어렵습니다. 다른 방법이 없으므로, 향후 데이터를 빠르게 찾아 수평적으로 확장할 수 있도록 데이터를 분류해 보겠습니다.

따라서 데이터 도메인을 분할할 때 다음 사항에도 주의해야 합니다. 1) 현재 비즈니스 요구 사항을 모두 충족할 수 있습니다. 2) 새로운 비즈니스를 기존 데이터 도메인으로 확장하거나 새로운 데이터 도메인을 확장할 수 있습니다.

이는 컴퓨터의 폴더 이름 지정과 동일합니다. 현재 파일(데이터)이 모두 포함되어야 합니다. 새 파일이 생성되면 기존 파일에 배치하거나 새로 만드는 것이 편리할 수 있습니다. 파일.

각 모듈의 비즈니스 요구 사항 및 비즈니스 프로세스 분석을 기반으로 데이터 도메인을 나눌 수 있습니다. 일반적으로 데이터 도메인은 고객 서비스, 운영, 마케팅 등 기업 부서에 따라 구분될 수 있으며 비즈니스 프로세스 또는 비즈니스 부문의 기능 모듈에 따라 구분될 수도 있습니다.

예를 들어, 온라인 카헤일링 시스템의 자동차 비즈니스 도메인은 다음 표와 같이 데이터 도메인으로 나눌 수 있으며, 실제 비즈니스 프로세스를 기반으로 데이터 도메인을 요약하고 추상화할 수 있습니다.

3단계: 지표 사양 정의 - 버스 매트릭스 구성

비즈니스 도메인, 데이터 도메인, 비즈니스 프로세스의 전체 프레임워크를 정리한 후 지표 사양을 설계했습니다.

쉽게 이해하면 폴더의 1차, 2차, 3차 디렉토리 구조 사양을 설계하는 것과 같습니다. 이제 파일 명명 구조 사양을 설계해야 합니다.

일반적으로 사용되는 지표는 기본적으로 개인의 이해에 따라 명명되었으며 일/월 활성 사용자 수, 지난 달 주문 수, 완료 금액 등 특별한 사양은 없습니다. 주문 등 그러나 데이터 지표가 증가함에 따라 지난 7일 동안의 베이징 익스프레스 주문량 지표와 같은 제한된 조건의 많은 지표가 등장했습니다. 이 지표는 어떻게 설계됩니까?

위 그림과 같이 지표를 설계할 때 사업영역=자동차사업, 데이터영역=서비스영역, 비즈니스프로세스=주문, 차원=도시, 속성=베이징, 기간 = 거의 7일, 수정자 = 표현, 미터법/원자 지표 = 주문 수량. 원자 지표에 대한 제약 조건을 추가하여 파생 지표를 표준화합니다 = 지난 7일 동안의 베이징 익스프레스 주문량 및 공통 지표 정의 표준 세트를 제공하여 다양한 사업 부서의 사람들이 지표의 의미를 쉽게 이해할 수 있도록 합니다.

온라인 차량 호출 시스템의 서비스 영역을 예로 들면, 비즈니스 프로세스를 주문, 주문 발송, 의사 결정, 여행 시작, 그리고 주문완료.

버스 행렬은 데이터 웨어하우스 설계자가 흔히 사용하는 것으로서, 실제로는 수학에서의 행렬과 순열과 유사합니다. 원자 지표는 다릅니다. 수천 개의 파생 측정항목을 가져옵니다.

요약

이 기사에서는 주로 데이터 제품의 관점에서 Alibaba OneData를 기반으로 온라인 차량 호출 지표 시스템을 구축하는 방법을 소개합니다. 비즈니스 분석, 데이터 도메인 분할 및 버스 매트릭스 구축을 통해 일련의 지표 디자인 사양이 확립됩니다. 지표 사양을 확립함으로써 R&D 및 비즈니스 당사자의 지표 획득 효율성을 향상시켜 후속 셀프 서비스 분석을 위한 기반을 마련할 수 있습니다.

지표 사양을 설계하는 과정에서 수천 개의 지표가 생성된다는 사실이 밝혀졌습니다. 그렇다면 이들 지표 중 실제로 비즈니스 측면에 지침을 제공하는 것은 무엇일까요?

다음 글에서는 OSM 모델과 AARRR 모델을 기반으로 핵심 비즈니스 지표를 결정하는 방법과 지표 사전을 설계하는 방법에 대해 설명하겠습니다.