F&B 비즈니스를 위한 데이터 거버넌스 및 운영 파이프라인 구조도

F&B 특화 통합 데이터 거버넌스 구축

역할 (Role)Data PM
기간 (Period)2022.12 – 2024.12
핵심 성과 (Impact)데이터 정합성 확보 및 운영 공수 80% 절감
SECTION

1. 프로젝트 진행 배경

"파편화된 오프라인 데이터를 통합하여 경영의사결정을 위한 단일 표준 데이터를 만들다."

이 프로젝트는 배달 앱 스크래핑 위주였던 '데이터퓨레' 서비스를, F&B 브랜드의 모든 경영 데이터를 다루는 통합 솔루션으로 진화시키기 위한 데이터 거버넌스 구축 여정입니다. 이를 통해 20개 이상의 채널 데이터를 통합하고, 회사의 정체성을 '데이터 수집 업체'에서 'F&B 데이터 솔루션 전문 기업'으로 전환시켰습니다.

SECTION

2. 당면 문제

"매장이 몇 개인가 라는 질문조차도 답변할 수 없는 데이터 인프라"

당시 F&B 시장은 배달 플랫폼의 급성장으로 데이터의 중요성이 커졌으나, 고객들의 데이터 활용 인프라는 그 속도를 따라가지 못하고 있었습니다. 특히 다음 3가지 문제가 심각했습니다.

📉 핵심 매출원 분석의 구조적 한계

시기적으로 제가 합류한 2022년 말은 엔데믹으로 오프라인 매출 비중이 회복되던 시기였습니다. 그러나 레거시 인프라는 오직 배달앱 기준으로만 개발되어 있어, 온-오프라인 통합 분석을 위해서는 애초부터 물리적 매장과 POS 데이터를 고려한 설계 변경이 필요했습니다.

⚠️ 내부 운영 부담과 비효율

초기 서비스 인프라는 MySQL과 Tableau에 대한 의존도가 매우 높았습니다. 고객이 늘어나면서 전처리 및 비즈니스 로직 고도화가 필요해졌지만, 기존 아키텍처의 낮은 성능과 높은 전처리 의존도는 데이터 팀의 운영 부담으로 직결되었습니다.

🧱 서비스 확장성의 부재

단순 매출 분석을 넘어 광고 효율, 식자재(SCM) 비용까지 분석해야만 높은 사용자 가치를 제공할 수 있습니다. 이를 위해서는 브랜드-매장-메뉴-레시피-식자재 등 이종 데이터를 효과적으로 통합하고 목적별 데이터 마트를 운영할 수 있는 구조 개편이 필수적이었습니다.

SECTION

3. 주요 해결 전략

“파편화되고 원천 소스에 의존하는 데이터를 Service-Centric 구조로 개편하자"

문제의 해결을 위해서 크게 3가지의 주된 전략을 세웠습니다.

📍 A. 주소 정제 기반 매장 식별자 통합

  • Master Table 구축: 배민, 요기요, 쿠팡이츠, POS, SCM 등 20여개 채널 데이터의 통합을 위해 주소(위도/경도) 및 사업자번호를 활용한 마스터 식별 체계를 수립했습니다.
  • Geocoding & Dictionary: 네이버 지오코딩 API를 활용해 비정형 주소 데이터에서 정확한 행정구역과 위치를 추출하고, 사업자등록번호와 결합하여 매장 사전(Dictionary)을 구성했습니다.
  • Rule-based Filtering: 고객마다 브랜드명 포함/제외 조건(Include/Exclude Condition)을 관리할 수 있는 브랜드 사전을 통해 원천 데이터 식별 로직을 정교화했습니다.

🏗️ B. 채널 독립적 표준 데이터 모델 도입

  • Service-Centric Identifier: 계정 기반(배달앱)과 단말기 기반(POS) 코드를 모두 수용하면서도 고유성을 유지하는 서비스용 식별자(Service ID)를 도입했습니다.
  • Standardized Schema: 채널별 상이한 주문 데이터를 '주문(Order)', '결제(Payment)'의 공통 속성으로 추상화하여, 개별 채널이 아닌 표준 모델로 통합 관리했습니다.
  • Supply Chain Model: 매입(공급) 데이터 또한 아이템, 과세여부, 공급가액 등의 공통 속성을 추출하여 브랜드 차원의 물류 공급 내역 모델을 재설계했습니다.

⚙️ C. Snowflake + Airflow + Slack 결합 Ops 구축

  • Layered Pipeline: Snowflake를 도입하여 DEV -> STG -> PROD 의 3단계 데이터 레이어를 구성, 데이터가 단계적으로 검증되고 서비스에 반영되도록 했습니다.
  • Observability: Airflow로 파이프라인을 오케스트레이션하고, 처리 현황과 로그를 Slack으로 전송하여 누구나 진행 상황을 모니터링할 수 있도록 했습니다.
  • Real-time Alerting: 매장 수, 매출, 매입 추세가 임계치를 벗어날 경우 즉시 Slack Alert을 발송하여, 고객 문의 전 선제적 대응이 가능한 체계를 갖췄습니다.
SECTION

4. 의미와 성과

"데이터 취합이 아닌 진짜 데이터 분석으로 서비스 패러다임을 고도화하다."

이 시스템과 거버넌스를 통해 데이터 팀은 "숫자가 안 맞아요"라는 문의에 시달리는 방어적 조직 에서, 비즈니스 인사이트를 발굴하는 공격적 조직 으로 변모했습니다.

🔧 운영 효율의 극대화

수동 매핑 작업이 거의 사라지며 데이터 운영 리소스가 80% 절감 되었습니다.

🛡️ 비즈니스 신뢰도 회복

고객사(대형 프랜차이즈)에게 제공되는 리포트의 결항률이 0%에 수렴하며, "업계 최고 수준의 데이터 정합성을 가진 회사" 라는 신뢰 자산을 쌓았습니다.

🚀 확장 가능한 기반 마련

안정된 마스터 데이터를 기반으로, 이후 SCM 분석 프로젝트와 같은 고부가가치 프로젝트를 즉시 시작할 수 있는 데이터 인프라를 구축하였습니다.