메뉴 닫기

데이터의 속성

1. 호텔리시스가 제공하는 재무 데이터는 인공지능을 통해 가공된 데이터입니다.

지금 우리는 데이터의 확보가 아니라 필요한 데이터를 빠르고 정확하게 찾아 활용하는 것이 경쟁력인 빅데이터 시대를 살고 있습니다. 우리나라 숙박업 관련 공공 통계와 민간 데이터가 국내외에 다양하게 존재하며, 호텔리시스는 이들의 대부분을 수집하여 데이터 레이크를 구축했습니다. 그러나 호텔리시스는 이 데이터들을 그대로 제공하지 않습니다. 여기에는 크게 두 가지의 이유가 있습니다.

Original image from SAP Insights edited by Hotelysis

첫째, 통계 자료간 불일치가 광범위하게 존재합니다. 우리나라의 숙박업 관련 공공 통계는 법정 숙박업 및 숙박시설 분류 체계에 따라 집계되며, 각 유형별로 주무 부처가 다르기 때문에 통계의 집계 또한 독립적으로 진행됩니다. 우리나라의 법정 숙박업 및 숙박시설 분류 체계는 법정 숙박시설 유형 페이지를 참고하시기 바랍니다. 한편, 관련 법령에 따라 각 주무 부처의 업무 초점에 차이가 있기 때문에 각각의 통계가 집계되는 방식과 포함하는 정보의 범위에도 커다란 차이가 존재합니다. 즉, 같은 질문이더라도 누구에게 묻는지에 따라 다른 답을 얻게 되는 것입니다.

  • 집계 기준 불일치: 숙박업과 숙박시설의 법정 유형 분류가 일치하지 않기 때문에 숙박업에 관한 통계인지 숙박시설에 관한 통계인지에 따라 결과는 다릅니다. 숙박시설에서 꼭 숙박업만을 영위해야 하는 것도 아니고 숙박시설이 아닌 곳에서 숙박업을 영위할 수 없는 것도 아니며, 업태나 업종은 언제든 바뀔 수 있습니다. 즉, 법령에 따른 관리의 대상이 업체인지 시설인지, 시설의 경우 필지 단위인지 건물 단위인지에 따라 통계의 결과는 다릅니다. 예를 들어, 복수의 필지에 복수의 건물로 구성된 숙박시설 단지를 단일 업체가 운영하는 경우, 주무 부처에 따라 하나의 숙박시설로 보기도 하고 복수의 숙박시설로 보기도 합니다.
  • 집계 범위 불일치: 비록 집계 기준이 달라 통계 자료간 불일치가 존재하지만, 우리나라 숙박시설 공급 현황 통계는 비교적 풍부하게 존재합니다. 반면, 수요, 가격, 매출, 비용 등 영업 현황을 파악할 수 있는 통계 자료는 제한적입니다. 우선 매출의 경우, 한국호텔업협회에서 호텔업 운영현황 자료를 매년 발표하는데, 여기에는 수요, 가격, 매출 데이터가 비교적 상세하게 포함되어 있습니다. 그러나, 이 통계의 표본은 전체 호텔의 약 50%, 전체 숙박시설의 4%에 불과합니다. 통계청에서 5년마다 시행하는 경제총조사는 전체 숙박시설에 대한 매출 및 비용 데이터를 포함하지만, 동일 표본에 대해 호텔업 운영현황 자료와 차이를 보입니다.

둘째, 설문조사 기반 통계의 오염은 불가피합니다. 공급 통계의 경우 설문조사 기반이 아닌 경우가 대부분이지만, 지번 및 도로명 주소 체계의 혼재로 인한 오염이 일부 존재합니다. 영업 현황 통계의 경우 전적으로 개별 업체의 자발적인 설문조사에 기반을 두고 있으며, 응답자가 잘못된 데이터를 제공하는 경우 이를 바로잡을 수 있는 방법이 현실적으로 존재하지 않습니다. 물론, 통계 유의성을 검증하고 보정하는 기법들이 폭넓게 활용되고 있지만, 변동성이 크고 불규칙적인 숙박업 현금흐름 데이터에 대해서는 분명한 한계가 존재합니다.

  • 실수에 의한 오염: 대부분의 경우 통계 오염은 실수에 의해 발생합니다. 예를 들어, 데이터의 일부가 누락된 채 제출되거나, 관련 없는 데이터까지 포함되어 함께 제출되거나, 항목이 바뀌어 입력된 데이터가 제출되거나, 제출된 숫자의 단위 표기에 착오가 있거나 하는 경우들이 이에 해당됩니다. 이러한 경우, 정확한 데이터 제출을 위한 추가 비용 부담이 해소되고 이를 통해 기대할 수 있는 인센티브가 명확하게 제시되면 개선이 가능할 것으로 판단됩니다. 다만, 공공 통계의 정확성에 대한 문제가 숙박업에만 국한된 것은 아니기 때문에, 정부가 법령을 통해 동기를 부여하는 것이 과연 현실적인지에 대한 이슈는 있습니다.
  • 고의에 의한 오염: 상대적으로 비중이 크지는 않지만, 통계 자료를 오염시키기 위해 고의로 허위 자료를 제출하는 경우들도 있습니다. 이러한 경우, 비중이 크지 않은 것에 비해 파급효과는 크게 나타납니다. 통계 자료 전체에 대한 신뢰도를 붕괴시키기 때문입니다. 여기에는 복합적인 이유가 존재할 것으로 추정되는데, 시장 정보의 비대칭을 통해 경쟁 환경을 통제하기 위한 목적이 가장 큰 부분을 차지하는 것으로 판단됩니다. 자발적 설문조사 기반의 통계에 있어 제출 자료의 허위 여부를 검증할 방법이 마땅치 않고, 처벌이 가능한 것도 아니기 때문에, 이 문제를 해결할 수 있는 방법은 실질적으로 존재하지 않습니다.

호텔리시스는 숙박시설 경영 및 투자 관련 업종에 종사하는 분들이 방대한 숙박업 데이터를 신속하고 정확하게 활용할 수 있기를 바랍니다. 저희는 글로벌 호텔산업의 경험과 지식, 빅데이터 처리 및 분석 기술력에 기반한 지도 학습 알고리즘을 통해 데이터를 처리, 분석, 시각화하여 제공합니다. 저희가 데이터를 처리하는 과정은 크게 매칭, 보정, 추정, 예측으로 구분되며, 이를 통해 가공된 데이터는 시장 및 자산 단위의 데이터 웨어하우스에 저장되어 분석 및 시각화에 활용됩니다.

Original image from SAP Insights edited by Hotelysis

다만, 인공지능을 통해 조정된 데이터의 정확성을 완전히 보장할 수 없다는 한계는 여전히 존재합니다. 호텔리시스는 알고리즘을 통해 가공된 재무 데이터를 시장 단위의 원본 통계 데이터와 비교하여 오차율을 검증합니다. 이 과정에서 원본 데이터의 통계 표본을 추적하여 동일한 표본의 조정 데이터셋에 대하여 평균절대비오차(MAPE)대칭평균절대비오차(SMAPE)를 통한 검증을 실시합니다. 호텔리시스는 오차율 검증에서 자체 기준을 통과한 데이터만을 제공합니다만, 제공하는 데이터의 정확성을 보장할 수는 없습니다.

 

2. 호텔리시스의 데이터 가공은 개별 숙박시설 단위 데이터를 대상으로 합니다.

대부분의 숙박업 관련 공공 및 민간 통계 자료는 일률적인 기준에 따라 구분된 시장 단위로 제공되며, 실무적 필요에 따른 유연한 활용이 불가능합니다. 빅데이터가 존재하지 않는 과거일수록 이러한 상황이 두드러지기 때문에, 시계열 분석을 통한 인사이트 도출이 어렵습니다. 저희는 개별 숙박시설 단위의 데이터를 통해 실무적 환경에서 데이터가 유연하게 활용될 수 있기를 바랍니다. 이를 통해 숙박시설 경영 및 투자 관련 업종에 종사하는 분들이 우리나라 숙박시장의 불안정한 공급 현황을 정확하게 파악하고, 역동적으로 변화하는 시장에 더욱 신속하게 대응할 수 있기를 바랍니다.

여기에서, 공급이 불안정하다는 것은 신규 개업 비율이 높은 동시에, 수명이 짧아 폐업 비율 또한 높다는 의미입니다. 즉, 새로 개업한 숙박업체가 언제 폐업하게 될지 모르는 불확실성이 높습니다. 바꾸어 말하면, 우리나라는 경쟁 환경이 역동적으로 변화하는 시장으로, 정확한 시장 데이터의 중요도가 높은 시장입니다. 우리나라 숙박시장의 공급 불안정은 두 가지 지표를 통해 나타납니다.

  • 숙박업 평균 생애주기: 통상적으로 숙박시설의 경제적 수명은 세법상 내용연수인 40년이며, 숙박업 평균 생애주기가 경제적 수명에 가까울수록 공급이 안정적인 시장으로 판단할 수 있습니다. 그러나 우리나라 숙박업 평균 생애주기는 경제적 수명의 58% 수준인 23년에 불과하며, 90% 수준인 미국의 36년과 커다란 차이를 보이고 있습니다.
  • 객실수 연평균 증감률: 2005년부터 2019년까지 우리나라 숙박시설 객실수는 연평균 1.0% 증가했으며 1.1%의 표준편차를 보였습니다. 같은 기간 미국은 연평균 1.3%의 증가율과 1.0%의 표준편차를 보였습니다. 전체적인 증감률만 보면 우리나라의 공급 현황이 더 안정적으로 보이지만, 그 뒤에는 상대적으로 높은 개업률와 폐업률이 있습니다.

한편, 우리나라의 숙박시장은 수요의 변동성 또한 클 것으로 추정되지만, 이를 정확하게 측정하기는 어렵습니다. 수요의 변동성이 클 것으로 추정되는 이유는 외수 수요의 비중이 높고, 내수 수요의 경우 계절성이 두드러지게 나타나는 레저 수요가 대부분을 차지하기 때문입니다. 이를 정확하게 측정하기 어려운 이유는 수요 관련 통계의 집계 기준이 공급 관련 통계와 다르고, 무엇보다 수요 관련 통계 자료가 유의성과 시의성 측면에서 제한적이기 때문입니다.

  • 법정 유형과 시장 유형의 괴리: 한국문화관광연구원에서 매년 발간하는 국민여행조사외래관광객조사 자료는 숙박시설 유형별 내외국인 수요를 판단할 수 있는 데이터를 제공합니다. 그러나 여기에서는 법정 유형이 아닌 시장에서 통용되는 유형 분류 체계를 사용하기 때문에, 공급 통계가 존재하지 않는 펜션이나 게스트하우스 등이 포함되어 있습니다. 물론, 개별 숙박시설이 법정 유형을 명칭에 그대로 사용하지 않는 한, 여행객들 대상의 설문조사에 법정 유형을 사용하기에는 무리가 있습니다. 즉, 수요 통계 자료가 공급 통계 자료와 연결되기 어려운 상황인 것입니다.
  • 제한적인 숙박업 재무 데이터: 비록 전체 숙박시설의 4%에 국한되지만 유일하게 상세한 매출 관련 데이터를 제공하는 호텔업 운영현황 자료는 해당 연도가 종료된 이후 대략 1년에서 1년반이 지난 후에 집계 결과가 발표됩니다. 경제총조사 자료 또한 1년반이 지난 후에 집계 결과가 발표되는데, 공교롭게도 지금까지의 대상 연도가 무척이나 특이한 시점들이었습니다. 2010년은 글로벌 금융위기가 막 지난 때였고, 2015년은 MERS로, 2020년은 코로나로 숙박업이 커다란 타격을 받았던 때입니다. 즉, 매출이나 비용이 일반적인 수준과 크게 다른 데이터만 존재하는 것입니다.

개별 자산 단위 재무 데이터의 이점은 다양한 통계 자료간 표본 불일치 및 변경으로 발생하는 혼선에 효과적으로 대응할 수 있도록 한다는 점입니다. 이를 위해 호텔리시스는 법정 유형을 시장 현황에 따라 더욱 세분하여 클러스터링 함으로써, 가용 통계 데이터의 활용성을 그대로 유지하는 동시에 시장 현황을 정확하게 반영하도록 개선하여 적용 중입니다. 이에 대해서는 호텔리시스 숙박시설 유형 페이지를 참고하시기 바랍니다. 또한, 호텔리시스가 자체 개발한 인공지능 알고리즘은 원본 데이터의 세부 항목들과 주요 경제 지표들의 상관관계에 기반을 두고 있어, 독립적인 추정 또는 예측이 가능합니다.

그러나, 개별 자산 단위의 재무 데이터가 그대로 제공되지는 않으며, 이용자는 경쟁 시장 단위로 합산된 데이터를 제공받게 됩니다. 가장 큰 이유는 법적인 제한 때문입니다. 그러나, 데이터셋을 생성하는 경쟁 시장을 이용자가 직접 설정할 수 있도록 하여 이러한 한계를 보완하고 있습니다. 예를 들어, 특정 숙박시설과 직접적인 경쟁 관계에 있는 경쟁 숙박시설군을 이용자가 직접 선택하여 구성하고, 합산된 데이터를 추출하여 대상 숙박시설의 재무 실적과 비교할 수 있습니다. 이 경우, 대상 숙박시설의 재무 실적은 이용자가 직접 입력하는 것을 원칙으로 합니다.

 

3. 호텔리시스는 모호한 기준의 적용 또는 다양한 기준들의 혼용에 따른 데이터 오남용을 지양합니다.

호텔리시스가 제공하는 모든 재무 데이터는 공인 회계기준에 따라 가공된 데이터입니다. 호텔리시스가 활용하는 회계기준에는 두 가지가 있습니다. 하나는 숙박업에서 폭넓게 활용되는 국제숙박업회계기준(USALI)이며, 다른 하나는 일반기업의 회계에 활용되는 국제회계기준(IFRS)입니다. 두 회계기준은 다음과 같은 원칙에 따라 적용되고 있습니다.

  • 국제숙박업회계기준(USALI): 매출, 비용, 이익 등 손익과 관련된 데이터는 국제숙박업회계기준(USALI)의 적용을 원칙으로 합니다. 국제숙박업회계기준(USALI)의 경우 법정 회계기준은 아니지만, 숙박업의 생산성과 효율성 평가와 개선의 기회를 발굴하는 데 있어 국제회계기준(IFRS)보다 더 적합한 것으로 판단됩니다.
  • 국제회계기준(IFRS): 재무상태표 등 재무현황과 관련된 데이터는 국제회계기준(IFRS)의 적용을 원칙으로 합니다. 다만, 호텔리시스가 확보하여 활용하는 과거의 실제 데이터가 일반적으로인정된회계원칙(GAAP)에 따라 작성된 경우 이를 따로 변환하지 않기 때문에 장부가치 데이터 해석에 이용자의 주의가 필요합니다.

호텔리시스가 제공하는 데이터는 소유 및 운영 구조의 변수를 배제하고 자산에 귀속된 정보 제공을 원칙으로 합니다.  숙박시설의 재무 데이터는, 동일한 영업 실적이라 하더라도 소유 및 운영 구조에 따라 그 결과가 크게 달라질 수 있습니다. 예를 들어, 임대차 구조의 숙박시설에 대한 재무 데이터에는 감가상각비가 포함되지 않는 반면, 소유주 직영일 경우 감가상각비가 포함되어 회계적으로 인식되는 영업이익의 편차가 크게 나타날 수 있습니다. 호텔리시스가 제공하는 모든 데이터는 소유주 직영을 기준으로 하며, 원본 데이터가 임대차 구조를 반영한 데이터일 경우 이를 소유주 직영으로 변환하여 제공합니다.

호텔리시스의 데이터와 관련하여 그 밖에 궁금한 사항이 있을 경우, support@hotelysis.com으로 문의 바랍니다. 다만, 호텔리시스가 자체 개발한 인공지능 알고리즘 관련 사항에 대해서는 답변을 드릴 수 없는 점 양해 부탁드립니다.