항공 요금-경쟁력있는 가격 결정 동작과 가격 상관 관계를 탐지하기 위해 어떤 분석을 사용해야합니까?


12

항공사의 가격 결정 동작, 특히 항공사가 경쟁사 가격에 반응하는 방식을 조사하고 싶습니다.

더 복잡한 분석에 대한 내 지식은 상당히 제한적이라고 말하지만 데이터의 전체적인 관점을 수집하기 위해 대부분 기본 방법을 모두 사용했습니다. 여기에는 유사한 패턴을 식별하는 데 도움이되는 간단한 그래프가 포함됩니다. SAS Enterprise 9.4도 사용하고 있습니다.

그러나 나는 더 많은 숫자 기반 접근법을 찾고 있습니다.

데이터 세트

내가 사용하고있는 (자체) 수집 된 데이터 세트에는 ~ 54.000 운임이 포함되어 있습니다. 모든 운임은 매일 60 일 (매일 00:00)에 60 일 시간 내에 수집됩니다.수집 방법

따라서, 해당 시간 범위 내의 모든 요금은 요금의 수령일이 지날 때 요금 의 이용 가능 여부 및 출발 날짜에 따라 n 회 발생합니다 . (비행기 출발일이 지난 경우에는 항공료를 징수 할 수 없습니다)

기본적으로 다음과 같은 형식화되지 않은 형식 : (가짜 데이터)

+--------------------+-----------+--------------------+--------------------------+---------------+
| requestDate        | price| tripStartDeparture | tripDestinationDeparture | flightCarrier |
+--------------------+-----------+--------------------+--------------------------+---------------+
| 14APR2015:00:00:00 | 725.32    | 16APR2015:10:50:02 | 23APR2015:21:55:04       | XA            |
+--------------------+-----------+--------------------+--------------------------+---------------+
| 14APR2015:00:00:00 | 966.32    | 16APR2015:13:20:02 | 23APR2015:19:00:04       | XY            |
+--------------------+-----------+--------------------+--------------------------+---------------+
| 14APR2015:00:00:00 | 915.32    | 16APR2015:13:20:02 | 23APR2015:21:55:04       | XH            |
+--------------------+-----------+--------------------+--------------------------+---------------+

"DaysBeforeDeparture"는 I=sc 를 통해 계산됩니다 .

  • I 및 간격 (출발 전날)
  • 요금 및 날짜 (비행 출발)
  • 운임이 징수 된 c 및 날짜

다음은 I (DaysBeforeDep.) (가짜 데이터!)로 그룹화 된 데이터 세트의 예입니다.

+-----------------+------------------+------------------+------------------+------------------+
| DaysBefDeparture | AVG_of_sale | MIN_of_sale | MAX_of_sale | operatingCarrier |
+-----------------+------------------+------------------+------------------+------------------+
| 0               | 880.68           | 477.99           | 2,245.23         | DL           |
+-----------------+------------------+------------------+------------------+------------------+
| 0               | 904.89           | 477.99           | 2,534.55         | DL           |
+-----------------+------------------+------------------+------------------+------------------+
| 0               | 1,044.39         | 920.99           | 2,119.09         | LH               |
+-----------------+------------------+------------------+------------------+------------------+

내가 지금까지 생각해 낸 것

선 그래프를 보면 이미 여러 선이 높은 상관 계수를 가질 것으로 예상 할 수 있습니다. 따라서 그룹화 된 데이터에 대해 먼저 상관 관계 분석을 사용하려고했습니다. 그러나 그것이 올바른 방법입니까? 기본적으로 개별 가격이 아닌 평균에 상관 관계를 만들려고합니까? 다른 방법이 있습니까?

가격이 선형 형태로 움직이지 않고 비선형으로 보이기 때문에 어떤 회귀 모델이 여기에 맞는지 잘 모르겠습니다. 항공사의 각 가격 개발에 모델을 적용해야합니까?

추신 : 이것은 긴 텍스트 벽입니다. 무엇이든 명확히 해야하는 경우 알려주십시오. 나는이 서브를 처음 사용합니다.

실마리가 있습니까? :-)

답변:


9

전 항공사 수익 관리 분석가의 경고 :이 접근 방식으로 잘못된 트리를 짖을 수 있습니다. 텍스트의 벽에 대한 사과가 있지만이 데이터는 언뜻보기에 훨씬 복잡하고 시끄럽기 때문에 어떻게 생성되는지에 대한 간단한 설명을 제공하고자했습니다. 미리 양해 바랍니다.

항공사 요금에는 두 가지 구성 요소가 있습니다. 항공사가 특정 노선에 대해 이용할 수있는 실제 요금 (운임 규칙과 요금이 포함 된 요금)은 대부분 항공 요금표 출판사 (공공 요금표)입니다. 항공사가 매일 수행하는 실제 재고 관리 및 규칙이 아니라 예외입니다.

요금은 정해진 간격으로 하루에 4 번 ATPCO에 제출할 수 있으며, 항공사가 그렇게 할 때 일반적으로 기존 요금의 추가, 삭제 및 수정으로 구성됩니다. 항공사가 가격 결정 동작을 시작할 때 (경쟁 업체가 여기에서 자신의 움직임을 시도하지 않는 경우), 일반적으로 다음 업데이트 때까지 기다려야 경쟁 업체가 팔로우 / 응답하는지 확인할 수 있습니다. 항공사가 응답을하기 전에 다음 업데이트를 기다려야하기 때문에 경쟁 업체가 가격 결정 동작을 시작하면 대화가 진행됩니다.

지금, 이것은 운임과 관련하여 모두 좋고 훌륭하지만 문제는 이것이 모두 ATPCO에 게시되기 때문에 운임은 대중에게 다음으로 가장 좋은 것입니다 ... 모든 경쟁 업체는 당신이 무엇을했는지 알게됩니다 당신의 무기고에 들어갔 기 때문에, 실제로 재고를 배정하지 않는 운임 공표, 모든 운임을 출발일 등으로 표시하는 등 난독 화 시도는 들어 본 적이 없습니다.

여러 가지면에서 비밀 소스는 실제 재고 할당으로 이어집니다. 즉, 각 항공편의 특정 좌석에 대해 얼마나 많은 좌석을 기꺼이 팔 것입니까?이 정보는 공개적으로 사용할 수 없습니다. 웹 정보를 스크랩하면 약간의 문제를 해결할 수 있지만 출발 시간 / 날짜 및 요금 규칙의 잠재적 조합은 매우 많으며 쉽게 추적 할 수있는 능력을 넘어 빠르게 확대 될 수 있습니다.

일반적으로 항공사는 매우 저렴한 요금으로 소수의 좌석 만 기꺼이 판매하며 요금 규정을 위반 한 사람들은 요금 규칙이 잠기지 않도록 미리 예약해야합니다. 항공사는 더 높은 요금 등을 위해 더 많은 좌석을 기꺼이 판매 할 것입니다. 그들은 가장 높은 요금으로 모든 좌석을 팔아서 기뻐할 것입니다. 그러나 이것은 일반적으로 가능하지 않습니다.

출발 당일에 가까워 질수록 운임이 높아질수록 저렴한 좌석을 더 많이 예약 할 수있는 자연스러운 과정이며 나머지 재고는 점차 비싸집니다. 물론 여기에 몇 가지주의 사항이 있습니다. RM 팀은 일반적으로 수익 목표를 달성하고 각 항공편의 수익을 극대화하기 위해 노력하므로 RM 프로세스는 적극적으로 관리되며 인적 개입은 매우 일반적입니다. 따라서, 빨리 채워지는 항공편은 저렴한 요금을 마감함으로써 "조임"될 수 있습니다. 천천히 예약하는 항공편은 더 많은 좌석을 할당하여 요금을 낮추면 "느슨해"질 수 있습니다.

이 지역의 항공사간에 지속적인 상호 작용 및 경쟁이 있지만 요금 긁기만으로 실제 역학을 포착 할 가능성은 거의 없습니다. 틀리지 말고, 우리는 그러한 도구를 마음대로 사용할 수 있었으며, 그 한계에도 불구하고 상당히 가치가 있었지만 의사 결정 과정에 투입된 하나의 데이터 소스에 불과했습니다. RM 팀이 매일 수 천 건의 운영 결정을 내릴뿐만 아니라 당시의 정보와 같은 최신 정보에 액세스해야합니다. 이 데이터를 얻기 위해 협력 할 항공사 파트너를 찾을 수없는 경우 대체 데이터 소스를 고려해야합니다.

공식 항공사 가이드 (또는 경쟁사 중 하나)에서 O & D 요금 데이터에 액세스하여 분석에 사용하는 것이 좋습니다. 그것은 샘플 기반 (판매 된 모든 티켓의 약 10 %)이며 이상적인 것보다 더 높은 수준으로 집계됩니다. 따라서 신중한 경로 선택이 필수적입니다. 대형 항공기), 그러나 실제로 판매 된 품목 (평균 운임)과 판매 된 품목 (부하율), 주어진 시점에 판매 가능한 품목에 대한 더 나은 그림을 얻을 수 있습니다. 이 정보를 사용하면 최소한 항공사의 가격 전략 결과를 탐색하고 그로부터 추론 할 수있는 더 나은 위치에있을 수 있습니다.


철저한 설명 감사합니다. 가격만을 기준으로 한 분석은 매우 제한적이라는 데 동의합니다. 여기에는 특히 운임 규정 (환불 가능한 항공권, 최소 체류 기간 등)이 포함됩니다. 이러한 제한 중 일부는 항상 동일한 요금을 모아서 비교할 수 있습니다. 그러나 중요한 정보-언급했듯이 사용 가능한 좌석 수 (비행기 좌석 수 = = 실제 좌석 수)가 누락되었습니다.
s1x

이러한 데이터에 대한 액세스는 매우 제한적이며 오래된 경우 (예 : US DOT의 Databank 1B). Clark R. 및 Vincent N. (2012) 용량에 따른 가격 책정 [...] 링크 와 같은 일부 연구 는 이러한 데이터를 포함하고 훨씬 더 나은 통찰력을 제공합니다. 나는 제한 사항 (바람직하게 ;-)을 알고 있으며 가격에 영향을 미치는 훨씬 더 많은 정보가 있다고 언급했습니다. 여전히 특정 시장을 관찰 할 때 어떤 일이 발생하는지 느낄 수 있습니다 . 경쟁적인 행동과 다른 가격 전략 접근 방식이 있는지 확인할 수 있습니다. 그러나 원인을 찾을 수는 없습니다.
s1x

1
@ s1x-동의합니다. 확실한 대안을 제공하기를 원하지만, 여러분이 배운대로 자세한 수익 데이터는 모든 항공사에서 가장 질서있게 보호되는 비밀입니다. 그 사실을 알고 데이터 생성 프로세스에 무엇이 들어가는 지 알고 싶었습니다. 그 외에도, 나는 당신이하려는 일을 좋아하고 다른 대답은 올바른 기술 방향의 단계라고 생각합니다. 내가 제안 할 수 있다면, 데이터 탐색 중에 다양한 TS 사이의 상호 상관 관계를 사용하는 것을 볼 수도 있습니다. 링크 된 TS 간의 패턴을 식별하는 데 종종 유용하기 때문입니다.
habu

4

설명적이고 시각적 인 탐색 적 데이터 분석 (EDA) 외에도 시계열 분석 을보다 포괄적 이고 정교한 분석 으로 사용하려고합니다 . 특히 시계열 회귀 분석을 수행 합니다 . 시계열 분석은 거대한 연구 및 연습 영역이므로 기본 사항에 익숙하지 않은 경우 위에 링크 된 Wikipedia 기사부터 시작하여 점차 더 구체적인 주제를 검색하고 해당 기사, 논문 및 서적을 읽는 것이 좋습니다.

시계열 분석은 매우 보편적 인 접근 방식이므로 대부분의 오픈 소스 및 폐쇄 소스 상용 데이터 과학통계 환경 (소프트웨어) (예 : R , Python , SAS , SPSS 등)에서 지원됩니다. 이를 위해 R 을 사용하려면 일반적인 시계열 분석시계열 분류 및 클러스터링에 대한 답변 확인하십시오 . 도움이 되길 바랍니다.


귀하의 답변에 감사드립니다 @Aleksandr Blekh-정말 감사합니다. 내가 바로 파고 들게 어리석은 질문 일 수도 있지만 여기에 잘못된 경우 여기를 수정하십시오. 상관 관계 분석, 하나의 항공사를 상관 변수로 사용하는 동안. 일부 항공사가 탈출함에 따라 지금까지 결과는 매력적이었습니다. 공동 운항 계약을 맺은 사람들은 비슷한 가격을 가졌습니다. 이러한 높은 상관 관계가 있습니까? 예 : ColumnUA(LH) 0.90435 <.0001 ColumnSQ 0.32544 <.0001 ColumnAF(DL) 0.55336 <.0001 나는 그러한 결과 비슷한 가격 패턴을 나타내는 것으로 가정 합니다. 회귀 분석을 통해 무엇을 알 수 있습니까?
s1x

@ s1x : 당신은 매우 환영합니다 (대답을 소중히 생각할 때 그리고 물론 그렇게 할만 큼 충분한 평판을 얻을 때, 자유롭게 투표 / 수락하십시오). 이제, 당신의 질문에. 내가 말했듯이 TS 분석은 더 정교하고 포괄적입니다. 특히 TS 회귀는 소위 자기 회귀 및 기타 TS 복잡성을 설명합니다. 따라서 간단한 회식 대신 TS 회귀 분석을 사용하라는 제안입니다. 또한 수행하려는 데이터 분석에 관계없이 항상 EDA로 시작 해야 합니다 (실제로 EDA는 종종 계획을 변경합니다).
Aleksandr Blekh
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.