영국 프리미어리그 경기데이터 기반 머신러닝을 활용한 경기결과 예측 및 분류모형의 예측 성능 비교. [한국체육학회지]
2024-10-02

f894732d5ccd200a3f9d44629585eaaa_1727856517_9695.PNG



스포츠와 관련한 빅데이터 축적 및 수집 기술, AI 알고리즘의 발전, 컴퓨터 과학이 발전하면서 최근 경기결과 예측과 관련 한 연구가 증가하고 있다. 하지만, 세계에서 가장 큰 시장을 가지고 있는 축구 종목에서 이와 같은 연구는 초기 단계라는 점에서 학술적 발전과 실무적 요구에 부응할 필요가 있다. 본 연구는 이러한 연구의 필요성을 달성하기 위해 경기데이터의 축적이 비교적 잘 이루어진 영국 프리미어리그 경기결과를 머신러닝을 적용하여 예측하고 그 분류모형의 성능을 비교하는 것을 목표로 수행하였다. 이를 위해 2020~2021시즌부터 2022~2023시즌 5월까지 진행된 1,107경기에서 (N=2,214) 축적된 123 개의 변수를 프리미어리그 공식 홈페이지, 풋몹(Fotmob), 트랜스퍼마켓(Transfer markt), 케이펄로지(Capology)에서 총체적 으로 수집하여, 이 중 16개의 변수를 최종적으로 분석에 사용하였다. 본 연구에서는 다항 로지스틱 회귀분석, 다층 신경망, 랜덤 포레스트, 그래디언트 부스팅, Light-GBM, 에이다 부스트, 서포트 벡터 머신, 선형 판별 분석, 비선형 판별 분석의 9가 지 머신러닝 알고리즘을 통해 경기결과를 예측하였다. 본 연구의 분석 결과, 최종적으로는 다층 신경망, 다항 로지스틱 회 귀, 선형 판별 분석, 비선형 판별 분석, 서포트 벡터 머신, 그래디언트 부스팅, 에이다 부스트, Light-GBM, 랜덤 포레스트 순 으로 예측 성능을 나타냈다. 가장 높은 예측 성능을 보여준 다층 신경망은 F1-score 86.66, 정확도 88.49%를 기록했다. 본 연구는 기존 연구에서 경기결과 예측에서 활용하지 않았던 기대득점을 비롯한 16개의 독립 변수만으로 머신러닝 성능평가 모형을 구축하여 86.66의 F1-score를 기록하는 등 기존 연구의 예측 성능을 대폭 개선하였다는 점에서 축구 분야에서 머신 러닝을 활용한 연구의 발전과 실무적 활용 가능성 확장에 기여도가 있다는 의의를 지닌다.

주요어: 머신러닝, 스포츠 애널리틱스, 빅데이터 분석, 축구 경기결과 예측, 영국 프리미어리그


링크 : https://kiss.kstudy.com/Detail/Ar?key=4036655


0건의 글이 있습니다.
  • (주)데이터플레이랩스
  • 대표 이상현, 김진주
  • 주소 [한성대학교 상상밸리3] 서울특별시 성북구 삼선교로10바길 38 202호

  • (주)한국스포츠경영전략연구원
  • 대표 최빛나, 전성삼
  • 주소 [국민체육진흥공단 SPORTS 360° LAB] 서울특별시 송파구 방이동 올림픽로 424 202호
Copyright 2024 Korea Sport Management Research Institute. All Right Reserved.