스포츠 분석에서 가장 흔하게 혼동되는 두 개념이 있다. 승률과 기댓값이다. 표면적으로는 비슷해 보이지만, 이 두 개념은 완전히 다른 정보를 담고 있으며 판단의 방향도 달라진다. 승률에만 집중하는 분석은 장기적으로 잘못된 결론을 반복적으로 생산한다. 기댓값의 구조를 이해하는 것이 더 정확한 분석의 출발점이다.
승률이란 무엇인가
승률은 전체 시도 횟수 대비 성공 횟수의 비율이다. 10번 중 6번 맞혔다면 승률은 60%다. 직관적으로 이해하기 쉽고, 단기적인 성과를 요약하는 데 유용하다. 그러나 승률은 각 시도에서 발생한 손익의 크기를 전혀 반영하지 않는다.
60%의 승률을 기록한 분석가가 있다고 가정한다. 성공한 6번에서 각각 1단위를 획득하고, 실패한 4번에서 각각 3단위를 잃었다면 실제 결과는 6단위 획득에 12단위 손실, 즉 6단위 순손실이다. 승률은 60%로 높지만 실질적인 결과는 마이너스다. 이것이 승률만으로 분석의 질을 판단할 수 없는 핵심 이유다.
기댓값이란 무엇인가
기댓값(Expected Value, EV)은 반복적인 시도를 통해 장기적으로 기대할 수 있는 평균 손익이다. 계산 방식은 다음과 같다. 각 결과의 확률에 해당 결과의 손익을 곱한 값들의 합이다.
예를 들어 성공 확률이 50%이고 성공 시 2단위를 획득하며 실패 시 1단위를 잃는 구조라면, 기댓값은 (0.5 × 2) + (0.5 × -1) = 0.5다. 이 구조에서는 시도를 반복할수록 평균적으로 시도당 0.5단위의 이익이 누적된다. 기댓값이 양수인 구조를 찾아내는 것이 장기적으로 유리한 분석의 핵심이다.
반대로 기댓값이 음수인 구조에서는 승률이 아무리 높아도 시도를 반복할수록 손실이 누적된다. 승률 70%라도 기댓값이 음수라면 장기적으로 불리한 구조다.
두 개념이 충돌하는 실제 사례
축구 경기에서 강팀이 약팀을 상대할 때를 생각해본다. 강팀의 승리 확률이 75%로 평가된다고 가정한다. 이 경우 배당률은 낮게 설정되어 있어, 강팀 승리에 1단위를 투입하면 성공 시 0.2단위만 획득하고 실패 시 1단위를 잃는 구조가 된다.
기댓값을 계산하면 (0.75 × 0.2) + (0.25 × -1) = 0.15 – 0.25 = -0.10이다. 승률 기준으로는 75%의 높은 성공 가능성이지만, 기댓값은 음수다. 이 구조에서 시도를 반복하면 장기적으로 손실이 누적된다. 승률이 높은 선택이 기댓값 측면에서는 불리한 구조일 수 있다는 것을 이 사례가 명확히 보여준다.
배당률이 기댓값 계산에 미치는 역할
기댓값은 확률만으로 결정되지 않는다. 배당률, 즉 성공 시 획득하는 손익의 크기가 기댓값 계산의 핵심 변수다. 동일한 확률 구조라도 배당률이 달라지면 기댓값이 완전히 바뀐다.
이것이 스포츠 분석에서 배당률을 단순히 승패 예측의 참고 자료로만 볼 수 없는 이유다. 배당률은 시장이 반영하는 확률 추정치이며, 동시에 기댓값 계산의 직접적인 입력값이다. 시장의 확률 추정과 자신의 분석 결과 사이의 차이, 즉 엣지(edge)를 찾아내는 것이 기댓값 기반 분석의 목표다.
시장이 특정 팀의 승리 확률을 40%로 평가하지만 독립적인 분석에서 55%로 추정된다면, 이 차이가 양의 기댓값을 만들어내는 구조적 근거가 된다.
단기 결과와 장기 기댓값의 괴리
기댓값이 양수인 구조에서도 단기적으로는 손실이 발생할 수 있다. 확률은 장기적인 수렴을 보장하지만, 단기적인 결과는 기댓값과 상당한 편차를 보인다. 이 편차를 분산(variance)이라 한다.
분산이 높은 구조에서는 기댓값이 양수임에도 불구하고 연속적인 손실이 발생할 수 있다. 이때 단기 결과만을 보고 분석 방법론에 문제가 있다고 판단하는 것은 오류다. 반대로 기댓값이 음수인 구조에서 단기적으로 수익이 발생했다고 해서 해당 구조가 유리하다고 결론 짓는 것도 잘못된 판단이다.
장기적으로 일관된 결과를 평가하려면 충분한 표본 크기가 필요하다. 소수의 시도만으로 승률이나 기댓값의 유효성을 판단하는 것은 통계적으로 의미 없다.
승률 중심 사고가 만드는 인지적 함정
승률은 직관적으로 이해하기 쉽기 때문에 분석의 기준으로 자연스럽게 선택된다. 그러나 승률 중심의 사고는 여러 인지적 함정을 만들어낸다.
성공 횟수가 많을수록 분석 능력이 높다는 착각이 대표적이다. 실제로는 성공의 크기와 실패의 크기를 함께 고려해야 분석의 실질적인 가치를 평가할 수 있다. 또한 승률을 높이기 위해 기댓값이 낮은 선택을 반복하는 패턴도 발생한다. 확률이 높은 결과에 집중하면 승률은 올라가지만, 배당률 구조상 기댓값은 낮아지는 역설이 생긴다.
기댓값 기반 분석의 실전 적용
기댓값 기반 분석을 실전에 적용하려면 두 가지 핵심 능력이 필요하다. 첫째, 독립적인 확률 추정 능력이다. 시장 배당률에 의존하지 않고 경기 데이터, 팀 전력, 상황 변수를 바탕으로 자체적인 확률을 추정하는 과정이다. 둘째, 시장 배당률과 자체 추정 확률의 차이를 수치화하는 능력이다. 이 차이가 양의 기댓값을 만드는 구조인지를 계산하는 것이 판단의 근거가 된다.
이 두 능력은 단기간에 습득되지 않는다. 반복적인 분석과 결과 기록, 그리고 기댓값과 실제 결과의 편차를 지속적으로 추적하는 과정이 수반되어야 한다.
결론
승률은 분석의 출발점이 될 수 있지만, 분석의 최종 기준이 되어서는 안 된다. 기댓값은 승률이 담지 못하는 손익의 구조를 반영하며, 장기적인 분석의 유효성을 판단하는 실질적인 기준이다. 승률이 높더라도 기댓값이 음수인 구조는 장기적으로 불리하고, 승률이 낮더라도 기댓값이 양수인 구조는 장기적으로 유리하다. 이 원칙을 분석 방법론의 핵심으로 내재화하는 것이 더 정확하고 지속 가능한 스포츠 분석의 기반이 된다.




