새로운 연구가 축구 팬들이 수년 동안 논쟁해 왔던 질문에 답하기 위해 착수했다: 통계가 경기가 시작되기도 전에 무슨 일이 일어날지 예측할 수 있는가? 연구자들은 알아내기 위해 여러 리그의 20만 건이 넘는 프로 경기 결과를 분석했다. 그들은 모든 팬에게 친숙한 정보, 즉 리그 순위, 최근 기량, 홈 또는 원정 여부, 그리고 그 동일한 팀들 간의 이전 맞대결을 사용하여 모델을 구축했다. 그 접근 방식의 핵심에는 초기 가정으로 시작하여 새로운 정보가 도착함에 따라 그것을 업데이트하는 방법인 베이즈 모델이 있다. 좋은 기량을 보이거나 순위표 상위권에 있는 팀들은 일반적으로 계속해서 좋은 성과를 내기 때문에, 첫 번째 가정은 현재 리그 순위표와 최근 성과에서 나온다. 그 모델은 또한 축구에서 지속적인 요인인 홈 이점을 설명한다. 역사적으로, 홈 팀은 부분적으로 관중의 응원, 경기장에 대한 익숙함, 그리고 줄어든 이동 피로 때문에 더 자주 승리한다. 두 클럽이 여러 번 서로 맞붙었을 때, 그 결과들은 추가적인 맥락을 더한다. 일부 라이벌 관계는 빈번한 무승부를 낳고, 다른 것들은 일방적이며, 일부는 막상막하이다. 충분한 역사가 존재할 때, 그 모델은 과거 결과를 지나치게 강조하지 않고 그것의 기본 확률을 미묘하게 조정한다. 정확성을 테스트하기 위해, 그 연구자들은 역사적 데이터를 사용하여 그들의 시스템을 훈련시킨 다음, 시스템이 이전에 본 적 없는 시즌을 예측하기 위해 그것을 사용했다. 그 모델은 단 하나의 답을 출력하지 않았다. 대신 그것은 홈 승리, 무승부, 또는 원정 승리라는 세 가지 결과에 대한 확률을 제시했다. 예를 들어, 그것은 홈 승리에 48%, 무승부에 25%, 그리고 원정 승리에 27%를 추정했을 수 있다. 그 결과는 순위, 기량, 경기장(venue), 그리고 맞대결 기록을 신중하게 사용함으로써, 알고리즘이 데이터 기반의 의미 있는 경기 전 배당률을 생성할 수 있음을 시사한다 - 이는 확신이 아니라, 더 많은 경기가 진행됨에 따라 향상되는 정보에 기반한 예측이다.