‘땅뜬비’로 땅볼%와 뜬공% 추정하기

[야구공작소 장원영] 공인구 변경은 올 시즌 KBO 리그의 가장 큰 화두였다. 시즌이 지나며 공인구 효과가 유의미하게 드러나자 필자는 공인구 변경으로 인해 누가 가장 홈런을 손해 봤을지 궁금해졌다. 공개된 타구 트래킹 데이터가 없는 만큼 각 타자의 ‘홈런/뜬공’ 비율 변화로 이를 가늠해 보고자 했다.

하지만 뜻밖의 난관에 봉착했다. ‘홈런/뜬공’ 기록을 그 어디에서도 찾을 수 없었다. KBO 기록실, 스탯티즈 등 모든 곳을 뒤져봐도 ‘홈런/뜬공’ 기록은 없었다.

그나마 스탯티즈에서 ‘홈런/뜬공 아웃’이란 기록을 찾을 수 있었다. 얼핏 그럴듯해 보였지만, 분자(홈런)가 분모(뜬공 아웃)의 부분집합이 아니기 때문에 명확한 의미를 찾기 어려웠다. 해당 기록을 그대로 쓰기는 위험했다.

그래서 아예 땅볼%와 뜬공%를 추정하기로 했다. 그리고 기왕 하는 김에 투수의 땅볼%와 뜬공%도 추정하기로 했다. 복잡하게 할 것 없이 간단한 방법을 썼다. KBO 리그 타자들의 뜬공%를 추정하는 방법은 다음과 같다.


1. 메이저리그 타자들의 ‘땅볼 아웃/뜬공 아웃(GO/AO)’ 값을 X라고 하자.

2. 메이저리그 타자들의 뜬공%를 Y라고 하자.

3. Y = aX + b와 같은 관계식을 구한다.

4. KBO 리그 타자들의 ‘땅볼 아웃/뜬공 아웃’ 값을 Z라고 하자.

5. Z를 3번 식에 대입해 KBO 리그 타자들의 뜬공% 추정치를 구한다.


말이 추정이지 간단한 산수다. 새로운 방법도 아니다. 이미 8년 전 팬그래프에 소개됐고, 이를 KBO리그에 대입하는 작업도 4년 전 선행된 바 있다.

데이터가 많이 필요하지는 않았다. 매 시즌 비슷한 관계식이 도출됐으며, 한 시즌 데이터만으로도 유의미한 상관관계를 발견할 수 있었다. 아래는 2018년 규정이닝과 규정타석을 소화한 메이저리거의 데이터로 그린 그래프와 관계식이다. 각 추정식의 정확도를 높이기 위해 ‘땅볼 아웃/뜬공 아웃’ 값에 자연로그를 취했다.

타자와 투수 중에선 투수가, 땅볼%와 뜬공% 중에선 땅볼%가 ‘땅볼 아웃/뜬공 아웃’ 기록과 더 높은 상관관계를 보였다. 공교롭게도 타자의 뜬공%가 넷 중 가장 낮은 상관관계를 나타냈다.

이에 대해선 다양하게 해석할 수 있다. 우선 땅볼과 뜬공 유도는 타자보다 투수의 몫이 더 크다. 투수의 영향력이 강하게 작용한다는 뜻이다. 즉 타자의 ‘땅볼 아웃/뜬공 아웃’ 기록이 항상 일정한 땅볼%와 뜬공%를 보장하지는 않는다.

뜬공%의 상관관계가 땅볼%보다 상대적으로 낮아 보이는 이유는 따로 있다. ‘땅볼 아웃/뜬공 아웃’에서 ‘뜬공 아웃’은 라인드라이브 타구를 포함하지만, 뜬공%는 라인드라이브 타구를 포함하지 않는다. 여기서 추가로 오차가 발생한다.

물론 0.76의 결정계수도 충분히 강한 상관관계이므로 추정식으로 사용하기에 큰 무리는 없다. 위에서 구한 식에 올 시즌 KBO 리그 타자들의 ‘땅볼 아웃/뜬공 아웃’ 기록을 대입하면 다음과 같다.

KBO 리그 타자 땅볼%와 뜬공% 추정치(규정타석, 9월 11일까지)

꽤 그럴듯한 결과가 나왔다. 완벽한 방법은 아니지만 괜찮은 대안은 될 수 있다. KBO 리그뿐만 아니라 마이너리거의 기록을 추론하는 데도 쓸 수 있다. 물론 하루빨리 땅볼 타구와 뜬공 타구가 집계돼서 이 글이 효용을 다하는 게 가장 바람직한 방향이다. 다음 글에서는 이렇게 구한 뜬공%를 토대로 KBO 리그 타자들의 홈런/뜬공 기록 변화를 살펴보도록 하겠다.

KBO 리그 투수 땅볼%와 뜬공% 추정치(규정이닝, 9월 11일까지)

기록 출처: FanGraphs Baseball, Baseball Reference, STATIZ

에디터 = 야구공작소 배고재, 조예은

표지 사진 = Wikimedia Commons

ⓒ야구공작소. 출처 표기 없는 무단 전재 및 재배포를 금합니다. 상업적 사용은 별도 문의 바랍니다.

Be the first to comment

댓글 남기기