볼배합의 정석(定石)을 찾아서 (2/2)

볼배합의 정석(定石)을 찾아서(1/2) 에 이어 계속

[야구공작소 김지호] 타자의 입장에서 상대 투수를 분석할 때 가장 기본적인 접근은 투수가 몇 가지 구종을 가지고 있으며 구사 비율은 어떠하고, 여기에 주무기는 무엇인지를 알아보는 방식이다. 타자 입장에서는 투수가 가장 많이 구사하는 공부터 공략의 가능성을 살필 것이다. 어떤 공을 많이 던지는지 뻔히 알지만 알고도 치기 힘든 공이라면 이 공을 포기하고 다른 공을 공략하기로 결정하고, 공략하기로 결정한 공이 주로 언제 들어오는지 살펴볼 것이다. 이와 같은 단계로 분석하며 실전을 준비하고, 타석에서는 사전 준비를 토대로 투수의 투구를 예측한다. 구종 예측에서 구종가치(실점억제력)의 고려가 매우 중요한 요소임을 강조하기 위해 이렇게 긴 말을 이어왔다.

야구는 상대방이 존재하는 게임이다. 이는 상대방의 행동에 따라서 최선의 결과를 얻기 위한 나의 행동이 변할 수 있음을 의미한다. 경제학의 한 분야인 ‘게임이론’에서는 다양한 상황에서 경기 참여자가 취해야 하는 최선의 선택을 연구한다. 여기에서는 게임이론에서 활용하는 ‘혼합전략 내쉬균형’이라는 개념을 활용하고자 한다. 궁금해할 독자를 위해서 개념을 썼지만 사실 게임이론을 몰라도 논의의 이해에는 아무 지장이 없다.

 

투수가 어느 공을 던질지 예측해 배팅 여부를 결정해야 하는 타자의 처지는 홀짝게임이나 가위바위보와 같은 상황에서 무엇을 선택해야 할지 결정해야 하는 참가자의 입장과 유사하다. 게임이론에서는 게임에 참여하는 두 참여자가 게임으로부터 얻을 것으로 기대하는 ‘보상의 기댓값’이 같아지는 지점을 게임의 균형점이라 한다.

예를 들어 A와 B가 가위바위보를 한다고 하자. 만약 가위, 바위, 보 중 어떤 것으로 이겨도 서로 10만 원을 준다고 하면 양측 모두 셋 중 어느 것을 내도 전략적으로 아무 차이가 없다.

반면 가위, 바위로 이기면 그대로 10만 원을 주는데 보로 이기면 20만 원을 준다고 해 보자. 이 경우 보의 이득이 더 크므로 양측 모두 가급적이면 보로 이기고 싶을 것이다.  이때 극단적으로 A는 모든 경우에서 보만 내는데 B는 가위:바위:보를 계속 1:1:1로 낸다면 어떻게 될까? A는 1/3 확률로 20만원을 벌고 1/3 확률로 10만원을 잃으며 1/3 확률로 비기므로 시간이 갈수록 A가 돈을 벌게 된다. 시간이 지나 이 점을 B가 눈치채면 당연히 가위의 비율을 늘릴 것이고, 가위가 많아지면 이제 A가 돈을 잃으므로 전략을 수정해 보만 내지 않고 바위의 비율을 높일 것이다. 그리고 이렇게 비율 조정을 반복하다 보면 어느 순간 양측 모두 비율 조정을 하지 않는 것이 유리해지는 ‘균형점’이 생긴다.

이 ‘균형점’의 핵심은, 어느 한쪽이 균형점을 벗어나 과도한 욕심(보로 이기고 싶다는)을 부리면, 다른 한쪽이 그에 대응해 가위를 늘려 욕심을 ‘응징’할 수 있다는 것이다. 투구로 비유하자면, 직구가 좋다고 해서 과도하게 직구만 던지면 타자가 그에 대응해 직구만 노림으로써 그것을 응징할 수 있다는 것이다.

 

같은 원리로 투수가 던지는 공의 득점 억제력을 구종가치로 정의한다면, 해당 구종의 기댓값은 구종가치에 구종의 구사 비율을 곱한 값이 된다. 게임이론에서는 게임에 참여하는 참여자의 기댓값이 0이 되는 지점에서 게임의 균형이 형성됨을 밝히고 있다. 이를 최적 구종 밸런스 찾기 작업으로 연결 지어 본다면, 구종간 기댓값의 편차가 적을수록 투수의 구종 밸런스는 최적에 가까운 값이라고 할 수 있다.

분석에 활용한 구종가치는 SIS가 팬그래프에 제공하는 100구당 구종가치다. 이를 활용해서 구종별 기댓값을 구하고 구종별 기댓값들의 편차를 계산했다. 구종가치의 편차가 낮을수록 게임이론의 관점에서는 균형에 가까워진다고 가정했고, 이를 투수가 던지는 구종간 가치를 고려한 예측 난이도를 집약하는 숫자로 활용했다. 숫자가 0에 가까울수록 구종의 예측이 어려운 밸런스로 투구를 구성하고 있는 투수임을 의미한다. 패스트볼의 기댓값은 (패스트볼의 구사비율) X (패스트볼의 구종가치) 과 같이 계산한다. 이와 같은 방식으로 구종별 기댓값을 구하고 기댓값들의 편차를 구해서 분석에 활용했다.

 

구종가치 기댓값의 편차(이하 구종편차)가 앞서 설명한 엔트로피와 다른 점은 구종 가치의 고려에 있다. 자신이 던지는 구종 중에서 실점 억제 능력이 가장 뛰어난 공을 주무기라고 부른다면, 주무기의 구종 가치는 자신이 던지는 공 중에서 가장 높다. 가장 많은 안타를 맞는 공의 구종 가치는 가장 낮을 것이다.

문제는 구종 가치가 가장 높은 구종이 무엇인지를 타자도 잘 알고 있다는 사실이다. 언제든 원하는 코스에 던져서 타자를 잡아낼 자신이 있는 주무기지만 예측 가능성도 높다면 투수는 이를 얼마나 던지는 것이 최선일까를 게임이론적 시각에서 알려주는 숫자가 구종편차라고 할 수 있다.

예측 가능성이 높지만 타자가 알고도 못친다면 그 공을 많이 던져야 한다. 그러나 충분히 예측될만큼 많이 던지자 맞아나가기 시작한다면 자연스럽게 구종가치는 하락한다. 이때는 해당 구종의 비율을 줄이면서 타자의 예측 가능성을 낮추어서 다른 구종과의 편차를 줄이는 조정이 변화한 상황에 대한 최적 대응이 된다. 상황에 따른 최적 선택은 존재하지만 불변의 정석은 존재할 수 없다.

(그룹별 선수 상세 명단은 Appendix 참조)

위 그림은 앞서 엔트로피와 같은 방식으로 WAR과 구종편차를 좌표에 표시하고, 두 변수의 평균을 중심으로 그룹 A~D로 구분한 결과다.

그룹 D는 구종편차가 평균 이하면서 WAR이 평균 이상인 선수들의 그룹이다. 바우어, 신더가드, 세일과 같은 선수들은 엔트로피 측면에서도, 구종편차 측면에서도 구종 밸런스상 예측의 난이도가 높은 선수들이라고 볼 수 있다. (물론 이들이 실제로 이런 논리로 구종 비율을 구성하고 있는지는 알 수 없다.)

그룹 A는 평균 이상의 WAR을 기록하고 있지만 구종 간 능력치까지 고려한 편차 측면에서는 평균 이상을 기록중인 선수들의 그룹이다. 상대방의 구종 예측 가능성을 낮추기보다는 자신의 주무기를 믿고, 그것을 극대화하는 유형이라고 볼 수 있다. 류현진과 그레인키는 엔트로피 측면에서는 예측의 난이도가 높은 그룹이었지만 구종편차 기준으로는 분류가 바뀐 점이 재미있다.

1편에서와 마친가지로 팀별로 편차를 살펴보았다. 팀 이름이 적혀 있지 않은 첫번째 그룹은 시즌중 이적한 투수들을 뭉쳐 만든 가상의 팀이다.

두 변수를 동시에 비교하면 위와 같은 결과를 관찰할 수 있다. 그림을 중심으로 글을 읽고 계실 독자를 위해 다시 요약하자면, 엔트로피는 그 값이 높을수록 구종 예측의 난이도가 높아짐을 의미한다. 단, 엔트로피 논의에서는 주무기와 같은 개념을 고려하지 않는다. 그저 몇가지 구종을 어떤 비율로 섞어 던지는가에만 집중한다면 엔트로피가 높은 투수, 높은 구단일수록 예측하기 어렵게 잘 섞어 던지고 있다고 판단할 수 있다.

만약 자주 던져서 타자를 잡아내는 “주무기”라는 개념을 논의에 넣는다면 엔트로피보다는 구종편차의 활용을 추천한다. 투수가 잘 던지는 주무기지만, 문제는 투수의 주무기를 타자도 잘 알고 있기 때문이다. 상대방이 존재하는 게임에서 나의 주무기가 노출된 상황이라면 단순히 엔트로피 측면에서 얼마나 잘 배분된 볼배합인지가 아니라 상대방과 내가 반복된 게임에서 얻을 수 있는 기댓값이 0에 가까울수록 효율적인 선택이 됨을 앞서 밝혔다.

이제 거의 다 끝나간다. 길어도 어쩔 수 없다. 여기까지 왔는데 우짜겠노. 이 악물고 끝을 보겠다. 남은 작업은 구종 가치를 고려하지 않은 엔트로피와, 상대방이 존재하고 구종가치와 예측가능성을 동시에 고려하는 구종편차를 하나의 숫자로 합쳐서 숫자에 매몰되어 진짜 야구는 알지도 못하는 너드로서의 숙명인 줄세우기로 글을 마무리 짓고자 한다. 정규화, 역변환 등 몇 가지 작업을 거쳐서 엔트로피와 구종편차를 모두 포함하고 값이 커질수록 예측의 난이도가 증가하는 “어떤 값”을 구했으며, 이를 fWAR과 동시에 표시한 결과는 아래와 같다.

평균 이상의 WAR을 기록하는 선수들 중 특이한 선수들로는 그레인키, 바우어, 신더가드 등 1사분면의 선수들이다. 이미 규정이닝을 채우고 있는 선발 그룹내에서 WAR 평균 이상을 던지는 좋은 투수들임에도 불구하고 구종 예측의 난이도를 최대한 높게 유지하고 있는 그룹이기 때문이다(물론 전략적 구종 배분이 이들의 WAR에 어떤 영향을 미치고 있는지는 알 수 없다). 바우어와 그레인키가 세이버에 친숙한 선수인 점은 익히 알려져 있기에, 이들이 1사분면에 존재하는 사실이 새롭지는 않다. (는 거짓이다. 사실 여기까지 기나긴 논의를 이어온 입장에서는 조금 다행스러운 마음이 더 크다. “바우어 형님, 고맙습니다”)

WAR 평균 이상의 엘리트 선수들이 대부분 평균 이하의 다양성을 추구하고 있다(4사분면에 위치)는 사실은 당연하다. 예측 가능성이 높은 단순한 레파토리로 투구를 전개하지만, 타자가 알고도 못치는 자신만의 주무기가 있고 그것이 아직은 잘 작동하고 있는 선수들이기 때문이다.

나는 “애국자”이기에 최근 류현진의 부진에 가슴이 아프다. 만약 부진의 원인이 피로 누적이나 기타 투구 매커니즘의 문제에 기인했다면 이 글에서는 뭐 하나도 엮을 수가 없다. 하지만 구종 밸런스 등 전략적인 피칭에서 문제가 발생했다면, 상대로 하여금 예측의 난이도를 조금 높이는 쪽으로 약간의 구종 밸런스 조정도 가능해 보인다.

지금까지 엔트로피와 구종편차를 통해 구종 예측의 난이도에 대해서 살펴보았다. 살펴본 바, 정의한 변수 하에서 볼배합의 정석은 존재하지 않았다. 만약 정석이라는 것이 존재한다면 볼배합의 근본 목적이 실점 억제라는 측면에서 WAR과 엔트로피 및 편차는 명확한 관계성을 가졌어야 했다.

물론 논의에 피칭 시퀀스에 대한 고려가 빠졌기에 완벽한 검증이라고 볼 수는 없다. 하지만 시퀀스가 포함된다 하더라도 구종 밸런스에 항구적 정석은 존재하지 않는다는 명제는 변함이 없다. 즉 이상적인 구종 밸런스 결정 문제는 투수의 스타일과 능력치, 타자와 맞서는 상황에 따른 다름(Difference)과 상황적 최적 선택이 존재할 뿐 틀림(Wrong)이 존재하지 않는 것으로 볼 수 있다. 다양하게 구성해도 못하는 선수도 있고, 단순하게 구성해도 잘하는 선수는 잘하는 모습을 볼 수 있었다.

결국 틀린 것은 주무기를 적게 던진다고 중계에서 비난받던 투수가 아니라 다름과 틀림을 구분 못한 해설자였다. 최적의 구종 밸런스를 찾는 문제는 결코 간단치 않다.

 

에디터 = 야구공작소 오연우, 송민구

<자료출처>

  • https://www.fangraphs.com/
  • Baseballwithr.wordpress.com
  • 썩빡구의 세이버메트릭스 5
  • 게임이론 ( 김영세 )

ⓒ야구공작소. 출처 표기 없는 무단 전재 및 재배포를 금합니다. 상업적 사용은 별도 문의 바랍니다.

<Appendix : 그룹별 fWAR & 구종 기댓값 편차 리스트 >

<Appendix : 정규화 & 엔트로피 & 구종편차 Mix 결과 리스트>

<Appendix : 팀별 정규화 & 엔트로피 & 구종편차 Mix 결과 리스트>

2 Comments

댓글 남기기