'PitchF/X'에 해당되는 글 16건
- 04:08:22 타자 핫존분석 샘플
- 2008/05/14 재기를 꿈꾸는 박찬호 (6)
- 2008/05/12 Cliff Lee the Undisputed
- 2008/04/29 The relationships between RPS and Movement of Balls
- 2008/04/28 그림으로 살펴본 패스트볼
- 2008/04/26 공의 회전수와 무브먼트의 관계
- 2008/04/17 공의 회전수(rpm)을 구하는 공식 (6)
- 2008/04/14 왕첸밍 피칭에 눈뜨다. (2)
- 2008/04/14 pbp 주소 컨버터 (5)
- 2008/04/13 2008년 PFX 무브먼트에 따른 구종 분석
물론 우리가 바라던 그 모습, 1회부터 타자를 상대하는 예전의 모습은 아니지만, 성적으로 말하는 세계에서 볼때, 그는 현재 확실히 돌아왔다. 코리안 특급 박찬호...
12게임 25이닝의 시간 동안에, 평균 자책점은 2.16, whip은 1.31을 기록했다. 휩에 비해 낮은 방어율, 여기에 예전의 삼진률만 보탤수 있었다면 정말 좋았을텐데 말이다.(현재 그는 25이닝 동안 9개의 삼진을 잡아냈다.)
아는 분의 부탁으로 박찬호 선수의 pfx데이터를 가지고 놀아 보았는데, 이걸 그냥 둔다는게 상당히 아까웠다.
하지만 국내에서 이 글을 써 내려간다는 것이 어떤 의미를 가지는지 현재 키보드를 두드리는 본인도 익히 알고 있는지라, 자료를 뽑아놓고도 선뜻 글을 쓰기가 쉽지는 않았다. 그렇다고 해서 울고있는 자료를 그냥 내버려둘 수도 없는일 아닌가...
그래서 나도 할말은 하기로 했다.
표본
먼저, 이 표본들은 박찬호 선수의 12회 등판 중 홈에서 있었던 6회의 등판을 기준으로 계산해낸 것들이다. 원정 자료를 조사대상에서 제외한 이유는, pfx 시스템이 구장에 따라 약간씩 다른 수치를 제공한다는 정보가 있었기 때문이다.(무브먼트 분석 외에 크게 적용될 만한 것은 없지만, 일단은 모든 원정경기 자료는 제외했다.)
이러한 과정을 통해 본인의 수중에 들어온 공의 갯수는 195개였다.
구종 분포와 무브먼트
구종 분포를 살펴보면, 패스트볼이 약 52%, 슬라이더가 28%, 커브가 10% 정도를 차지한다. 커터와 스플리터가 보이긴 하지만, 스플리터로 기록된 공은 5월 7일에서 2개만이 기록되었을 뿐이므로, 현재 박찬호 선수가 뿌리는 구종은 패스트볼, 슬라이더, 커브, 체인지업 정도로 나눌수 있겠다.
왼쪽은 구종별 pfx_x, pfx_z값들의 평균치이고, 오른쪽은 개별 분포도이다. 패스트볼이 두 부류로 나뉘는 것을 볼수가 있는데, 한쪽은 비교적 포심에 가까운 밋밋한 움직임을 보이고, 한쪽은 종/횡적 움직임이 다른쪽보다 좋다. 2008시즌 박찬호 선수가 뿌리는 공에서, 포심을 크게 찾아볼 수는 없다는 점을 미루어 볼때, 둘다 투심이되 약간은 다른 형태가 아닌가 생각한다.
평균적 무브먼트를 가지고 이야기를 하자면, 일단 아래의 그림을 봐주었으면 한다.
통상적인 우투수의 pfx무브먼트 가이드인데, 박찬호 선수의 각 구종 무브먼트는 거의 평균에 가깝다.
슬라이더와 커브의 경우, 횡적인 이동량이 조금 적다는 정도 외에, 각 구종별 무브먼트가 위의 가이드라인 영역에 전부 들어간다. 2008시즌의 박찬호 선수는 예전의 80마일대 파워커브를 가지고 있지도 않으며, 전성기 시절의 슬러브를 가지고 있다거나, 93-95마일을 넘나드는 라이징 포심 패스트볼을 뿌리고 있지도 않은, 그냥 평균적 구질을 지닌 평범한 투수이다.(그의 경험과 커리어를 빼고 보았을 때)
평범한 구질로 괜찮은 성적을 내는 데는, 어떤 다른 노하우가 있지는 않을까 해서, 좌/우 타자별 공의 로케이션을 살펴보았다.
로케이션
(붉은 부분이 통상적으로 스트라이크 존이라 여겨지는 부분이다. 단위는 인치(=2.4cm))
(원의 테두리만을 남긴 이유는 분포도 상에서 최대한 공의 크기를 나타내어 보고자 해본 하나의 시도이다.)
vs 좌타자
커터가 인코스로 파고든다는 것이 가장 먼저 눈에 띈다. 비단 커터 뿐만이 아니라 전반적으로 공이 좌타자의 안쪽이나, 존 하단에 형성되는데, 이를 통해 박찬호 선수의 좌타자 공략법을 조금이나마 파악할수 있다.
좌표 (32,-8)근방에 찍힌 점은, 루이스 카스티요가 땅볼을 쳤을 때 기록된 것인데, 기록상의 오류가 아닌가 싶다.
vs 우타자
재미있는 것이, 우타자를 상대로, 다져 스타디움에서 박찬호 선수는 슬라이더, 패스트볼, 커브만을 던졌다. 좌타자를 상대로 다양한 레파토리를 구사한 것과는 대조적이다. 그리고 공의 분포가, 우타자의 안쪽 보다는 바깥쪽으로 쏠리는 것을 볼수가 있다. 좌타자에게는 파고드는것처럼 보이는 구질이 우타자에게는 바깥쪽으로 휘어져 나가는 구질이기 때문에, 아마 이러한 특성을 이용해서 우타자를 공략하는것이 아닌가 하는 추측을 해볼수 있다.
인플레이
박찬호 선수는 다져 스타디움에서 11개의 1루타와 1개의 2루타를 허용했는데(기록상으로 1루타가 12개일 가능성도 있다), 좌타자를 상대로는 전부 단타였으며, 우타자를 상대로 하나의 2루타를 허용했다. 그리고 안타를 허용한 구종은 11개가 패스트볼, 1개가 체인지업 이었다. 분포도에서도 보이듯이, 12개의 공 중에서 존 중앙으로 몰렸다고 판단할 만한 공은 하나 정도로, 실투에 의한 안타 허용이라고 보기는 어려웠다.
헛스윙+스트라이크 상황
이번에는, 스트라이크로 판정된 공 즉 헛스윙이나, 심판에 의해 스트라이크로 불려진 공의 위치를 알아보자.(파울볼은 이 아래에서 보도록 하겠다.)
(각 상황별 구종을 표시하려고 했으나 그러기에는 시간적, 기능적 제약이 크다. 단위는 인치)
굉장이 특이한 점을 볼수 있는데, 분포도의 오른쪽 즉, 좌타자의 안쪽이자 우타자의 바깥쪽에 헛스윙이 집중되어 있다는 점이다. 거의가 공 한개 또는 반개 차이의 헛스윙이라는 점을 놓고 볼때, 타자가 스윙을 하고저 판단해서 배트가 돌아가기 시작할 즈음에는 공이 존에서 흘러나오고 있는 류의 공들이었다는 것을 알 수 있겠다.(그리고 주로 슬라이더와 커브볼이었다.)
파울볼+아웃 상황
파울과 아웃 상황들은, 거의 그 자체가 존 분포도라고 할수 있을 정도로 복잡하다.
그리고 그라운드볼과 팝아웃/플라이볼 사이에서 차이점이 있었는데, 그라운드볼 즉 땅볼의 경우 주로 패스트볼에 의해 유도된 경우가 많았으며, 팝아웃/플라이볼 즉 뜬공의 경우에 슬라이더와 커브에 의해 유도된 경우가 많았다.
또 한가지, 존 안으로 들어간 공들은 주로 땅볼로 유도되었고, 존 바깥으로, 또는 존 근처에서 형성된 공들은 파울, 또는 뜬공의 비율이 좀더 높았다.
아까 무브먼트 자료와 합해서 생각해 본다면, 존 안에 형성된 , 즉 땅볼을 유도한 공들 중 패스트 볼에 한해서 보면, 이 패스트볼들은 종적인 무브가 좀더 강한 패스트볼들이 아닐까 추측을 해볼수 있겠다.
파울에 대해 말하지 않는 이유는, 파울은 그다지 논의할 꺼리가 없기 때문이다. 존 바깥쪽에 형성된 파울의 경우, 커트해내고자 하는 의도의 타구들이였을 가능성이 크고, 존 안에 들어간 공들에서 유도된 파울의 경우에는 주로 심하게 빗맞거나, 홈 플레이트를 친다거나 한 종류의 공들일 가능성이 높기 때문이다.(괜히 눈만 아프게 파울 분포도를 그래프에 삽입한 점에 대해서는 여러분께 죄송하다는 말씀을 드리고 싶다.)
분포도를 최대한 공의 크기에 맞춰서 만들다 보니 필요없게 상당히 커져버렸다. (보는 입장에서도 이런 큰 그림은 불편하고, 글 쓰는 입장에서도 그림의 길이에 맞춰서 뭔가를 지어내야 하다보니 상당히 까탈스러운 그림이다.)
현재 박찬호 선수는 상황에 맞게 땅볼과 뜬공을 유도하려고 하는게 아닌가 한다. 투심을 통해 땅볼을 유도하고, 존 근처에 형성되는 슬라이더와 커브를 통해 뜬공을 유도한다고 가정했을때 말이다.(뭐 아무리 제구가 잘된 공도 "뜨거운"타자들에게는 통하지 않긴 하지만..)
맺으며
박찬호 선수가 메이저 리그에 데뷔한지도 어언 14년이 흘렀다. 그만큼 박찬호 선수도 소위 말하는 롤러코스터 피칭에 대한 자신만의 해법을 가졌을 때가 되었고, 또 중간 계투라는 점을 감안 할 때 공 하나 하나에 더욱 집중할 수 있는 기회를 가지게 되었다. 선발투수가 아닌 릴리버로서의 박찬호 선수를 평가하기에는 아직 시기 상조일지도 모르겠다. 또한 릴리버로서 예전 선발일때의 모습을 계속 보여주는 현재의 박찬호 선수는 성적과는 다르게 꽤나 상당한 불안 요소를 지녔다고 평가할 수 밖에 없다.
릴리버로서 공을 던질때와 선발로 공을 던질때의 공 자체가 다를 수 밖에 없다고 생각하는 본인은, 박찬호 선수가 선발로 보직변경 되었을 때에도 지금과 같은 성적을 낼 것이라고 생각하지는 않는다.
평균 정도의 구위로 릴리버를 하기에는 한번의 등판에서 던지는 공이 몇개 되지 않기 때문에(선발에 비해서) 그 구위를 가지고도 평균 또는 그 이상의 성적이 가능하겠지만, 선발로서 평균 구위로 장시간 투구할 경우 난타당할 위험성에 대해서 그 누구도 간과할 수 없을 것이다.
많은 이들이 성적을 토대로 박찬호 선수의 선발 가능성, 또 2008시즌 재기상 수상 가능성을 논하고 있다.
자국 선수들에게 조국의 응원은 분명히 감사한 것임에 틀림없다. 하지만 이제 겨우 한달 하고도 반 정도가 지났고, 아직 갈길은 멀다. 소화한 경기수로 따지자면, 이제 25%선을 겨우 돌파했다. 산으로 치자면, 매표소 지나 이제 계단좀 오르는 시기에서 "야호~"하자는 거랑 별반 다를게 없어보인다.
진심어린 응원도 좋지만, 그 사랑하는 마음이 박찬호 선수가 있는 팀 자체, 그리고 다져스 팀원을 저주하는 일이 되지는 않았으면 좋겠다.
저의 이해도 부족으로 인해, pfx_z의 값을 통해 분석한 클리프 리의 패스트볼이 싱커성이라고 언급했었습니다. 하지만 그것이 pfx_z변수에 대한 제 이해도 부족임이 드러난 시점에서, 그것을 "싱커"에서 "라이징"성으로 수정해 놓았습니다. 오해 없으시길 바랍니다.
0.81, 0.604, 6, 521... 무슨 숫자일까? 언뜻 보기에도 전혀 관계는 없어 보인다. 특히나 옆에 보이는 투수와는 말이다. 하지만 위의 4가지 숫자 모두가, 2008년 5월 12일 현재 인디언스의 투수 클리프 리와 확실히 관계가 있는 것들이다.
방어율 0.81, WHIP 0.604, 6승, 조정방어율 521.
44.2이닝동안 삼진 39개...
클리프 리가 등판한 모든 경기에서, 인디언스는 승리를 따냈다. 아직까지는, 그를 향해 그 어떤 비난도 할 수가 없다. 한마디로 클리프 리는 완벽하다.
수식어는 이쯤 붙여두고, 본론으로 넘어가자.
이전에도 클리프 리에 관해 아주 잠깐 언급한 적이 있었지만, 올 시즌 클리프 리는 그 누구보다도 패스트볼 구사율이 높은 선수이다. 2008시즌 6회의 등판동안 Pitch-FX시스템에 기록된 600개의 투구 중, 패스트볼이 무려 494개, 82.3%를 차지하고 있었다.
필자가 실제로 본 경기에서도, 그의 패스트볼 구사율은 실로 엄청나게 높았다. 보통의 투수들이 3이닝을 투구하거나 타순이 한번 돌아올 경우에 투구 패턴에 변화를 주는 것과 달리, 클리프 리는 시작부터 마운드에서 내려갈 때 까지 주욱 패스트볼 하나로 세계 최고의 타자들을 유린하고 있었다.(현재까지는 "요리"라는 표현보다는 "유린"이라는 표현이 좀더 적당한거 같다.)
그의 무기들은 얼마나 위력적인 것이길래, 이토록 타자들이 거의 손을 못쓰고 있는 것일까?
| 평균구속 | pfx_x | pfx_z | brk | SPIN | RPS | |
| 패스트볼 | 89.69332 | 6.097848 | 11.13245 | 4.212146 | 152.0794 | 41.96743 |
| 커브 | 74.88958 | -6.53742 | -6.38804 | 13.82292 | 310.7984 | 24.64804 |
| 체인지업 | 81.09048 | 7.115571 | 6.731548 | 7.495238 | 140.3079 | 31.69941 |
| 슬라이더 | 81.22857 | -0.77386 | 2.986286 | 8.257143 | 206.786 | 13.03371 |
| 커터 | 84.31111 | -2.30789 | 5.185 | 6.611111 | 211.0445 | 18.36532 |
본인도 숫자보단 역시 그림이 좋다. 그림으로 살펴보자.
(표에 있는 커다란 원들은, 커브볼과 패스트볼 무브먼트의 평균치를 나타낸 것이다.)
일단 수평적 이동량을 따져보기 전에, 우리는 수직적 움직임을 살펴볼 필요가 있다. 보통의 패스트볼들은, 수직 이동량에 있어서 8-11정도의 값을 가지게 되는데, 분포도에서 보이듯 클리프 리의 수직 이동량은 평균을 크게 웃돈다. 그래프의 단위가 인치라는점을 생각해보자. 야구공의 지름이 약 3인치 정도이다. 이동량 8-11 정도의 패스트볼과, 분포도에서 보이는 클리프 리의 패스트볼은, 타자들에게 있어서 거의 공 하나 정도의 공백을 가져다 주게 된다. 그냥 보통 쳐내던 패스트볼이라고 보다간 큰코 다치는 거다.
쉽게 말하면, 클리프 리의 패스트볼은 수치상으론 거의 라이징(rising) 성이다.
올 시즌만을 놓고 보기에, 수준급이라는 그의 커브볼을 분석해 보기에는, 그 표본의 수가 너무 적었다.
그리고 클리프 리 자신도 커브를 주로 사용하기 보다는, 타자를 삼진 또는 범타로 묶어내는 킬링 피치로서 아주 필요할 때만 꺼내드는 것 같은 느낌을 받았다.
GO/AO 비율의 증가
2008시즌, 클리프 리에게서 찾아볼수 있는 중요한 점이라면, 땅뜬비가 비약적으로 증가했다는 것이다.
올 시즌 이전까지, 클리프 리의 땅뜬비는 0.61이었다. 그러나 08시즌 그의 땅뜬비는, 무려 1.08에 달한다. 물론 피안타율에 있어서도, 거의 이정도 비율로 감소했지만,(통산 .260 ~ .270의 범위, 08시즌 .163) 투수 자신의 타입이 변한 것이 아니라면 땅뜬비도 거의 비슷하게 유지되어야 하는게 아닐까 싶었다. 정말 아쉬웠던 점은 역시 작년의 자료를 구할수가 없다는 것이였다. 작년 자료를 구할수 있었다면, 패스트볼에서의 차이가 있는지 없는지를 알수가 있었을텐데 말이다.
일단, 범타로 유도된 공들의 로케이션을 포수 시점으로 찍어 보았다.
(분홍색 안의 지점은 스트라이크 존이라고 생각하면 되겠다.)
특이점 이라면, 존 안으로 형성된 공들은 거의가 플라이볼/라인 드라이브 였으며, 존 근처로 형성되었던 공들은 거의 그라운드 아웃이었다는 점이다. 놀라운 점은, 이 분포도에도 클리프 리의 구종 분포가 비슷하게 적용된다는 점이다. 즉, 플라이 아웃으로 유도된 공이라 하여 커브나 체인지업이 대부분이었던게 아니라, 저 분포도의 공들 역시 대부분은 패스트볼이라는 것이다. 그리고 존의 사용빈도를 보면, 수직적으로 존의 1/3 ~ 2/3 지점을 거의 "사랑"하고 있는 것을 볼수가 있다. 이 로케이션은 좌우 제구가 되지 않을 경우에 소위 말하는 "실투"가 될 가능성이 높은 구간임을 감안할 때, 왠만한 강심장이나 자신의 공에 대한 자신감 없이는 저 위치로 공을 뿌려대기가 힘들다고 생각한다.(그리고 실제로 공의 로케이션을 보라. 심지어 존 한복판에 형성되는 것들도 있다.)
본인은 이 분포도를 어디선가 본 적이 있었는데, 바로 뉴욕 양키즈 왕첸밍의 로케이션 분포도였다.
Josh Kalk가 제공한, 왕첸밍의 분포도인데, 존 안에서의 황색 역삼각형(범타유도) 분포도를 보면, 클리프 리와 거의 비슷하다.
그럼 헛스윙한 공들은 어디로 꼽혔을까?
(여전히 높은 패스트볼 구사율을 눈으로 볼수가 있다.)
존 위쪽에 형성된 헛스윙 분포를 제외한다면, 큰 다른 점은 없다.
Lee the Undisput-ING?
어떻게든 파헤쳐 보고자 시작한 글이지만, 현재의 클리프 리는 스스로가 무너지지 않는 한, 무너질 일이 없을것 같아 보인다. 불과 몇일 사이에 믿던 구위가 안좋아질 일이 있겠는가? 그리고 클리프 리는 메커니즘 상의 불안 요소에 대해 큰 지적을 받은 일도 없다. 위에서 왕첸밍과 클리프 리의 성향이 비슷하다고 썼지만, 누가 누구의 성향과 비슷하다는 말은 아마도 올시즌 말 까지는 상당히 아껴두어야 할 것 같다.
리는 아직까지 무패, 무결점의 투수이고, 당분간은 그러하지 않을까.....
I picked 22starters for my analysis, and if there was no pfx logs, I excluded them.
(for example, there is no pfx logs in Tyoko Dome Opener)
The criteria for these 22 starters are,
1. Starters who has the most Ks
2. Starters who showed impressive perfomance in April 2008.
3. Starters who was the Cy-young nominees(or got Cy-young award)
I got 9818 sample balls from these starters and 5965 of them were fastballs, and 5800 balls were remained when I excluded datas that was located out of the standard deviation(understable ranges, not the theoritical sigma range). And These are the results of their fastball average values.
| Name | Team | SPEED(KMH) | STDEV | DIFF | PFX | BRK | RPS | FA# | Balls# | FA% |
| J. Weaver | ANA | 90.4(145.46) | 1.83 | 8.48 | 13.01 | 2.93 | 41.02 | 169 | 497 | 34.00% |
| D. Haren | ARI | 90.34(145.36) | 1.74 | 7.82 | 12.99 | 4.48 | 41.79 | 203 | 416 | 48.80% |
| D. Cabrera | BAL | 93.94(151.15) | 1.62 | 9.10 | 12.34 | 4.62 | 40.70 | 399 | 489 | 81.60% |
| D. Matsuzaka | BOS | 91.07(146.53) | 1.46 | 9.37 | 12.51 | 4.29 | 39.83 | 207 | 394 | 52.54% |
| J. Beckett | BOS | 95.17(153.13) | 1.90 | 9.01 | 12.52 | 4.91 | 42.09 | 207 | 268 | 77.24% |
| C. Zambrano | CHC | 90.34(145.36) | 2.05 | 6.44 | 11.30 | 5.77 | 36.95 | 346 | 471 | 73.46% |
| J. Cueto | CIN | 93.04(149.7) | 1.39 | 7.30 | 11.23 | 3.09 | 37.63 | 264 | 439 | 60.14% |
| A. Harang | CIN | 88.59(142.54) | 1.97 | 6.95 | 12.81 | 3.84 | 40.72 | 282 | 460 | 61.30% |
| C. Hamels | PHI |
88.26(142.02) | 2.08 | 6.63 | 12.93 | 3.74 | 41.19 | 281 | 525 | 53.52% |
| C.C. Sabathia | CLE | 93.6(150.61) | 1.28 | 7.93 | 11.77 | 4.34 | 39.27 | 320 | 458 | 69.87% |
| C. Lee | CLE | 89.95(144.73) | 1.35 | 7.76 | 13.82 | 4.15 | 44.24 | 349 | 412 | 84.71% |
| J. Verlander | DET | 93.31(150.14) | 2.00 | 8.99 | 15.58 | 5.59 | 51.15 | 195 | 489 | 39.88% |
| R. Oswalt | HOU | 92.19(148.33) | 1.35 | 7.98 | 10.80 | 4.53 | 35.47 | 274 | 467 | 58.67% |
| B. Sheets | MIL | 92.16(148.28) | 1.19 | 7.36 | 12.11 | 3.28 | 40.11 | 217 | 378 | 57.41% |
| J. Santana | NYN | 90.64(145.84) | 1.56 | 7.29 | 11.23 | 4.63 | 36.47 | 246 | 440 | 55.91% |
| J. Peavy | SDN | 93.24(150.02) | 1.27 | 9.10 | 12.48 | 4.78 | 40.86 | 253 | 547 | 46.25% |
| F. Hernandez | SEA | 94.89(152.69) | 1.35 | 8.74 | 11.14 | 4.80 | 37.35 | 319 | 542 | 58.86% |
| M. Cain | SFN | 92.91(149.5) | 1.64 | 8.62 | 12.89 | 3.16 | 42.31 | 346 | 474 | 73.00% |
| J. Sanchez | SFN | 90.12(145) | 2.26 | 7.97 | 12.13 | 5.16 | 38.83 | 319 | 383 | 83.29% |
| T. Lincecum | SFN | 95.47(153.62) | 1.72 | 8.72 | 12.73 | 2.93 | 42.99 | 335 | 493 | 67.95% |
| R. Halladay | TOR | 92.08(148.16) | 1.73 | 8.11 | 10.41 | 6.23 | 34.04 | 222 | 403 | 55.09% |
| D. McGowan | TOR | 94.89(152.68) | 1.66 | 9.48 | 12.77 | 3.84 | 42.43 | 212 | 373 | 56.84% |
Speed is described in MPH and numbers in ( ) is the the unit of KMH(Kilometers per Hour, the Korean unit). Stdev is the standard deviation of start speed, DIFF is the diffrerence between average speed of start and end speed. And maybe you already know what pfx and brk(break) means. FA# is the number of fastballs, and Balls# is the number of all balls in their log. FA% is the portion of fastballs. RPS is the Rotation per Second(not RPM, R per minute)
I tried to get relationships between start speed and RPS of fastballs. My hypothesis was,
"The Faster the ball is, the more spin it has to be"
But I found it was silly when I saw my results. See the graph below.
Show the value of R square. The tendency line(I don't know the exact terms to decribe this, maybe trend line?) has no meaning to this graph.
BECAUSE, each pitcher has their unique movement in their fastball and each pitcher has their unique RPS in their fastball(regardless of the speed)
For example, there is the pitcher who has average start speed of 93 miles and has RPS of high 30s(the case of Cueto), there is pitcher like average speed of 93 MPH and RPS over 50(case of Verlander)
Let's see this in picture.
As you see, there is many pitchers located in speed of 90 to 95 mph, and 35 to 45 in rps. What I want to say is, the rps of ball IS NOT AN ABSOLUTE CRITERIA FOR SPEED, there's somewhat other varibles effect on the value of rps.
So, I merger 5800 fastballs in to one excel sheet and separated them to 1 mile criteria.(85 to 97 in unit of 1mile per hour)
TO 85 to 97 MPH, there was 12 intervals and 5500 samples, and their relationship was very interesting to me. Let's see that.
The value of Y axis is RPS, ans value of x-axis is decribed in the picture.
As you see above, the value of R square has very siginificnat meaning compared to speed-rps relationships. And the relationship was decribed in every 12 intervals.
| MOVEMENT - RPS Relationship | |||
| speed range | Formula | R^2 | Sample# |
| 85-86 | 3.1525x-3.67 | 0.8348 | 101 |
| 86-87 | 3.0805x-2.7342 | 0.9030 | 115 |
| 87-88 | 3.3946x-6.5701 | 0.9138 | 192 |
| 88-89 | 3.2884x-4.5288 | 0.9187 | 370 |
| 89-90 | 3.1882x-2.662 | 0.9244 | 486 |
| 90-91 | 3.249x-3.0762 | 0.9329 | 571 |
| 91-92 | 3.3829x-4.3772 | 0.9146 | 745 |
| 92-93 | 3.3303x-3.2576 | 0.9054 | 803 |
| 93-94 | 3.3855x-3.6724 | 0.9192 | 741 |
| 94-95 | 3.2175x-1.1906 | 0.9486 | 672 |
| 95-96 | 3.0155x+0.9232 | 0.9696 | 448 |
| 96-97 | 3.2262x-0.315 | 0.9582 | 270 |
I got this formulas but I don't know how to apply these into speed-rps-movement relationship.
But I got one important lessons from today's analysis.
"RPS is not an absolute guideline for ballspeed. But we can expect that the more rps it has, the more movement it has to be."
And in datas above, horizontal movement value has the big portion on them, so I have to correct or revise on sinking 2-seamers like fastballs by Halladay, Wang.
Thank you for reading.
Mingu, Song.
If you have any questions about this article, contact me landor82 at gmail.com or write comments below in the blue box(click the blue button when you finished writing your comment.)
통상적으로 무브먼트 값을 통해 특정 영역을 투심, 특정 영역을 포심으로 분류하고는 있습니다만..
이것 또한 그리 정확한 방법은 아니지요.. 왜냐하면,
2. 릴리즈 포인트(개인마다의 특성, 한 개인이 항상 일정 위치에서 공을 뿌릴수는 없기때문에 나타나는 변위차)에서의 달라지는 변위차에 의해 공의 무브먼트가 달라질 수 있다.
3. 팔의 각도, 또는 투수의 세밀한 움직임에 따라서도 공의 구질은 큰 변화를 보인다.
이런 종류의 이유들이 있기 때문이지요.
PFX Wiki에서 통상적인 구종에 대한 무브먼트별 분류를 아래 그림과 같이 내놓긴 했습니다만, 이 무브먼트의 기준이 무엇인지가 안나와 있는 관계로, 실제로 적용할 수가 없습니다.
이러한 그림인데, 문제는 여기 있는 좌표값에 맞게 제 데이터를 뽑아낼 수 없다는 데에 있습니다.
그래서 일단 통상적인 분류법(x좌표는 pfx전체값, y좌표는 Break값)으로 각 투수별 패스트볼의 무브먼트를 나누어 보았습니다.
22명에게 동일하게 적용시켜본 결과, 몇명의 투수들에게서 재미있는 분포도가 나오더군요.
이 그림은, 제가 조사범위에 포함시킨 22명의 선발투수에게서 뽑아낸 5,649개의 패스트볼을 전부 도표로 찍어본 것입니다. PFX값은 5-15사이에 대부분 위치하고, Break값은 1에서 8까지 좀더 다양한 양태를 보입니다.
그럼 투수별 분포도를 통해서 좀더 세밀히 파고들어가 보겠습니다.
오리올스의 대니얼 카브레라의 경우, 굉장히 독특했습니다. 보통 투수의 경우, 포심만을 던진다면 pfx값 5-15 사이에서, pfx값이 높아질수록 break값이 낮아지는 선형적 분포를 띄게됩니다. 예를 들자면 아래와 같은 분포도를 띄지요.
신시내티 신인투수 쟈니 쿠에토의 패스트볼 분포도입니다. 대략 선형적 분포를 그려줍니다.
하지만 아까 보셨듯, 카브레라의 경우 상당히 둥글둥글한 분포를 띕니다. 계속 분석을 해 봐야겠지만, 22명중 가장 특이한 분포도라고 볼수 있겠습니다.
다음은 2가지 구질이라고 확연히 드러나는 분포를 가진 투수들을 보겠습니다.
디트로이트 타이거즈의 저스틴 벌랜더의 패스트볼 분포도입니다. 무브먼트 상으로 투심과 포심이 확연히 드러납니다. 일단 저 영역표시는, 제 가정하에 둔 것입니다만, 통상적으로도 저정도 무브먼트를 투심과 포심의 경계선 정도로 생각하고 있습니다. 이와는 비슷하지만, 2가지 분포를 보이되, 그 경계가 거의 보이지 않거나, 한쪽 무리의 분포가 모호한 경우도 있습니다.
컵스의 에이스 카를로스 잠브라노 패스트볼 분포도입니다. 뭔가 포심의 분포도를 이루는것 같으면서, 투심은 그 분포가 모호합니다. 포심이라 판정할 수 있는 영역의 가로범위가, 투심 영역과 겹치고, 수직적 영역으로도 서로 살짝씩 겹쳐버립니다. 이러한 경우에, 샘플이 좀더 수집되고 이 중간 부분이 만약에 채워져 버린다면, 투심과 포심이라 구분해 버린 가정 자체가 무효가 되는 것이라 봐야하겠지요.
그리고, 싱커볼러들에게서 볼수 있는, 싱커를 패스트볼로 잘못 기록하여 나타나는 분포도도 있습니다.
즉 포심-투심-그리고 아주 약간의 싱커가 포함되는 분포도라 할수있겠지요.
로이 할러데이의 분포도입니다. 투심이라 여겨지는 분포는 확실한데 비해, 포심의 영역에 있어 그 샘플이 부족하고, 위에서 말씀드렸던 싱커라 의심되는 패스트볼의 분포가 보입니다. 그러나 에이스 싱커볼러들의 경우에, 투심성 패스트볼이나 그 자신의 싱커나 구속에서의 차이가 별로 없어서, 그걸 무브먼트 이외에 판단할수 있는 수단이 전혀 없습니다. 88마일 2심도 보일수 있고, 92마일 싱커도 기록될수 있다는 것이지요.
그리고 마지막, 이건 어찌해야할지 분포 자체가 황당한 경우들이 있겠습니다.
White Pedro, 로이 오스왈트입니다. 완전 산개형이지요. 분포도 상으로 이건 어딜 꼭집어 포심이라 할수도 없고, 그렇다 하여 어떤 영역을 집어 투심이라 할수도 없습니다. 오스왈트의 경우에는 초반 컨디션 난조의 영향이라고 여기고, 앞으로의 샘플 수집을 통해 그 오차를 줄여나가고자 하고 있습니다.
시애틀의 왕, 킹 펠릭스입니다. 대니얼 카브레라와 비슷한 분포를 띄면서, 더 재미있는 것은, 수직이동량은 거의 투심급이라는 것입니다. 킹 펠릭스가 투심을 구사한다는건 이미 데뷔 스카우팅 리포트부터 알려진 사실이지만, 포심또한 구사한다는 것을 생각해 보았을때, 포심의 분포도가 전혀 나타나지 않는다는 점은 상당히 흥미로웠습니다.
샌프란시스코의 슈퍼영건, 팀 린스컴입니다. 뭔가 평행한 두개의 무리가 거의 붙어서 존재합니다.
분홍색 영역의 무리도 포심의 무브먼트 특성을 따라 분포하는것으로 생각해 볼때, 분홍색 영역은 흰색 영역에 비해 릴리즈 포인트에서 뭔가 다른점이 있지 않을까 예상해 보았습니다. 실제로, 배니스터의 경우 같은 구종의 릴리즈 포인트를 변화시킴으로써 같은 구종이되 다른 구질이 되도록 하고 있습니다.(같은 싱커의 변화량이 조금 다른 양태를 보입니다.)
신기한 것은 같은팀 동료 맷 케인에게서도, 이러한 분포가 나타난다는 점입니다.
린스컴과 케인은 진짜 같은사람이 던진게 아닐까 할정도의 비슷한 패스트볼 양태를 보여줍니다. 아까 제가 릴리즈 포인트의 차이를 언급한 이유도, 같은팀의 두 선수가 같은 양태를 보여주기 때문에 무언가 메커니즘에서 관련된게 아닐까 생각했었기 때문이었습니다. 같은 선수가 5일에 2번 등판하지 않는 이상 아무리 패스트볼에 한정된 분포지만 이런 쌍둥이같은 양태가 나타날 수는 없는거 아닐까요?
원래 오늘의 목적은 투심과 포심을 나눔으로써, 그 구종별 스핀수의 차이를 통해 이전 글에서의 논의를 좀더 파고들고자 함이었습니다만, 분포도를 통해서 이걸 따로 나눈다는 것이 아직은 샘플상 많이 부족해 보이고, 또 몇개 나누어본 결과론 아직 그 생각한 바의 데이터들이 나오지 않고 있어서, 일단 왜 그런일이 발생하는가에 대해서 간단한 이유를 알려드리는 쪽으로 방향을 전환했습니다.
개인적으로 개인별 샘플 200개이상, 전체샘플 6000개 정도면 패스트볼 하나는 왠만큼 분석이 가능할거라 생각했습니다만, 아직 표본이 부족한거 같습니다. 좀더 많은 투수와, 좀더 많은 등판기회를 통해서 샘플을 많이 확보하는게 시급한거 같네요.
문제는 22명을 한번 이렇게 하는데만도 12시간씩 날라간다는 것이겠지요....
생각은 주중에도 항상 하고있겠지만, 글은 거의 주말에만 쓸수밖에 없겠네요....
그럼 또 다음에 뵙겠습니다.
이 글은 제가 개인적으로 선정한 22명의 선발투수들의 패스트볼을 비교해 보기 위해서 하는 X-treme Fastball 프로젝트의 일부임을 밝힙니다.
고로 글을 쓴 후에도 언제든 수정될수 있습니다.
먼저 샘플로 뽑아본 선수들은, 위에서 말했듯 22명입니다. 그리고, 2008년 게임데이 pfx데이터가 존재하는 로그만 따로 추렸습니다.
(보스턴-오클랜드간 일본 원정경기는 pfx자료가 없음. 템파베이 홈경기의 경우 pfx자료가 없음)
뽑은 기준은 현재 삼진수가 많은 선발투수이거나, 또는 인상적인 성적을 올리고 있는 선수들, 그리고 과거 사이영상 또는 그에 준하는 성적을 올린 선수들입니다.
또한 표본으로 쓸수 있는 공의 갯수는 총 9818개였으며, 이 중 패스트볼은 5965개, 그리고 표준편차에 따른 오차범위를 벗어난 자료를 제외한 유효한 패스트볼의 샘플갯수는 약 5800개 정도였습니다.
그리고 아래의 표는 이 선수들의 4월달 패스트볼의 평균치입니다.
| Name | Team | SPEED(KMH) | STDEV | DIFF | PFX | BRK | RPS | FA# | Balls# | FA% |
| J. Weaver | ANA | 90.4(145.46) | 1.83 | 8.48 | 13.01 | 2.93 | 41.02 | 169 | 497 | 34.00% |
| D. Haren | ARI | 90.34(145.36) | 1.74 | 7.82 | 12.99 | 4.48 | 41.79 | 203 | 416 | 48.80% |
| D. Cabrera | BAL | 93.94(151.15) | 1.62 | 9.10 | 12.34 | 4.62 | 40.70 | 399 | 489 | 81.60% |
| D. Matsuzaka | BOS | 91.07(146.53) | 1.46 | 9.37 | 12.51 | 4.29 | 39.83 | 207 | 394 | 52.54% |
| J. Beckett | BOS | 95.17(153.13) | 1.90 | 9.01 | 12.52 | 4.91 | 42.09 | 207 | 268 | 77.24% |
| C. Zambrano | CHC | 90.34(145.36) | 2.05 | 6.44 | 11.30 | 5.77 | 36.95 | 346 | 471 | 73.46% |
| J. Cueto | CIN | 93.04(149.7) | 1.39 | 7.30 | 11.23 | 3.09 | 37.63 | 264 | 439 | 60.14% |
| A. Harang | CIN | 88.59(142.54) | 1.97 | 6.95 | 12.81 | 3.84 | 40.72 | 282 | 460 | 61.30% |
| C. Hamels | CIN | 88.26(142.02) | 2.08 | 6.63 | 12.93 | 3.74 | 41.19 | 281 | 525 | 53.52% |
| C.C. Sabathia | CLE | 93.6(150.61) | 1.28 | 7.93 | 11.77 | 4.34 | 39.27 | 320 | 458 | 69.87% |
| C. Lee | CLE | 89.95(144.73) | 1.35 | 7.76 | 13.82 | 4.15 | 44.24 | 349 | 412 | 84.71% |
| J. Verlander | DET | 93.31(150.14) | 2.00 | 8.99 | 15.58 | 5.59 | 51.15 | 195 | 489 | 39.88% |
| R. Oswalt | HOU | 92.19(148.33) | 1.35 | 7.98 | 10.80 | 4.53 | 35.47 | 274 | 467 | 58.67% |
| B. Sheets | MIL | 92.16(148.28) | 1.19 | 7.36 | 12.11 | 3.28 | 40.11 | 217 | 378 | 57.41% |
| J. Santana | NYN | 90.64(145.84) | 1.56 | 7.29 | 11.23 | 4.63 | 36.47 | 246 | 440 | 55.91% |
| J. Peavy | SDN | 93.24(150.02) | 1.27 | 9.10 | 12.48 | 4.78 | 40.86 | 253 | 547 | 46.25% |
| F. Hernandez | SEA | 94.89(152.69) | 1.35 | 8.74 | 11.14 | 4.80 | 37.35 | 319 | 542 | 58.86% |
| M. Cain | SFN | 92.91(149.5) | 1.64 | 8.62 | 12.89 | 3.16 | 42.31 | 346 | 474 | 73.00% |
| J. Sanchez | SFN | 90.12(145) | 2.26 | 7.97 | 12.13 | 5.16 | 38.83 | 319 | 383 | 83.29% |
| T. Lincecum | SFN | 95.47(153.62) | 1.72 | 8.72 | 12.73 | 2.93 | 42.99 | 335 | 493 | 67.95% |
| R. Halladay | TOR | 92.08(148.16) | 1.73 | 8.11 | 10.41 | 6.23 | 34.04 | 222 | 403 | 55.09% |
| D. McGowan | TOR | 94.89(152.68) | 1.66 | 9.48 | 12.77 | 3.84 | 42.43 | 212 | 373 | 56.84% |
간단히 용어를 설명드리자면, SPEED는 구속을 마일로 나타낸 것이고, 괄호안의 단위는 KM/h입니다.
STDEV는 구속의 표준편차, DIFF는 초속-종속간의 차이(단위는 mph), PFX는 중력을 제외한 공의 이동량, BRK는 중력에 의한 공의 상하이동량, RPS는 공의 초당회전수,
FA#는 샘플링된 패스트볼의 갯수, Balls#는 총 샘플의 갯수, FA%는 총 투구수 중 패스트볼의 구사비율입니다.
또한 빨간색은 최대값, 파란색은 최소값을 나타냅니다.
일단은 가장 간단한 관계를 알아내 보기 위해서, 속도와 회전수 간의 일반적인 관계를 만들어보려 노력했습니다만, 아래 그래프를 보시면 그게 왜 무모한 시도인지 알게 되실겁니다.
(rps : rotation per second. 초당 회전수)
R의 제곱값이 말해주듯, 저기 있는 추세선의 의미는 거의 0에 가깝습니다.
그 이유는 선수들의 패스트볼 마다 평균적인 무브먼트가 다르며, 또 선수들의 패스트볼 마다 속도에 따른 초당 회전수가 다 다릅니다.
평균 93마일대의 패스트볼을 뿌리면서 rps가 40이 안되는 선수도 있고(Cueto), 평균 93마일대의 패스트볼을 뿌리면서 평균 rps가 50이 넘는 선수(Verlander)도 있습니다.
위의 말을 그림으로 옮겨보지요.
90-95마일 사이의 영역에 많은 투수들이 겹칩니다. 그리고 rps또한 35-45사이의 거의 비슷한 값을 나타내고 있지요. 즉, 공의 회전수는 구속의 절대적인 잣대라기 보다는, 무언가 다른 변수의 영향을 더 받는다는 것이지요.
그래서 저는 약 5800개의 패스트볼 자료를 하나로 묶어, 각각을 1마일 단위로 나누어 생각해 보기로 하였습니다.
85마일에서 97마일까지, 12개 구간 5500여개의 표본이 나왔고, 이들의 회전수-무브먼트 간의 상관관계를 알아보았습니다. 아래의 그림은 그중 가장 샘플이 많았던 91-92mph구간의 결과입니다.
x축은 MOVEMENT, y축은 RPS입니다.
보시는 것과 같이, 어떠한 식을 유도해 낼 만큼의 상당히 괜찮은 분포를 이루고 있습니다. 그리고, 이러한 관계는 85-97마일 전구간에서 나타났습니다.
| MOVEMENT - RPS Relationship | |||
| speed range | Formula | R^2 | Sample# |
| 85-86 | 3.1525x-3.67 | 0.8348 | 101 |
| 86-87 | 3.0805x-2.7342 | 0.9030 | 115 |
| 87-88 | 3.3946x-6.5701 | 0.9138 | 192 |
| 88-89 | 3.2884x-4.5288 | 0.9187 | 370 |
| 89-90 | 3.1882x-2.662 | 0.9244 | 486 |
| 90-91 | 3.249x-3.0762 | 0.9329 | 571 |
| 91-92 | 3.3829x-4.3772 | 0.9146 | 745 |
| 92-93 | 3.3303x-3.2576 | 0.9054 | 803 |
| 93-94 | 3.3855x-3.6724 | 0.9192 | 741 |
| 94-95 | 3.2175x-1.1906 | 0.9486 | 672 |
| 95-96 | 3.0155x+0.9232 | 0.9696 | 448 |
| 96-97 | 3.2262x-0.315 | 0.9582 | 270 |
(x는 공의 movement값)
저도 아직 이걸 어떻게 다시 구속과 관계를 지어야 할지에 대해서는 생각중입니다만, 오늘의 분석을 통해 한가지 결론을 낼수 있었습니다.
"회전수가 많다고 해서 결코 공이 빠른것은 아니다. 그러나 회전수가 많다면 그 공의 움직임이 좋다는 판단을 해 볼수는 있다."
아직 이 결론에서 벗어나는 표본무리들도 꽤 있기 때문에, 지금은 수직이동과