먼저 알려드립니다.
저의 이해도 부족으로 인해, pfx_z의 값을 통해 분석한 클리프 리의 패스트볼이 싱커성이라고 언급했었습니다. 하지만 그것이 pfx_z변수에 대한 제 이해도 부족임이 드러난 시점에서, 그것을 "싱커"에서 "라이징"성으로 수정해 놓았습니다. 오해 없으시길 바랍니다.

사용자 삽입 이미지
0.81, 0.604, 6, 521... 무슨 숫자일까? 언뜻 보기에도 전혀 관계는 없어 보인다. 특히나 옆에 보이는 투수와는 말이다. 하지만 위의 4가지 숫자 모두가, 2008년 5월 12일 현재 인디언스의 투수 클리프 리와 확실히 관계가 있는 것들이다.

방어율 0.81, WHIP 0.604, 6승, 조정방어율 521.
44.2이닝동안 삼진 39개...



클리프 리가 등판한 모든 경기에서, 인디언스는 승리를 따냈다. 아직까지는, 그를 향해 그 어떤 비난도 할 수가 없다. 한마디로 클리프 리는 완벽하다.

수식어는 이쯤 붙여두고, 본론으로 넘어가자.
이전에도 클리프 리에 관해 아주 잠깐 언급한 적이 있었지만, 올 시즌 클리프 리는 그 누구보다도 패스트볼 구사율이 높은 선수이다. 2008시즌 6회의 등판동안 Pitch-FX시스템에 기록된 600개의 투구 중, 패스트볼이 무려 494개, 82.3%를 차지하고 있었다.
사용자 삽입 이미지



필자가 실제로 본 경기에서도, 그의 패스트볼 구사율은 실로 엄청나게 높았다. 보통의 투수들이 3이닝을 투구하거나 타순이 한번 돌아올 경우에 투구 패턴에 변화를 주는 것과 달리, 클리프 리는 시작부터 마운드에서 내려갈 때 까지 주욱 패스트볼 하나로 세계 최고의 타자들을 유린하고 있었다.(현재까지는 "요리"라는 표현보다는 "유린"이라는 표현이 좀더 적당한거 같다.)

그의 무기들은 얼마나 위력적인 것이길래, 이토록 타자들이 거의 손을 못쓰고 있는 것일까?

  평균구속 pfx_x pfx_z brk SPIN RPS
패스트볼 89.69332 6.097848 11.13245 4.212146 152.0794 41.96743
커브 74.88958 -6.53742 -6.38804 13.82292 310.7984 24.64804
체인지업 81.09048 7.115571 6.731548 7.495238 140.3079 31.69941
슬라이더  81.22857 -0.77386 2.986286 8.257143 206.786 13.03371
커터 84.31111 -2.30789 5.185 6.611111 211.0445 18.36532

본인도 숫자보단 역시 그림이 좋다. 그림으로 살펴보자.
사용자 삽입 이미지
(표에 있는 커다란 원들은, 커브볼과 패스트볼 무브먼트의 평균치를 나타낸 것이다.)

일단 수평적 이동량을 따져보기 전에, 우리는 수직적 움직임을 살펴볼 필요가 있다. 보통의 패스트볼들은, 수직 이동량에 있어서 8-11정도의 값을 가지게 되는데, 분포도에서 보이듯 클리프 리의 수직 이동량은 평균을 크게 웃돈다. 그래프의 단위가 인치라는점을 생각해보자. 야구공의 지름이 약 3인치 정도이다. 이동량 8-11 정도의 패스트볼과, 분포도에서 보이는 클리프 리의 패스트볼은, 타자들에게 있어서 거의 공 하나 정도의 공백을 가져다 주게 된다. 그냥 보통 쳐내던 패스트볼이라고 보다간 큰코 다치는 거다.

쉽게 말하면, 클리프 리의 패스트볼은 수치상으론 거의 라이징(rising) 성이다.

올 시즌만을 놓고 보기에, 수준급이라는 그의 커브볼을 분석해 보기에는, 그 표본의 수가 너무 적었다.
그리고 클리프 리 자신도 커브를 주로 사용하기 보다는, 타자를 삼진 또는 범타로 묶어내는 킬링 피치로서 아주 필요할 때만 꺼내드는 것 같은 느낌을 받았다.


GO/AO 비율의 증가

2008시즌, 클리프 리에게서 찾아볼수 있는 중요한 점이라면, 땅뜬비가 비약적으로 증가했다는 것이다.
올 시즌 이전까지, 클리프 리의 땅뜬비는 0.61이었다. 그러나 08시즌 그의 땅뜬비는, 무려 1.08에 달한다. 물론 피안타율에 있어서도, 거의 이정도 비율로 감소했지만,(통산 .260 ~ .270의 범위, 08시즌 .163) 투수 자신의 타입이 변한 것이 아니라면 땅뜬비도 거의 비슷하게 유지되어야 하는게 아닐까 싶었다. 정말 아쉬웠던 점은 역시 작년의 자료를 구할수가 없다는 것이였다. 작년 자료를 구할수 있었다면, 패스트볼에서의 차이가 있는지 없는지를 알수가 있었을텐데 말이다.
일단, 범타로 유도된 공들의 로케이션을 포수 시점으로 찍어 보았다.

사용자 삽입 이미지
(분홍색 안의 지점은 스트라이크 존이라고 생각하면 되겠다.)

특이점 이라면, 존 안으로 형성된 공들은 거의가 플라이볼/라인 드라이브 였으며, 존 근처로 형성되었던 공들은 거의 그라운드 아웃이었다는 점이다. 놀라운 점은, 이 분포도에도 클리프 리의 구종 분포가 비슷하게 적용된다는 점이다. 즉, 플라이 아웃으로 유도된 공이라 하여 커브나 체인지업이 대부분이었던게 아니라, 저 분포도의 공들 역시 대부분은 패스트볼이라는 것이다. 그리고 존의 사용빈도를 보면, 수직적으로 존의 1/3 ~ 2/3 지점을 거의 "사랑"하고 있는 것을 볼수가 있다. 이 로케이션은 좌우 제구가 되지 않을 경우에 소위 말하는 "실투"가 될 가능성이 높은 구간임을 감안할 때, 왠만한 강심장이나 자신의 공에 대한 자신감 없이는 저 위치로 공을 뿌려대기가 힘들다고 생각한다.(그리고 실제로 공의 로케이션을 보라. 심지어 존 한복판에 형성되는 것들도 있다.)

본인은 이 분포도를 어디선가 본 적이 있었는데, 바로 뉴욕 양키즈 왕첸밍의 로케이션 분포도였다.
사용자 삽입 이미지
Josh Kalk가 제공한, 왕첸밍의 분포도인데, 존 안에서의 황색 역삼각형(범타유도) 분포도를 보면, 클리프 리와 거의 비슷하다.
그럼 헛스윙한 공들은 어디로 꼽혔을까?

사용자 삽입 이미지
(여전히 높은 패스트볼 구사율을 눈으로 볼수가 있다.)

존 위쪽에 형성된 헛스윙 분포를 제외한다면, 큰 다른 점은 없다.


Lee the Undisput-ING?

어떻게든 파헤쳐 보고자 시작한 글이지만, 현재의 클리프 리는 스스로가 무너지지 않는 한, 무너질 일이 없을것 같아 보인다. 불과 몇일 사이에 믿던 구위가 안좋아질 일이 있겠는가? 그리고 클리프 리는 메커니즘 상의 불안 요소에 대해 큰 지적을 받은 일도 없다. 위에서 왕첸밍과 클리프 리의 성향이 비슷하다고 썼지만, 누가 누구의 성향과 비슷하다는 말은 아마도 올시즌 말 까지는 상당히 아껴두어야 할 것 같다.

리는 아직까지 무패, 무결점의 투수이고, 당분간은 그러하지 않을까.....
Daum 블로거뉴스
블로거뉴스에서 이 포스트를 추천해주세요.
Posted by Randoll

댓글을 달아주세요:: 네티켓은 기본, 스팸은 사절

MLB player tracker

2008/05/08 10:45

There is two sheets in this excel file. One is Pitchers and the other is Batters. I sorted them by teams in alphabetical order. If you wanna find the pid# of any player, just search within it.

This xls file includes the players who registered on Apr. 8. 2008.

엑셀 파일에 두가지의 시트가 있습니다. 하나는 타자, 하나는 투수입니다. 선수들은 팀별로 정렬되어있으며, 선수의 ID#를 찾으시려면 여기서 찾으시면 빠를거라고 생각합니다.

엑셀 파일내의 선수들은 2008년 4월 8일자 메이저리그 로스터에 등재된 선수들을 기준으로 합니다.
Daum 블로거뉴스
블로거뉴스에서 이 포스트를 추천해주세요.
Posted by Randoll

댓글을 달아주세요:: 네티켓은 기본, 스팸은 사절

The relationships between RPS and Movement of Balls

This article is for english users, Korean users go to this link.

I picked 22starters for my analysis, and if there was no pfx logs, I excluded them.

(for example, there is no pfx logs in Tyoko Dome Opener)

The criteria for these 22 starters are,

1. Starters who has the most Ks

2. Starters who showed impressive perfomance in April 2008.

3. Starters who was the Cy-young nominees(or got Cy-young award)

I got 9818 sample balls from these starters and 5965 of them were fastballs, and 5800 balls were remained when I excluded datas that was located out of the standard deviation(understable ranges, not the theoritical sigma range). And These are the results of their fastball average values.

Name Team SPEED(KMH) STDEV DIFF PFX BRK RPS FA# Balls# FA%
J. Weaver ANA 90.4(145.46) 1.83 8.48 13.01 2.93 41.02 169 497 34.00%
D. Haren ARI 90.34(145.36) 1.74 7.82 12.99 4.48 41.79 203 416 48.80%
D. Cabrera BAL 93.94(151.15) 1.62 9.10 12.34 4.62 40.70 399 489 81.60%
D. Matsuzaka BOS 91.07(146.53) 1.46 9.37 12.51 4.29 39.83 207 394 52.54%
J. Beckett BOS 95.17(153.13) 1.90 9.01 12.52 4.91 42.09 207 268 77.24%
C. Zambrano CHC 90.34(145.36) 2.05 6.44 11.30 5.77 36.95 346 471 73.46%
J. Cueto CIN 93.04(149.7) 1.39 7.30 11.23 3.09 37.63 264 439 60.14%
A. Harang CIN 88.59(142.54) 1.97 6.95 12.81 3.84 40.72 282 460 61.30%
C. Hamels PHI
88.26(142.02) 2.08 6.63 12.93 3.74 41.19 281 525 53.52%
C.C. Sabathia CLE 93.6(150.61) 1.28 7.93 11.77 4.34 39.27 320 458 69.87%
C. Lee CLE 89.95(144.73) 1.35 7.76 13.82 4.15 44.24 349 412 84.71%
J. Verlander DET 93.31(150.14) 2.00 8.99 15.58 5.59 51.15 195 489 39.88%
R. Oswalt HOU 92.19(148.33) 1.35 7.98 10.80 4.53 35.47 274 467 58.67%
B. Sheets MIL 92.16(148.28) 1.19 7.36 12.11 3.28 40.11 217 378 57.41%
J. Santana NYN 90.64(145.84) 1.56 7.29 11.23 4.63 36.47 246 440 55.91%
J. Peavy SDN 93.24(150.02) 1.27 9.10 12.48 4.78 40.86 253 547 46.25%
F. Hernandez SEA 94.89(152.69) 1.35 8.74 11.14 4.80 37.35 319 542 58.86%
M. Cain SFN 92.91(149.5) 1.64 8.62 12.89 3.16 42.31 346 474 73.00%
J. Sanchez SFN 90.12(145) 2.26 7.97 12.13 5.16 38.83 319 383 83.29%
T. Lincecum SFN 95.47(153.62) 1.72 8.72 12.73 2.93 42.99 335 493 67.95%
R. Halladay TOR 92.08(148.16) 1.73 8.11 10.41 6.23 34.04 222 403 55.09%
D. McGowan TOR 94.89(152.68) 1.66 9.48 12.77 3.84 42.43 212 373 56.84%

Speed is described in MPH and numbers in ( ) is the the unit of KMH(Kilometers per Hour, the Korean unit). Stdev is the standard deviation of start speed, DIFF is the diffrerence between average speed of start and end speed. And maybe you already know what pfx and brk(break) means. FA# is the number of fastballs, and Balls# is the number of all balls in their log. FA% is the portion of fastballs. RPS is the Rotation per Second(not RPM, R per minute)

I tried to get relationships between start speed and RPS of fastballs. My hypothesis was,

"The Faster the ball is, the more spin it has to be"

But I found it was silly when I saw my results. See the graph below.

사용자 삽입 이미지


Show the value of R square. The tendency line(I don't know the exact terms to decribe this, maybe trend line?) has no meaning to this graph.

BECAUSE, each pitcher has their unique movement in their fastball and each pitcher has their unique RPS in their fastball(regardless of the speed)

For example, there is the pitcher who has average start speed of 93 miles and has RPS of high 30s(the case of Cueto), there is pitcher like average speed of 93 MPH and RPS over 50(case of Verlander)

Let's see this in picture.

사용자 삽입 이미지

As you see, there is many pitchers located in speed of 90 to 95 mph, and 35 to 45 in rps. What I want to say is, the rps of ball IS NOT AN ABSOLUTE CRITERIA FOR SPEED, there's somewhat other varibles effect on the value of rps.

So, I merger 5800 fastballs in to one excel sheet and separated them to 1 mile criteria.(85 to 97 in unit of 1mile per hour)

TO 85 to 97 MPH, there was 12 intervals and 5500 samples, and their relationship was very interesting to me. Let's see that.

The value of Y axis is RPS, ans value of x-axis is decribed in the picture.

사용자 삽입 이미지

As you see above, the value of R square has very siginificnat meaning compared to speed-rps relationships. And the relationship was decribed in every 12 intervals.

MOVEMENT - RPS Relationship
speed range Formula R^2 Sample#
85-86 3.1525x-3.67 0.8348 101
86-87 3.0805x-2.7342 0.9030 115
87-88 3.3946x-6.5701 0.9138 192
88-89 3.2884x-4.5288 0.9187 370
89-90 3.1882x-2.662 0.9244 486
90-91 3.249x-3.0762 0.9329 571
91-92 3.3829x-4.3772 0.9146 745
92-93 3.3303x-3.2576 0.9054 803
93-94 3.3855x-3.6724 0.9192 741
94-95 3.2175x-1.1906 0.9486 672
95-96 3.0155x+0.9232 0.9696 448
96-97 3.2262x-0.315 0.9582 270

I got this formulas but I don't know how to apply these into speed-rps-movement relationship.

But I got one important lessons from today's analysis.

"RPS is not an absolute guideline for ballspeed. But we can expect that the more rps it has, the more movement it has to be."

And in datas above, horizontal movement value has the big portion on them, so I have to correct or revise on sinking 2-seamers like fastballs by Halladay, Wang.


Thank you for reading.


Mingu, Song.



If you have any questions about this article, contact me landor82 at gmail.com or write comments below in the blue box(click the blue button when you finished writing your comment.)

Daum 블로거뉴스
블로거뉴스에서 이 포스트를 추천해주세요.
Posted by Randoll

댓글을 달아주세요:: 네티켓은 기본, 스팸은 사절

이전 글에서, 포심과 투심을 나눠서 분석해야 되지 않느냐는 말씀들이 많았습니다. 물론 저도 기본적으론 그렇게 하고저 생각을 했습니다. 근데 이걸 실질적으로 나누는게 쉽지많은 않습니다.
통상적으로 무브먼트 값을 통해 특정 영역을 투심, 특정 영역을 포심으로 분류하고는 있습니다만..
이것 또한 그리 정확한 방법은 아니지요.. 왜냐하면,

1. 신체 사이즈에 의한 무브먼트 차이가 있을수 있다.
2. 릴리즈 포인트(개인마다의 특성, 한 개인이 항상 일정 위치에서 공을 뿌릴수는 없기때문에 나타나는 변위차)에서의 달라지는 변위차에 의해 공의 무브먼트가 달라질 수 있다.
3. 팔의 각도, 또는 투수의 세밀한 움직임에 따라서도 공의 구질은 큰 변화를 보인다.


이런 종류의 이유들이 있기 때문이지요.


PFX Wiki에서 통상적인 구종에 대한 무브먼트별 분류를 아래 그림과 같이 내놓긴 했습니다만, 이 무브먼트의 기준이 무엇인지가 안나와 있는 관계로, 실제로 적용할 수가 없습니다.
사용자 삽입 이미지
이러한 그림인데, 문제는 여기 있는 좌표값에 맞게 제 데이터를 뽑아낼 수 없다는 데에 있습니다.

그래서 일단 통상적인 분류법(x좌표는 pfx전체값, y좌표는 Break값)으로 각 투수별 패스트볼의 무브먼트를 나누어 보았습니다.
22명에게 동일하게 적용시켜본 결과, 몇명의 투수들에게서 재미있는 분포도가 나오더군요.

사용자 삽입 이미지

이 그림은, 제가 조사범위에 포함시킨 22명의 선발투수에게서 뽑아낸 5,649개의 패스트볼을 전부 도표로 찍어본 것입니다. PFX값은 5-15사이에 대부분 위치하고, Break값은 1에서 8까지 좀더 다양한 양태를 보입니다.
그럼 투수별 분포도를 통해서 좀더 세밀히 파고들어가 보겠습니다.

사용자 삽입 이미지

오리올스의 대니얼 카브레라의 경우, 굉장히 독특했습니다. 보통 투수의 경우, 포심만을 던진다면 pfx값 5-15 사이에서, pfx값이 높아질수록 break값이 낮아지는 선형적 분포를 띄게됩니다. 예를 들자면 아래와 같은 분포도를 띄지요.
사용자 삽입 이미지
신시내티 신인투수 쟈니 쿠에토의 패스트볼 분포도입니다. 대략 선형적 분포를 그려줍니다.
하지만 아까 보셨듯, 카브레라의 경우 상당히 둥글둥글한 분포를 띕니다. 계속 분석을 해 봐야겠지만, 22명중 가장 특이한 분포도라고 볼수 있겠습니다.

다음은 2가지 구질이라고 확연히 드러나는 분포를 가진 투수들을 보겠습니다.

사용자 삽입 이미지
디트로이트 타이거즈의 저스틴 벌랜더의 패스트볼 분포도입니다. 무브먼트 상으로 투심과 포심이 확연히 드러납니다. 일단 저 영역표시는, 제 가정하에 둔 것입니다만, 통상적으로도 저정도 무브먼트를 투심과 포심의 경계선 정도로 생각하고 있습니다. 이와는 비슷하지만, 2가지 분포를 보이되, 그 경계가 거의 보이지 않거나, 한쪽 무리의 분포가 모호한 경우도 있습니다.

사용자 삽입 이미지

컵스의 에이스 카를로스 잠브라노 패스트볼 분포도입니다. 뭔가 포심의 분포도를 이루는것 같으면서, 투심은 그 분포가 모호합니다. 포심이라 판정할 수 있는 영역의 가로범위가, 투심 영역과 겹치고, 수직적 영역으로도 서로 살짝씩 겹쳐버립니다. 이러한 경우에, 샘플이 좀더 수집되고 이 중간 부분이 만약에 채워져 버린다면, 투심과 포심이라 구분해 버린 가정 자체가 무효가 되는 것이라 봐야하겠지요.

그리고, 싱커볼러들에게서 볼수 있는, 싱커를 패스트볼로 잘못 기록하여 나타나는 분포도도 있습니다.
즉 포심-투심-그리고 아주 약간의 싱커가 포함되는 분포도라 할수있겠지요.
사용자 삽입 이미지

로이 할러데이의 분포도입니다. 투심이라 여겨지는 분포는 확실한데 비해, 포심의 영역에 있어 그 샘플이 부족하고, 위에서 말씀드렸던 싱커라 의심되는 패스트볼의 분포가 보입니다. 그러나 에이스 싱커볼러들의 경우에, 투심성 패스트볼이나 그 자신의 싱커나 구속에서의 차이가 별로 없어서, 그걸 무브먼트 이외에 판단할수 있는 수단이 전혀 없습니다. 88마일 2심도 보일수 있고, 92마일 싱커도 기록될수 있다는 것이지요.

그리고 마지막, 이건 어찌해야할지 분포 자체가 황당한 경우들이 있겠습니다.

사용자 삽입 이미지
White Pedro, 로이 오스왈트입니다. 완전 산개형이지요. 분포도 상으로 이건 어딜 꼭집어 포심이라 할수도 없고, 그렇다 하여 어떤 영역을 집어 투심이라 할수도 없습니다. 오스왈트의 경우에는 초반 컨디션 난조의 영향이라고 여기고, 앞으로의 샘플 수집을 통해 그 오차를 줄여나가고자 하고 있습니다.

사용자 삽입 이미지
시애틀의 왕, 킹 펠릭스입니다. 대니얼 카브레라와 비슷한 분포를 띄면서, 더 재미있는 것은, 수직이동량은 거의 투심급이라는 것입니다. 킹 펠릭스가 투심을 구사한다는건 이미 데뷔 스카우팅 리포트부터 알려진 사실이지만, 포심또한 구사한다는 것을 생각해 보았을때, 포심의 분포도가 전혀 나타나지 않는다는 점은 상당히 흥미로웠습니다.

사용자 삽입 이미지
샌프란시스코의 슈퍼영건, 팀 린스컴입니다. 뭔가 평행한 두개의 무리가 거의 붙어서 존재합니다.
분홍색 영역의 무리도 포심의 무브먼트 특성을 따라 분포하는것으로 생각해 볼때, 분홍색 영역은 흰색 영역에 비해 릴리즈 포인트에서 뭔가 다른점이 있지 않을까 예상해 보았습니다. 실제로, 배니스터의 경우 같은 구종의 릴리즈 포인트를 변화시킴으로써 같은 구종이되 다른 구질이 되도록 하고 있습니다.(같은 싱커의 변화량이 조금 다른 양태를 보입니다.)
신기한 것은 같은팀 동료 맷 케인에게서도, 이러한 분포가 나타난다는 점입니다.
사용자 삽입 이미지
린스컴과 케인은 진짜 같은사람이 던진게 아닐까 할정도의 비슷한 패스트볼 양태를 보여줍니다. 아까 제가 릴리즈 포인트의 차이를 언급한 이유도, 같은팀의 두 선수가 같은 양태를 보여주기 때문에 무언가 메커니즘에서 관련된게 아닐까 생각했었기 때문이었습니다. 같은 선수가 5일에 2번 등판하지 않는 이상 아무리 패스트볼에 한정된 분포지만 이런 쌍둥이같은 양태가 나타날 수는 없는거 아닐까요?


원래 오늘의 목적은 투심과 포심을 나눔으로써, 그 구종별 스핀수의 차이를 통해 이전 글에서의 논의를 좀더 파고들고자 함이었습니다만, 분포도를 통해서 이걸 따로 나눈다는 것이 아직은 샘플상 많이 부족해 보이고, 또 몇개 나누어본 결과론 아직 그 생각한 바의 데이터들이 나오지 않고 있어서, 일단 왜 그런일이 발생하는가에 대해서 간단한 이유를 알려드리는 쪽으로 방향을 전환했습니다.

개인적으로 개인별 샘플 200개이상, 전체샘플 6000개 정도면 패스트볼 하나는 왠만큼 분석이 가능할거라 생각했습니다만, 아직 표본이 부족한거 같습니다. 좀더 많은 투수와, 좀더 많은 등판기회를 통해서 샘플을 많이 확보하는게 시급한거 같네요.

문제는 22명을 한번 이렇게 하는데만도 12시간씩 날라간다는 것이겠지요....
생각은 주중에도 항상 하고있겠지만, 글은 거의 주말에만 쓸수밖에 없겠네요....
그럼 또 다음에 뵙겠습니다.

Daum 블로거뉴스
블로거뉴스에서 이 포스트를 추천해주세요.
Posted by Randoll

댓글을 달아주세요:: 네티켓은 기본, 스팸은 사절


BLOG main image
by Randoll

카테고리

Tribune (32)
Projections (3)
Daily (3)
PFX Analysis (19)
Translated Articles (3)
R's Comment (1)
Trades&Rumors (1)
Minors (0)
Chores (2)

글 보관함

Statistics Graph


믹시추적버튼-이 블로그의 인기글을 실시간 추적중입니다. 블로그코리아에 블UP하기 visitor stats
Total : 3085
Today : 87 Yesterday : 81
Creative Commons License

이 저작물은 크리에이티브 커먼즈 코리아 저작자표시-비영리-동일조건변경허락 2.0 대한민국 라이선스에 따라 이용하실 수 있습니다.