먼저 알려드립니다.
저의 이해도 부족으로 인해, pfx_z의 값을 통해 분석한 클리프 리의 패스트볼이 싱커성이라고 언급했었습니다. 하지만 그것이 pfx_z변수에 대한 제 이해도 부족임이 드러난 시점에서, 그것을 "싱커"에서 "라이징"성으로 수정해 놓았습니다. 오해 없으시길 바랍니다.

사용자 삽입 이미지
0.81, 0.604, 6, 521... 무슨 숫자일까? 언뜻 보기에도 전혀 관계는 없어 보인다. 특히나 옆에 보이는 투수와는 말이다. 하지만 위의 4가지 숫자 모두가, 2008년 5월 12일 현재 인디언스의 투수 클리프 리와 확실히 관계가 있는 것들이다.

방어율 0.81, WHIP 0.604, 6승, 조정방어율 521.
44.2이닝동안 삼진 39개...



클리프 리가 등판한 모든 경기에서, 인디언스는 승리를 따냈다. 아직까지는, 그를 향해 그 어떤 비난도 할 수가 없다. 한마디로 클리프 리는 완벽하다.

수식어는 이쯤 붙여두고, 본론으로 넘어가자.
이전에도 클리프 리에 관해 아주 잠깐 언급한 적이 있었지만, 올 시즌 클리프 리는 그 누구보다도 패스트볼 구사율이 높은 선수이다. 2008시즌 6회의 등판동안 Pitch-FX시스템에 기록된 600개의 투구 중, 패스트볼이 무려 494개, 82.3%를 차지하고 있었다.
사용자 삽입 이미지



필자가 실제로 본 경기에서도, 그의 패스트볼 구사율은 실로 엄청나게 높았다. 보통의 투수들이 3이닝을 투구하거나 타순이 한번 돌아올 경우에 투구 패턴에 변화를 주는 것과 달리, 클리프 리는 시작부터 마운드에서 내려갈 때 까지 주욱 패스트볼 하나로 세계 최고의 타자들을 유린하고 있었다.(현재까지는 "요리"라는 표현보다는 "유린"이라는 표현이 좀더 적당한거 같다.)

그의 무기들은 얼마나 위력적인 것이길래, 이토록 타자들이 거의 손을 못쓰고 있는 것일까?

  평균구속 pfx_x pfx_z brk SPIN RPS
패스트볼 89.69332 6.097848 11.13245 4.212146 152.0794 41.96743
커브 74.88958 -6.53742 -6.38804 13.82292 310.7984 24.64804
체인지업 81.09048 7.115571 6.731548 7.495238 140.3079 31.69941
슬라이더  81.22857 -0.77386 2.986286 8.257143 206.786 13.03371
커터 84.31111 -2.30789 5.185 6.611111 211.0445 18.36532

본인도 숫자보단 역시 그림이 좋다. 그림으로 살펴보자.
사용자 삽입 이미지
(표에 있는 커다란 원들은, 커브볼과 패스트볼 무브먼트의 평균치를 나타낸 것이다.)

일단 수평적 이동량을 따져보기 전에, 우리는 수직적 움직임을 살펴볼 필요가 있다. 보통의 패스트볼들은, 수직 이동량에 있어서 8-11정도의 값을 가지게 되는데, 분포도에서 보이듯 클리프 리의 수직 이동량은 평균을 크게 웃돈다. 그래프의 단위가 인치라는점을 생각해보자. 야구공의 지름이 약 3인치 정도이다. 이동량 8-11 정도의 패스트볼과, 분포도에서 보이는 클리프 리의 패스트볼은, 타자들에게 있어서 거의 공 하나 정도의 공백을 가져다 주게 된다. 그냥 보통 쳐내던 패스트볼이라고 보다간 큰코 다치는 거다.

쉽게 말하면, 클리프 리의 패스트볼은 수치상으론 거의 라이징(rising) 성이다.

올 시즌만을 놓고 보기에, 수준급이라는 그의 커브볼을 분석해 보기에는, 그 표본의 수가 너무 적었다.
그리고 클리프 리 자신도 커브를 주로 사용하기 보다는, 타자를 삼진 또는 범타로 묶어내는 킬링 피치로서 아주 필요할 때만 꺼내드는 것 같은 느낌을 받았다.


GO/AO 비율의 증가

2008시즌, 클리프 리에게서 찾아볼수 있는 중요한 점이라면, 땅뜬비가 비약적으로 증가했다는 것이다.
올 시즌 이전까지, 클리프 리의 땅뜬비는 0.61이었다. 그러나 08시즌 그의 땅뜬비는, 무려 1.08에 달한다. 물론 피안타율에 있어서도, 거의 이정도 비율로 감소했지만,(통산 .260 ~ .270의 범위, 08시즌 .163) 투수 자신의 타입이 변한 것이 아니라면 땅뜬비도 거의 비슷하게 유지되어야 하는게 아닐까 싶었다. 정말 아쉬웠던 점은 역시 작년의 자료를 구할수가 없다는 것이였다. 작년 자료를 구할수 있었다면, 패스트볼에서의 차이가 있는지 없는지를 알수가 있었을텐데 말이다.
일단, 범타로 유도된 공들의 로케이션을 포수 시점으로 찍어 보았다.

사용자 삽입 이미지
(분홍색 안의 지점은 스트라이크 존이라고 생각하면 되겠다.)

특이점 이라면, 존 안으로 형성된 공들은 거의가 플라이볼/라인 드라이브 였으며, 존 근처로 형성되었던 공들은 거의 그라운드 아웃이었다는 점이다. 놀라운 점은, 이 분포도에도 클리프 리의 구종 분포가 비슷하게 적용된다는 점이다. 즉, 플라이 아웃으로 유도된 공이라 하여 커브나 체인지업이 대부분이었던게 아니라, 저 분포도의 공들 역시 대부분은 패스트볼이라는 것이다. 그리고 존의 사용빈도를 보면, 수직적으로 존의 1/3 ~ 2/3 지점을 거의 "사랑"하고 있는 것을 볼수가 있다. 이 로케이션은 좌우 제구가 되지 않을 경우에 소위 말하는 "실투"가 될 가능성이 높은 구간임을 감안할 때, 왠만한 강심장이나 자신의 공에 대한 자신감 없이는 저 위치로 공을 뿌려대기가 힘들다고 생각한다.(그리고 실제로 공의 로케이션을 보라. 심지어 존 한복판에 형성되는 것들도 있다.)

본인은 이 분포도를 어디선가 본 적이 있었는데, 바로 뉴욕 양키즈 왕첸밍의 로케이션 분포도였다.
사용자 삽입 이미지
Josh Kalk가 제공한, 왕첸밍의 분포도인데, 존 안에서의 황색 역삼각형(범타유도) 분포도를 보면, 클리프 리와 거의 비슷하다.
그럼 헛스윙한 공들은 어디로 꼽혔을까?

사용자 삽입 이미지
(여전히 높은 패스트볼 구사율을 눈으로 볼수가 있다.)

존 위쪽에 형성된 헛스윙 분포를 제외한다면, 큰 다른 점은 없다.


Lee the Undisput-ING?

어떻게든 파헤쳐 보고자 시작한 글이지만, 현재의 클리프 리는 스스로가 무너지지 않는 한, 무너질 일이 없을것 같아 보인다. 불과 몇일 사이에 믿던 구위가 안좋아질 일이 있겠는가? 그리고 클리프 리는 메커니즘 상의 불안 요소에 대해 큰 지적을 받은 일도 없다. 위에서 왕첸밍과 클리프 리의 성향이 비슷하다고 썼지만, 누가 누구의 성향과 비슷하다는 말은 아마도 올시즌 말 까지는 상당히 아껴두어야 할 것 같다.

리는 아직까지 무패, 무결점의 투수이고, 당분간은 그러하지 않을까.....
Daum 블로거뉴스
블로거뉴스에서 이 포스트를 추천해주세요.
Posted by Randoll

댓글을 달아주세요:: 네티켓은 기본, 스팸은 사절

The relationships between RPS and Movement of Balls

This article is for english users, Korean users go to this link.

I picked 22starters for my analysis, and if there was no pfx logs, I excluded them.

(for example, there is no pfx logs in Tyoko Dome Opener)

The criteria for these 22 starters are,

1. Starters who has the most Ks

2. Starters who showed impressive perfomance in April 2008.

3. Starters who was the Cy-young nominees(or got Cy-young award)

I got 9818 sample balls from these starters and 5965 of them were fastballs, and 5800 balls were remained when I excluded datas that was located out of the standard deviation(understable ranges, not the theoritical sigma range). And These are the results of their fastball average values.

Name Team SPEED(KMH) STDEV DIFF PFX BRK RPS FA# Balls# FA%
J. Weaver ANA 90.4(145.46) 1.83 8.48 13.01 2.93 41.02 169 497 34.00%
D. Haren ARI 90.34(145.36) 1.74 7.82 12.99 4.48 41.79 203 416 48.80%
D. Cabrera BAL 93.94(151.15) 1.62 9.10 12.34 4.62 40.70 399 489 81.60%
D. Matsuzaka BOS 91.07(146.53) 1.46 9.37 12.51 4.29 39.83 207 394 52.54%
J. Beckett BOS 95.17(153.13) 1.90 9.01 12.52 4.91 42.09 207 268 77.24%
C. Zambrano CHC 90.34(145.36) 2.05 6.44 11.30 5.77 36.95 346 471 73.46%
J. Cueto CIN 93.04(149.7) 1.39 7.30 11.23 3.09 37.63 264 439 60.14%
A. Harang CIN 88.59(142.54) 1.97 6.95 12.81 3.84 40.72 282 460 61.30%
C. Hamels PHI
88.26(142.02) 2.08 6.63 12.93 3.74 41.19 281 525 53.52%
C.C. Sabathia CLE 93.6(150.61) 1.28 7.93 11.77 4.34 39.27 320 458 69.87%
C. Lee CLE 89.95(144.73) 1.35 7.76 13.82 4.15 44.24 349 412 84.71%
J. Verlander DET 93.31(150.14) 2.00 8.99 15.58 5.59 51.15 195 489 39.88%
R. Oswalt HOU 92.19(148.33) 1.35 7.98 10.80 4.53 35.47 274 467 58.67%
B. Sheets MIL 92.16(148.28) 1.19 7.36 12.11 3.28 40.11 217 378 57.41%
J. Santana NYN 90.64(145.84) 1.56 7.29 11.23 4.63 36.47 246 440 55.91%
J. Peavy SDN 93.24(150.02) 1.27 9.10 12.48 4.78 40.86 253 547 46.25%
F. Hernandez SEA 94.89(152.69) 1.35 8.74 11.14 4.80 37.35 319 542 58.86%
M. Cain SFN 92.91(149.5) 1.64 8.62 12.89 3.16 42.31 346 474 73.00%
J. Sanchez SFN 90.12(145) 2.26 7.97 12.13 5.16 38.83 319 383 83.29%
T. Lincecum SFN 95.47(153.62) 1.72 8.72 12.73 2.93 42.99 335 493 67.95%
R. Halladay TOR 92.08(148.16) 1.73 8.11 10.41 6.23 34.04 222 403 55.09%
D. McGowan TOR 94.89(152.68) 1.66 9.48 12.77 3.84 42.43 212 373 56.84%

Speed is described in MPH and numbers in ( ) is the the unit of KMH(Kilometers per Hour, the Korean unit). Stdev is the standard deviation of start speed, DIFF is the diffrerence between average speed of start and end speed. And maybe you already know what pfx and brk(break) means. FA# is the number of fastballs, and Balls# is the number of all balls in their log. FA% is the portion of fastballs. RPS is the Rotation per Second(not RPM, R per minute)

I tried to get relationships between start speed and RPS of fastballs. My hypothesis was,

"The Faster the ball is, the more spin it has to be"

But I found it was silly when I saw my results. See the graph below.

사용자 삽입 이미지


Show the value of R square. The tendency line(I don't know the exact terms to decribe this, maybe trend line?) has no meaning to this graph.

BECAUSE, each pitcher has their unique movement in their fastball and each pitcher has their unique RPS in their fastball(regardless of the speed)

For example, there is the pitcher who has average start speed of 93 miles and has RPS of high 30s(the case of Cueto), there is pitcher like average speed of 93 MPH and RPS over 50(case of Verlander)

Let's see this in picture.

사용자 삽입 이미지

As you see, there is many pitchers located in speed of 90 to 95 mph, and 35 to 45 in rps. What I want to say is, the rps of ball IS NOT AN ABSOLUTE CRITERIA FOR SPEED, there's somewhat other varibles effect on the value of rps.

So, I merger 5800 fastballs in to one excel sheet and separated them to 1 mile criteria.(85 to 97 in unit of 1mile per hour)

TO 85 to 97 MPH, there was 12 intervals and 5500 samples, and their relationship was very interesting to me. Let's see that.

The value of Y axis is RPS, ans value of x-axis is decribed in the picture.

사용자 삽입 이미지

As you see above, the value of R square has very siginificnat meaning compared to speed-rps relationships. And the relationship was decribed in every 12 intervals.

MOVEMENT - RPS Relationship
speed range Formula R^2 Sample#
85-86 3.1525x-3.67 0.8348 101
86-87 3.0805x-2.7342 0.9030 115
87-88 3.3946x-6.5701 0.9138 192
88-89 3.2884x-4.5288 0.9187 370
89-90 3.1882x-2.662 0.9244 486
90-91 3.249x-3.0762 0.9329 571
91-92 3.3829x-4.3772 0.9146 745
92-93 3.3303x-3.2576 0.9054 803
93-94 3.3855x-3.6724 0.9192 741
94-95 3.2175x-1.1906 0.9486 672
95-96 3.0155x+0.9232 0.9696 448
96-97 3.2262x-0.315 0.9582 270

I got this formulas but I don't know how to apply these into speed-rps-movement relationship.

But I got one important lessons from today's analysis.

"RPS is not an absolute guideline for ballspeed. But we can expect that the more rps it has, the more movement it has to be."

And in datas above, horizontal movement value has the big portion on them, so I have to correct or revise on sinking 2-seamers like fastballs by Halladay, Wang.


Thank you for reading.


Mingu, Song.



If you have any questions about this article, contact me landor82 at gmail.com or write comments below in the blue box(click the blue button when you finished writing your comment.)

Daum 블로거뉴스
블로거뉴스에서 이 포스트를 추천해주세요.
Posted by Randoll

댓글을 달아주세요:: 네티켓은 기본, 스팸은 사절

이전 글에서, 포심과 투심을 나눠서 분석해야 되지 않느냐는 말씀들이 많았습니다. 물론 저도 기본적으론 그렇게 하고저 생각을 했습니다. 근데 이걸 실질적으로 나누는게 쉽지많은 않습니다.
통상적으로 무브먼트 값을 통해 특정 영역을 투심, 특정 영역을 포심으로 분류하고는 있습니다만..
이것 또한 그리 정확한 방법은 아니지요.. 왜냐하면,

1. 신체 사이즈에 의한 무브먼트 차이가 있을수 있다.
2. 릴리즈 포인트(개인마다의 특성, 한 개인이 항상 일정 위치에서 공을 뿌릴수는 없기때문에 나타나는 변위차)에서의 달라지는 변위차에 의해 공의 무브먼트가 달라질 수 있다.
3. 팔의 각도, 또는 투수의 세밀한 움직임에 따라서도 공의 구질은 큰 변화를 보인다.


이런 종류의 이유들이 있기 때문이지요.


PFX Wiki에서 통상적인 구종에 대한 무브먼트별 분류를 아래 그림과 같이 내놓긴 했습니다만, 이 무브먼트의 기준이 무엇인지가 안나와 있는 관계로, 실제로 적용할 수가 없습니다.
사용자 삽입 이미지
이러한 그림인데, 문제는 여기 있는 좌표값에 맞게 제 데이터를 뽑아낼 수 없다는 데에 있습니다.

그래서 일단 통상적인 분류법(x좌표는 pfx전체값, y좌표는 Break값)으로 각 투수별 패스트볼의 무브먼트를 나누어 보았습니다.
22명에게 동일하게 적용시켜본 결과, 몇명의 투수들에게서 재미있는 분포도가 나오더군요.

사용자 삽입 이미지

이 그림은, 제가 조사범위에 포함시킨 22명의 선발투수에게서 뽑아낸 5,649개의 패스트볼을 전부 도표로 찍어본 것입니다. PFX값은 5-15사이에 대부분 위치하고, Break값은 1에서 8까지 좀더 다양한 양태를 보입니다.
그럼 투수별 분포도를 통해서 좀더 세밀히 파고들어가 보겠습니다.

사용자 삽입 이미지

오리올스의 대니얼 카브레라의 경우, 굉장히 독특했습니다. 보통 투수의 경우, 포심만을 던진다면 pfx값 5-15 사이에서, pfx값이 높아질수록 break값이 낮아지는 선형적 분포를 띄게됩니다. 예를 들자면 아래와 같은 분포도를 띄지요.
사용자 삽입 이미지
신시내티 신인투수 쟈니 쿠에토의 패스트볼 분포도입니다. 대략 선형적 분포를 그려줍니다.
하지만 아까 보셨듯, 카브레라의 경우 상당히 둥글둥글한 분포를 띕니다. 계속 분석을 해 봐야겠지만, 22명중 가장 특이한 분포도라고 볼수 있겠습니다.

다음은 2가지 구질이라고 확연히 드러나는 분포를 가진 투수들을 보겠습니다.

사용자 삽입 이미지
디트로이트 타이거즈의 저스틴 벌랜더의 패스트볼 분포도입니다. 무브먼트 상으로 투심과 포심이 확연히 드러납니다. 일단 저 영역표시는, 제 가정하에 둔 것입니다만, 통상적으로도 저정도 무브먼트를 투심과 포심의 경계선 정도로 생각하고 있습니다. 이와는 비슷하지만, 2가지 분포를 보이되, 그 경계가 거의 보이지 않거나, 한쪽 무리의 분포가 모호한 경우도 있습니다.

사용자 삽입 이미지

컵스의 에이스 카를로스 잠브라노 패스트볼 분포도입니다. 뭔가 포심의 분포도를 이루는것 같으면서, 투심은 그 분포가 모호합니다. 포심이라 판정할 수 있는 영역의 가로범위가, 투심 영역과 겹치고, 수직적 영역으로도 서로 살짝씩 겹쳐버립니다. 이러한 경우에, 샘플이 좀더 수집되고 이 중간 부분이 만약에 채워져 버린다면, 투심과 포심이라 구분해 버린 가정 자체가 무효가 되는 것이라 봐야하겠지요.

그리고, 싱커볼러들에게서 볼수 있는, 싱커를 패스트볼로 잘못 기록하여 나타나는 분포도도 있습니다.
즉 포심-투심-그리고 아주 약간의 싱커가 포함되는 분포도라 할수있겠지요.
사용자 삽입 이미지

로이 할러데이의 분포도입니다. 투심이라 여겨지는 분포는 확실한데 비해, 포심의 영역에 있어 그 샘플이 부족하고, 위에서 말씀드렸던 싱커라 의심되는 패스트볼의 분포가 보입니다. 그러나 에이스 싱커볼러들의 경우에, 투심성 패스트볼이나 그 자신의 싱커나 구속에서의 차이가 별로 없어서, 그걸 무브먼트 이외에 판단할수 있는 수단이 전혀 없습니다. 88마일 2심도 보일수 있고, 92마일 싱커도 기록될수 있다는 것이지요.

그리고 마지막, 이건 어찌해야할지 분포 자체가 황당한 경우들이 있겠습니다.

사용자 삽입 이미지
White Pedro, 로이 오스왈트입니다. 완전 산개형이지요. 분포도 상으로 이건 어딜 꼭집어 포심이라 할수도 없고, 그렇다 하여 어떤 영역을 집어 투심이라 할수도 없습니다. 오스왈트의 경우에는 초반 컨디션 난조의 영향이라고 여기고, 앞으로의 샘플 수집을 통해 그 오차를 줄여나가고자 하고 있습니다.

사용자 삽입 이미지
시애틀의 왕, 킹 펠릭스입니다. 대니얼 카브레라와 비슷한 분포를 띄면서, 더 재미있는 것은, 수직이동량은 거의 투심급이라는 것입니다. 킹 펠릭스가 투심을 구사한다는건 이미 데뷔 스카우팅 리포트부터 알려진 사실이지만, 포심또한 구사한다는 것을 생각해 보았을때, 포심의 분포도가 전혀 나타나지 않는다는 점은 상당히 흥미로웠습니다.

사용자 삽입 이미지
샌프란시스코의 슈퍼영건, 팀 린스컴입니다. 뭔가 평행한 두개의 무리가 거의 붙어서 존재합니다.
분홍색 영역의 무리도 포심의 무브먼트 특성을 따라 분포하는것으로 생각해 볼때, 분홍색 영역은 흰색 영역에 비해 릴리즈 포인트에서 뭔가 다른점이 있지 않을까 예상해 보았습니다. 실제로, 배니스터의 경우 같은 구종의 릴리즈 포인트를 변화시킴으로써 같은 구종이되 다른 구질이 되도록 하고 있습니다.(같은 싱커의 변화량이 조금 다른 양태를 보입니다.)
신기한 것은 같은팀 동료 맷 케인에게서도, 이러한 분포가 나타난다는 점입니다.
사용자 삽입 이미지
린스컴과 케인은 진짜 같은사람이 던진게 아닐까 할정도의 비슷한 패스트볼 양태를 보여줍니다. 아까 제가 릴리즈 포인트의 차이를 언급한 이유도, 같은팀의 두 선수가 같은 양태를 보여주기 때문에 무언가 메커니즘에서 관련된게 아닐까 생각했었기 때문이었습니다. 같은 선수가 5일에 2번 등판하지 않는 이상 아무리 패스트볼에 한정된 분포지만 이런 쌍둥이같은 양태가 나타날 수는 없는거 아닐까요?


원래 오늘의 목적은 투심과 포심을 나눔으로써, 그 구종별 스핀수의 차이를 통해 이전 글에서의 논의를 좀더 파고들고자 함이었습니다만, 분포도를 통해서 이걸 따로 나눈다는 것이 아직은 샘플상 많이 부족해 보이고, 또 몇개 나누어본 결과론 아직 그 생각한 바의 데이터들이 나오지 않고 있어서, 일단 왜 그런일이 발생하는가에 대해서 간단한 이유를 알려드리는 쪽으로 방향을 전환했습니다.

개인적으로 개인별 샘플 200개이상, 전체샘플 6000개 정도면 패스트볼 하나는 왠만큼 분석이 가능할거라 생각했습니다만, 아직 표본이 부족한거 같습니다. 좀더 많은 투수와, 좀더 많은 등판기회를 통해서 샘플을 많이 확보하는게 시급한거 같네요.

문제는 22명을 한번 이렇게 하는데만도 12시간씩 날라간다는 것이겠지요....
생각은 주중에도 항상 하고있겠지만, 글은 거의 주말에만 쓸수밖에 없겠네요....
그럼 또 다음에 뵙겠습니다.

Daum 블로거뉴스
블로거뉴스에서 이 포스트를 추천해주세요.
Posted by Randoll

댓글을 달아주세요:: 네티켓은 기본, 스팸은 사절

이 글은 제가 개인적으로 선정한 22명의 선발투수들의 패스트볼을 비교해 보기 위해서 하는 X-treme Fastball 프로젝트의 일부임을 밝힙니다.

고로 글을 쓴 후에도 언제든 수정될수 있습니다.


먼저 샘플로 뽑아본 선수들은, 위에서 말했듯 22명입니다. 그리고, 2008년 게임데이 pfx데이터가 존재하는 로그만 따로 추렸습니다.

(보스턴-오클랜드간 일본 원정경기는 pfx자료가 없음. 템파베이 홈경기의 경우 pfx자료가 없음)

뽑은 기준은 현재 삼진수가 많은 선발투수이거나, 또는 인상적인 성적을 올리고 있는 선수들, 그리고 과거 사이영상 또는 그에 준하는 성적을 올린 선수들입니다.

또한 표본으로 쓸수 있는 공의 갯수는 총 9818개였으며, 이 중 패스트볼은 5965개, 그리고 표준편차에 따른 오차범위를 벗어난 자료를 제외한 유효한 패스트볼의 샘플갯수는 약 5800개 정도였습니다.

그리고 아래의 표는 이 선수들의 4월달 패스트볼의 평균치입니다.

Name Team SPEED(KMH) STDEV DIFF PFX BRK RPS FA# Balls# FA%
J. Weaver ANA 90.4(145.46) 1.83 8.48 13.01 2.93 41.02 169 497 34.00%
D. Haren ARI 90.34(145.36) 1.74 7.82 12.99 4.48 41.79 203 416 48.80%
D. Cabrera BAL 93.94(151.15) 1.62 9.10 12.34 4.62 40.70 399 489 81.60%
D. Matsuzaka BOS 91.07(146.53) 1.46 9.37 12.51 4.29 39.83 207 394 52.54%
J. Beckett BOS 95.17(153.13) 1.90 9.01 12.52 4.91 42.09 207 268 77.24%
C. Zambrano CHC 90.34(145.36) 2.05 6.44 11.30 5.77 36.95 346 471 73.46%
J. Cueto CIN 93.04(149.7) 1.39 7.30 11.23 3.09 37.63 264 439 60.14%
A. Harang CIN 88.59(142.54) 1.97 6.95 12.81 3.84 40.72 282 460 61.30%
C. Hamels CIN 88.26(142.02) 2.08 6.63 12.93 3.74 41.19 281 525 53.52%
C.C. Sabathia CLE 93.6(150.61) 1.28 7.93 11.77 4.34 39.27 320 458 69.87%
C. Lee CLE 89.95(144.73) 1.35 7.76 13.82 4.15 44.24 349 412 84.71%
J. Verlander DET 93.31(150.14) 2.00 8.99 15.58 5.59 51.15 195 489 39.88%
R. Oswalt HOU 92.19(148.33) 1.35 7.98 10.80 4.53 35.47 274 467 58.67%
B. Sheets MIL 92.16(148.28) 1.19 7.36 12.11 3.28 40.11 217 378 57.41%
J. Santana NYN 90.64(145.84) 1.56 7.29 11.23 4.63 36.47 246 440 55.91%
J. Peavy SDN 93.24(150.02) 1.27 9.10 12.48 4.78 40.86 253 547 46.25%
F. Hernandez SEA 94.89(152.69) 1.35 8.74 11.14 4.80 37.35 319 542 58.86%
M. Cain SFN 92.91(149.5) 1.64 8.62 12.89 3.16 42.31 346 474 73.00%
J. Sanchez SFN 90.12(145) 2.26 7.97 12.13 5.16 38.83 319 383 83.29%
T. Lincecum SFN 95.47(153.62) 1.72 8.72 12.73 2.93 42.99 335 493 67.95%
R. Halladay TOR 92.08(148.16) 1.73 8.11 10.41 6.23 34.04 222 403 55.09%
D. McGowan TOR 94.89(152.68) 1.66 9.48 12.77 3.84 42.43 212 373 56.84%

간단히 용어를 설명드리자면, SPEED는 구속을 마일로 나타낸 것이고, 괄호안의 단위는 KM/h입니다.

STDEV는 구속의 표준편차, DIFF는 초속-종속간의 차이(단위는 mph), PFX는 중력을 제외한 공의 이동량, BRK는 중력에 의한 공의 상하이동량, RPS는 공의 초당회전수,

FA#는 샘플링된 패스트볼의 갯수, Balls#는 총 샘플의 갯수, FA%는 총 투구수 중 패스트볼의 구사비율입니다.

또한 빨간색은 최대값, 파란색은 최소값을 나타냅니다.


일단은 가장 간단한 관계를 알아내 보기 위해서, 속도와 회전수 간의 일반적인 관계를 만들어보려 노력했습니다만, 아래 그래프를 보시면 그게 왜 무모한 시도인지 알게 되실겁니다.

(rps : rotation per second. 초당 회전수)

사용자 삽입 이미지

R의 제곱값이 말해주듯, 저기 있는 추세선의 의미는 거의 0에 가깝습니다.

그 이유는 선수들의 패스트볼 마다 평균적인 무브먼트가 다르며, 또 선수들의 패스트볼 마다 속도에 따른 초당 회전수가 다 다릅니다.

평균 93마일대의 패스트볼을 뿌리면서 rps가 40이 안되는 선수도 있고(Cueto), 평균 93마일대의 패스트볼을 뿌리면서 평균 rps가 50이 넘는 선수(Verlander)도 있습니다.

위의 말을 그림으로 옮겨보지요.

사용자 삽입 이미지

90-95마일 사이의 영역에 많은 투수들이 겹칩니다. 그리고 rps또한 35-45사이의 거의 비슷한 값을 나타내고 있지요. 즉, 공의 회전수는 구속의 절대적인 잣대라기 보다는, 무언가 다른 변수의 영향을 더 받는다는 것이지요.

그래서 저는 약 5800개의 패스트볼 자료를 하나로 묶어, 각각을 1마일 단위로 나누어 생각해 보기로 하였습니다.

85마일에서 97마일까지, 12개 구간 5500여개의 표본이 나왔고, 이들의 회전수-무브먼트 간의 상관관계를 알아보았습니다. 아래의 그림은 그중 가장 샘플이 많았던 91-92mph구간의 결과입니다.

x축은 MOVEMENT, y축은 RPS입니다.

사용자 삽입 이미지

보시는 것과 같이, 어떠한 식을 유도해 낼 만큼의 상당히 괜찮은 분포를 이루고 있습니다. 그리고, 이러한 관계는 85-97마일 전구간에서 나타났습니다.

MOVEMENT - RPS Relationship
speed range Formula R^2 Sample#
85-86 3.1525x-3.67 0.8348 101
86-87 3.0805x-2.7342 0.9030 115
87-88 3.3946x-6.5701 0.9138 192
88-89 3.2884x-4.5288 0.9187 370
89-90 3.1882x-2.662 0.9244 486
90-91 3.249x-3.0762 0.9329 571
91-92 3.3829x-4.3772 0.9146 745
92-93 3.3303x-3.2576 0.9054 803
93-94 3.3855x-3.6724 0.9192 741
94-95 3.2175x-1.1906 0.9486 672
95-96 3.0155x+0.9232 0.9696 448
96-97 3.2262x-0.315 0.9582 270

(x는 공의 movement값)

저도 아직 이걸 어떻게 다시 구속과 관계를 지어야 할지에 대해서는 생각중입니다만, 오늘의 분석을 통해 한가지 결론을 낼수 있었습니다.


"회전수가 많다고 해서 결코 공이 빠른것은 아니다. 그러나 회전수가 많다면 그 공의 움직임이 좋다는 판단을 해 볼수는 있다."

아직 이 결론에서 벗어나는 표본무리들도 꽤 있기 때문에, 지금은 수직이동과 회전수의 상관관계에 대해서 알아보고 있습니다.

위에 설정한 이동량에서는 수평이동량이 큰 부분을 차지하기 때문에, 수직이동량에 의한 회전수는 상대적으로 그 영향이 적을수밖에 없습니다.

그러나 로이 할러데이 류의 가라앉는 패스트볼의 경우에, 우리 모두가 그 구질이 위력적이라는 것을 알고 있습니다. 하지만 보시다시피 회전수는 적지요.

다음번엔 이 주제를 갖고 다시 오겠습니다.


다음에 또 뵙겠습니다. 읽어주셔서 감사합니다.


Daum 블로거뉴스
블로거뉴스에서 이 포스트를 추천해주세요.
Posted by Randoll

댓글을 달아주세요:: 네티켓은 기본, 스팸은 사절

엑셀로 추출한 데이터를 통해, 공의 회전수를 구해볼수 있습니다.

스포츠 물리학자들이 이것에 대해 쓴 논문들이 몇편 있는데 거기서 필요한 것만 골라서,

이 공식을 만들어낸 사람이 있더군요..

아마 패스트볼의 위력? 또는 구위 판단에 괜찮은 비교분석거리가 되지 않겠나 싶어서

일단 올려놓습니다.


Spin direction (in degrees)

사용자 삽입 이미지

then add ax<0일 경우 270도를 더하고, ax>0일 경우 90도를 더한다.


Spin rate (in rpm)

사용자 삽입 이미지


일단 이것만 올리고, 저도 4월말은 되어야 이 공식을 실험해 볼수 있겠군용.


물리학을 야구에 적용시킨 글은
http://webusers.npl.uiuc.edu/~a-nathan/pob/pitchtracker.html - 공의 움직임에 대한 원론적/공학적 이론들
http://online.physics.uiuc.edu/courses/phys199bb/fall07/lectures.html  - 물리학의 기본을 따라 파워포인트로 정리
http://mvn.com/mlb-stats/2008/01/14/a-pitchfx-primer/ - pfx에 대한 전반적인 설명과 사용법, 유용한 링크를 모아둔 포스트

정도가 있습니다.

샘플 파일

저스틴 벌랜더의 패스트볼로 구해본 rps(rotation per second - 초당 회전수) 와 초속의 관계입니다.
(주로 강속구 투수들에게서 구해본 상관관계가 가장 괜찮더군요..)

사용자 삽입 이미지



그럼 이만 (__)
Daum 블로거뉴스
블로거뉴스에서 이 포스트를 추천해주세요.
Posted by Randoll

댓글을 달아주세요:: 네티켓은 기본, 스팸은 사절

  1. 네잎 클로버
    2008/04/17 13:54
    댓글 주소 수정/삭제 댓글
    수식이 상당히 깜찍하군요..-_-)
    이걸 보니 문득 초속과 종속의 격차 정도와 초당 회전수의 상관분석시 r값이 얼마나 나올지 궁금해지네용..(특히 강속구 투수들의 경우가 좀 궁금)

    더불어 이렇게 산출하는 직구 회전수의 정확도를 일정수준이상 유지가 가능하다면 투수~ 포수미트 각 지점 또는 시작 중간 끝 지점의 순간 회전 속도나 순간 회전 가속도(물론 감가속이겠지만 그 비율이 상대적으로 적은지 큰지를 볼수 있을테니까요)도출도 어느정도 가능하지 않을까요?(물론 100% 온전한 변수 감안은 불가능하겠지만)
    그렇다면 볼끝에 대해 생각해보는데도 재미가있을것 같은데...
    • 2008/04/17 13:54
      댓글 주소 수정/삭제
      초속-종속의 격차와 초당 회전수에 대한 상관분석은
      해본결과 그다지 상관관계라는걸 알수가 없었습니다.
      특히 이걸 그래프로 그리기가 애매한 이유가,
      초속-종속의 격차가 보통 적으면 5마일, 크면 12마일 정도인데
      통상적으로는 구질무관 8-10마일 사이가 가장 많습니다.
      그리고 표본을 상당히 크게 하면, 아마 투수에 무관하게 패스트볼 1만개 정도만 뽑아다가 조사를 하면..
      초속과 회전수는 어느정도의 관계가 있긴 할겁니다.
      결국 초속 종속의 격차에 따른 회전수라기 보다
      초속에 의해 결정된 회전수라고 보는게 맞겠지요.
    • 네잎 클로버
      2008/04/17 14:08
      댓글 주소 수정/삭제
      헐,,너무 빨리 달린 댓글에 놀랬습니다..^^;;;

      그렇군요..초속은 상식적으로 강속 직구(강하게 채어주는)의 경우 채는 힘에 일정부분 비례할것이므로 회전수와 구속간 상관계수가 높이 분포할경우 당연히 초속과 회전수는 밀접한 연관이 있으리라는 생각은 했는데요..
      격차의 경우는 회전과 볼끝의 관계와 관련하여 어느정도 연관이 있으리라 생각했는데 아니군요..이해가 되면서도 조금 어려운 부분인듯 합니다..

      답변 감사합니다.
    • 2008/04/17 14:14
      댓글 주소 수정/삭제
      뭐 아직은 자료도 부족하고, 연구되고있는게 더 많은 동네니까요..ㅎㅎ
      그리고 집에 도착해서 이것저것 보다가..
      코딩좀하려고 봤더니 댓글이 ㅎㅎ
  2. 2008/04/17 14:01
    댓글 주소 수정/삭제 댓글
    이거 글이 또 짤리네요.. 코드 수정을 좀 해야겠습니다아-
  3. 2008/04/17 14:06
    댓글 주소 수정/삭제 댓글
    엑셀 식으로 표현하면 이렇게 하시면 됩니다.
    =((AI2^2+(AK2+32.174)^2)^0.5)/(ABS(AG2)*0.121*0.00544*(2*PI()))
    AI2, AK2, AG2는 각각 그 해당 값의 셀입니다. ㅎㅎ


사용자 삽입 이미지

1. 자니 쿠에토

2008시즌, 신시내티 레즈에서 혜성같이 떠올라 데뷔 첫게임에서 10삼진을 잡아낸 선수가 있다. 바로 Johnny Cueto이다.

1900년 이후 신시내티 프랜차이즈 역사상 데뷔게임에서 10삼진을 잡아낸 투수는 자니 쿠에토가 처음이라고 한다. 과연 이 쿠에토라는 선수는 무슨 무기를 가진 어떤 선수일까?

먼저 그의 마이너리그 성적을 살펴보자.

Year
Team
Age
Org
Level
W
L
ERA
G
IP
H
R
ER
HR
BB
SO
BB9
K9
WHIP
2005
GCL Reds 19 Cin Rk
2
2
5.02
13
43.0
49
31
24
2
8
38
1.67
7.95
1.33
Sarasota 19 Cin A+
0
1
3.00
2
6.0
5
2
2
0
2
6
3.00
9.00
1.17
2006
Dayton 20 Cin A
8
1
2.59
14
76.1
52
22
22
5
15
83
1.77
9.79
0.88
Sarasota 20 Cin A+
7
2
3.50
12
61.2
48
25
24
6
23
61
3.36
8.90
1.15
2007
Sarasota 21 Cin A+
4
5
3.33
14
78.1
72
34
29
3
21
72
2.41
8.27
1.19
Chattga 21 Cin AA
6
3
3.10
10
61.0
52
24
21
6
11
77
1.62
11.36
1.03
Louisville 21 Cin AAA
2
1
2.05
4
22.0
22
5
5
2
2
21
0.82
8.59
1.09
Minor League Totals - 3 Season(s)
29
15
3.28
69
348.1
300
143
127
24
82
358
2.12
9.26
1.10

3시즌동안, 삼진율(K9-9이닝당 삼진을 뽑아내는 갯수)이 거의 9근처 또는 그 이상이었다. 그만큼 먹어주는 스터프를 가진 선수였으며, 또 2007시즌의 BB9를 보면 삼진율이 높은 선수치고 볼넷 허용률이 낮았음을 알 수 있다. 그러한 가운데, 비록 2경기밖에 안되지만 그가 거둔 성적은 아래와 같다.

시즌 TEAM W L ERA G GS CG SHO SV