home > 정책과 담론 > 컬럼
NYT의 리베라 그래픽 뉴스 vs 사직 창고의 호세 리포트
MLB ‘로 데이터’의 공개와 축적은 집단 지성을 자극하고 이 자극은 구체적 분석을 이끌어 낸다. 정보의 공개는 분석을, 분석된 결과물의 공유는 더 수준 높은 분석물을 생산하고 있는 것이다. ‘머니볼’을 뛰어넘는 ‘빅데이터볼’의 시대가 이미 열린 것이다. 국내 프로야구단 역시 많은 데이터를 생산하고 있지만, 공유와 공개의 단계에는 못 미치고 있다. 이 이야기가 야구에만 적용되는 것일까?
최민규(didofidomk@gmail.com)
민주노동당과 청와대, SK 와이번스와 롯데 자이언츠를 취재했다. “야구는 평균이 지배하는 경기”라는 말을 좋아한다.
  this article :

1960년대 메이저리그는 지독한 투고타저 현상을 겪었다. 이후 완화되긴 했다. 그러나 베이브 루스, 조 디마지오, 테드 윌리엄스가 뛰던 저 '타자들의 시대'가 돌아온 건 1990년대 이후다.

양대 리그 중 하나인 내셔널리그(NL)의 1920~1959년 경기당 득점은 4.5점이었다. 이 수치는 1960~1989년 4.1점 수준으로 떨어졌다. 그리고 1990년 이후엔 다시 4.5점으로 회복된다. 타격의 부활에 스테로이드와 성장호르몬이 중요한 영향을 미쳤음이 입증된 건 얼마 되지 않았다.

그렇다면 1960년 이후 30여 년간 지속됐던 투수들의 우위는 어떻게 가능했을까. 여러 이유가 있지만 그 중 하나는 1950년대 이후 본격화된 TV 중계다. TV를 통해 어린 투수들은 메이저리그 투수의 피칭과 타자를 상대하는 방법을 생생하게 지켜볼 수 있게 됐다. 저널리스트 레너드 코펫은 1960년대 이후의 투고타저의 첫 번째 이유로 '괜찮은 투수들의 수가 크게 늘어난 것'을 들었다. TV 영상이라는 '무료 정보'의 보급이 메이저리그 피칭이라는 전문 영역의 수준을 높인 사례다.

 

공개와 공유로 부가가치 높이는 MLBAM

야구판 '정보 혁명'은 21세기에도 진행되고 있다. 이번에는 인터넷과 컴퓨터, 카메라 기술이 결합됐다. 메이저리그 공식 홈페이지는 2007년부터 경기 문자 중계에 '피치(PITCH) f/x’라는 서비스를 추가했다. 투수가 던진 공의 궤적과 초속/종속, 회전수, 공을 놓는 릴리스 포인트, 포수 미트에 꽂힌 위치 등을 실시간 그래픽으로 제공하는 서비스다. 구장에 설치된 레이더와 카메라를 통해 모든 투구의 물리적 데이터가 정확하게 측정돼 데이터화된 다음, 보기 좋게 시각화된다.

어떤 투수가 가장 빠른 공을 던지느냐는 야구팬의 오랜 관심사다. 피치f/x 시스템을 통해 메이저리그 전 경기 투구의 구속 데이터가 모아지고 분류될 수 있다. 이제 야구팬들은 메이저리그 전체 투수들을 직구 스피드 순으로 줄 세울 수 있다.

누가 가장 떨어지는 각도가 좋은 포크볼을 던지는지, 어떤 투수의 체인지업 피안타율이 가장 낮은지도 알 수 있다. 월드베이스볼클래식(WBC) 일부 경기도 이 시스템으로 측정됐는데, 한국 투수 오승환의 ‘라이징 패스트볼’은 메이저리그에서도 다섯 손가락 안에 들어가는 좋은 움직임을 보였다는 결과가 나왔다. 그는 아마 메이저리그에 진출했어도 성공했을 것이다.

 

그런데, 이런 작업은 누가 할까.

뉴욕타임스는 2010년 뉴욕 양키스의 마무리 투수 마리아노 리베라의 커터에 대한 아름다운 그래픽 뉴스(http://www.nytimes.com/interactive/2010/06/29/magazine/rivera-pitches.html?ref=magazine&_r=0)를 제작했다. 실제 메이저리그 타석에 들어설 수 없는 야구팬들에게 그의 커터가 얼마나 위력이 있는 구종인지를 직관적으로 보여줬다. 이 콘텐트도 상당부분 피치f/x 데이터에 기반했다. 하지만 유명 언론사만 이 데이터에 대한 접근할 수 있는 게 아니다.

피치f/x 데이터의 소유권은 메이저리그 자회사인 MLBAM(Major League Baseball Advanced Media)에게 있다. MLBAM은 2007년 서비스 시작과 함께 매일 .xml포맷으로 전 경기의 해당 데이터를 무료로 공개했다. 누구든 이 데이터를 이용해 자신의 웹사이트에 콘텐트를 제작할 수 있다. 시스템 제작과 설치, 운영에는 상당한 비용이 든다. 하지만 MLBAM은 더 많은 이들이 공유할수록 데이터의 가치는 높아진다고 판단했다.

팬그래프닷컴이라는 웹사이트는 이 데이터를 이용해 메이저리그에서 뛰었던 모든 투수들의 구종 구사율과 구속, 무브먼트에 대한 통계를 제공한다. 몇 년 전이라면 구단 스카우트나 전력분석요원이나 알 수 있는 고급 야구 정보였다.

스트라이크존 바깥으로 빠진 공을 이른바 '미트질'로 스트라이크 판정을 받게 하는 영리한 포수들이 있다. 피치f/x 데이터를 이용하면 어떤 포수가 '미트질'을 가장 잘 했는지, 그리고 그 기술로 팀에 몇 승 정도의 공헌을 했는지를 파악할 수 있다. 포수의 투수 리드는 많은 야구인들이 가치를 인정하지만, 실제 공헌도가 어느 정도인지 설명하기 어려운 미지의 영역이다. 피치f/x 데이터에 대한 연구가 진행되면 '가장 성공 확률이 높은 볼 배합'에 대한 논쟁도 가능할 것이다.

 

데이터 공개, 공공재의 확대가 불평등을 완화시킨다!

롯데와 두산, 한화에서 투수로 뛰었던 차명주씨는 지금 스포츠재활센터를 운영하고 있다. 그는 "투수가 힘이 떨어지면 릴리스포인트가 낮아집니다. 부상 위험이 커지죠. 이에 대한 데이터 확보가 필요합니다"고 말했다. "현장 감독이나 코치도 경기 중 투수의 팔이 처지고 있다는 걸 알아채지 않습니까"라고 물었다. 그는 "선수 출신이라면 다 알죠. 문제는 어느 정도가 위험한지에 대한 기준이 보는 사람마다 제각각이라는 거죠"라고 답했다. 그가 필요한 데이터는 미국에선 일반 팬도 자유롭게 활용할 수 있다,

스포츠 경제학자 앤드루 짐볼리스트는 "최근 메이저리그 전력 평준화 현상은 수익 공유보다는 통계 분석 등 기능적 변화와 더 상관관계가 있다"고 주장한다. 영화 ‘머니볼’에서 보여지듯 1990년대 이후 메이저리그는 ‘세이버매트릭스’로 불리는 데이터 분석기법을 경기 운영과 경영에 적극적으로 도입했다.

그런데, 당시 세이버매트릭스의 기반이 됐던 데이터는 100년 전에 시작됐던 야구기록지였다. 과거 기록지를 여러 팬들이 자원봉사로 전산화한 게 세이버매트릭스 발달의 기반이 됐다. 피치f/x 데이터는 그보다 훨씬 발달된 수준이다. MLBAM은 여기에서 한 발 더 나아가 야수들의 동장과 타구 움직임까지 추적하는 새로운 시스템을 개발했다. 한 경기에서 생산되는 데이터 용량은 테라바이트 단위다.

MLBAM CEO 밥 바우먼은 지난해 이 시스템에 대해 “미가공 상태의 데이터는 누구에게나 접근을 허용할 것”이라고 밝혔다. 방대한 데이터가 '공공재'가 되면, 야구에 대한 지식과 방법론은 리그나 일개 구단이 주도할 때보다 훨씬 발전될 수 있다는 믿음이 깔려 있다.

 

사직구장 창고에서 발견한 펠릭스 호세의 메디컬 리포트

모든 국내 프로야구단들은 소속 선수 부상에 대한 데이터를 매일 생산한다. 그러나 대부분은 몇 년 지나면 ‘쓰레기’가 된다. 사직구장 창고에서 왕년의 슈퍼스타 펠릭스 호세의 메디컬 리포트가 버려져 있는 걸 발견한 적이 있다.

구단들이 공동의 프로토콜을 정한 뒤 이 데이터들을 공유하고 일반이나 전문가 집단에 공개하는 건 어떨까. 프로 선수의 건강과 부상에 대해선 아직 밝혀지지 않은 것들이 많다. 의학적으로 말도 안 되는 훈련 방식을 고집하는 지도자도 있다. 하지만 이를 반박할 연구 결과는 부족하다. 한국 야구 선수에 대한 충분한 데이터가 없기 때문이다.

한 구단 중견 관리자는 이에 대해 "선수 부상은 구단의 비밀이다. 쉽게 동의하기 어려울 것"이라고 했다. 메이저리그에선 이미 이런 구상을 하고 있다. 그들은 “데이터 공유 정책의 다음 목표는 부상의 정복”이라는 꿈을 갖고 있다.

키워드 / 태그 : 야구, 정보공개, 공유, 메이저리그, 리베라, 호세, 머니볼, 빅데이터볼

float_section