“La mejor manera de valorar el aporte ofensivo de un jugador: wOBA (II)”

En especial para la Martin Dihigo

Por Yosuan Hernández Roque

Continuamos con los trabajos donde exponemos los conceptos básicos de las estadísticas modernas. En especial la introducción de una de las métricas más importantes en la actualidad para medir el aporte real de un bateador a la victoria de su equipo: el wOBA.

En el artículo anterior mostramos dos conceptos muy importantes que devemos dominar antes de adentrarnos en el mundo de la sabermetría. El primero de ellos está relacionado al contexto donde se desarrolla un juego de béisbol: los estados base/out. Estos no son más que una situación de corredores en circulación y una cantidad de outs. Por ejemplo: corredor en primera sin outs, corredores en tercera y segunda y un par de outs, etc. Existen un total de 24 estados base/out debido a que pueden ocurrir 8 situaciones diferentes de corredores en base y 3 posibles outs, por el principio de multiplicación sería 24 formas diferentes.

Después analizamos el concepto de expectativa de carreras (RE, del inglés run expectation) que no es más que el promedio de carreras anotadas en hasta el final de la entrada a partir de que ocurre un estado base/out. Tomando como base las estadísticas de los juegos de la MLB (Mejor League Baseball) entre los años 1999 y 2002 se pudo obtener la tabla con las expectativas de carreras de los 24 estados base/out (Tabla 1).

Tabla 1. Expectativas de carreras por estados base/out, MLB 1999-2002.
1B 2B 3B 0 Outs 1 Outs 2 Outs
.555 .297 .117
1B .953 .573 .251
2B 1.189 .725 .344
3B 1.482 .983 .387
1B 2B 1.573 .971 .466
1B 3B 1.904 1.243 .538
2B 3B 2.052 1.467 .634
1B 2B 3B 2.417 1.650 .815

¿Cómo se interpretan estos números?

La tabla anterior muestra el promedio de carreras que se anotaron en las Grande Ligas en el periodo 1999-2002 a partir de la ocurrencia de un estado base/out hasta el final de la entrada. Esto se interpreta como la expectativa de carreras a anotar en una entrada después de que ocurra un estado base/out. Por ejemplo, la expectativa de carreras para el estado corredores en primera y tercera y un out es 1.243 carreras (1 carrera y 0.243 más, o una carrara y casi un cuarto de otra, todos los valores están redondeados a tres lugares después de la coma).

Notemos que según la tabla anterior en una situación promedio de juego (bateador promedio, bateador promedios esperando turno, corredores promedio, lanzador promedio, etc.) es mejor tener un corredor en primera sin outs que corredor en segunda con un out. También, es mejor tener corredores en primera y segunda sin out que corredores en segunda y tercera y un out. Cuando decirmos “mejor” es en el sentido de la cantidad de carreras que como promedio se anotan en cada una de las situaciones planteadas. Recarcamos que esto es válido en condiciones de juego promedio. (Próximamente realizaremos un trabajo sobre los sacrificio de toque y cómo lo utilizan los managers cubanos comparado con la MLB)

Valor en carrera

Conociendo la expectativa de carreras de cada uno de los estados base/out podemos determinar el aporte positivo o negativo de un bateador en una comparecencia al bate restando la expectativa de carreras del estado final (o después de la turno) y el estado inicial (antes del turno). En la práctica resulta complicado acceder y calcular cada uno de estos valores para cada una las camparecencias al bate de un jugador durante el curso de una temporada. En cambio, conocemos el número total de compecencias y qué sucedió en esas comparecencias: cuántos sencillos, dobles, triples, etc. el jugador tuvo.

Para convertir este cúmulo de información en el valor en carrera de un jugador, lo que tenemos que hacer es determinar el promedio de carreras creadas por cada tipo de evento (sencillos, dobles, etc.). Esto también tiene la ventaja de brindarnos de una mejor manera el valor de un jugador en un contexto neutral. En otras palabras, un jugador es valorado por su propio rendimiento y no por lo que hagan sus compañeros de equipo.

Tabla 2. Carreras hasta el final de la entrada por tipo de evento, MLB 1999-2002.
Event   N Carreras hasta el final de la entrada Promedio de carreras
Home Run HR 21026 40838 1.942
Triple 3B 3644 5887 1.616
Dobles 2B 34121 44728 1.311
Embazado por Error RBOE 7323 8286 1.132
Embazado por Interferencia INT 60 65 1.083
Sacrificio de Toque SAC 7878 8121 1.031
Passed Ball PB 1176 1206 1.026
Sencillo 1B 110538 113308 1.025
Wild Pitch WP 5358 5357 1.000
Deadball HBP 6559 6354 0.969
Balk BK 624 592 0.949
Base por Bolas No Intencional NIBB 60572 51432 0.849
Base por Bolas Intencional IBB 4626 3910 0.845
Base Robada SB 10597 8388 0.792
Indiferencia Defensiva DI 418 217 0.519
Toque de bola BUNT 2892 1392 0.481
Sorprendido en base PK 2269 944 0.416
Out (sobre pelota bateada) OUT 345580 82787 0.240
Ponche K 120275 24909 0.207
Cogido robando CS 3741 614 0.164

Nota: La notación es la que se utiliza en la MLB.

Estos son todos los tipos de eventos en el béisbol, acompañados de cuántas veces ocurrieron y cuántas carreras se anotaron desde el instante en que ocurrieron hasta el final de la entrada. Por ejemplo, hubo 21026 HR en los años de los datos que estamos analizando. Desde el momento en que se conectó un HR hasta el final de la entrada se anotaron 40838 carreras, para un promedio de 1.942 carreras anotadas por equipo por HR conectado por un jugador. Ahora, vamos al final de la tabla. Una vez que un realiza un out por una conexión (fly, línea o rolling), podemos esperar anotar .240 carreras hasta el final de la entrada.

Miremos nuevamente la tabla, especificamente los sacrificios de toque con un promedio de 1.031 carreras y los toques de bola (.481 carreras). ¿Cómo es eso posible? Un sacrificio está casi siempre seguido de un out, mientras un toque de bola regular a menudo pone al bateador en circulación. Entonces, ¿cómo es posible que un equipo anotará más carreras hasta el final de la entrada comenzando con un sacrificio de toque que cuando lo hace con un toque de bola regular? La razón es el contexto. Con un toque de bola usualmente tenemos las base limpias. Por otro lado, un sacrificio de toque, por definición, requiere que al menos un corredor esté en circulación. El estado base/out inicial ya tiene más alta la expectativa de carrera cuando se ejecuta un sacrificio que cuando se ejecuta un toque de bola. Una nota importante es que definimos el sacrificio de toque como un toque en una situación de sacrificio (hombres en base y menos de dos outs). Un toque regular es cualquiera de las restantes situaciones. Un vistazo rápido a la tabla de expectativa de carrera, muestra que los estados base/out que definimos como situación de sacrificio tienen mayor valor en carrera que los que definimos como situaciones de toque regular, y por tanto el número de carreras esperadas después del sacrificio es también mayor.

Luego, para contar por el contexto en el cual ocurren los eventos, añadimos otra columna a la tabla, la cual muestra el promedio de la expectativa de carrera iniciales por cada tipo de evento. (Tabla 3)

Tabla 3. Carreras hasta el final de la entrada por tipo de evento, MLB 1999-2002. (Parte 2)
Event   N Carreras hasta el final de la entrada Promedio de carreras RE Iniciales
Home Run HR 21026 40838 1.942 0.533
Triple 3B 3644 5887 1.616 0.553
Dobles 2B 34121 44728 1.311 0.547
Embazado por Error RBOE 7323 8286 1.132 0.586
Embazado por Interferencia INT 60 65 1.083 0.655
Sacrificio de Toque SAC 7878 8121 1.031 1.058
Passed Ball PB 1176 1206 1.026 0.741
Sencillo 1B 110538 113308 1.025 0.551
Wild Pitch WP 5358 5357 1.000 0.716
Deadball HBP 6559 6354 0.969 0.584
Balk BK 624 592 0.949 0.712
Base por Bolas No Intencional NIBB 60572 51432 0.849 0.520
Base por Bolas Intencional IBB 4626 3910 0.845 0.743
Base Robada SB 10597 8388 0.792 0.597
Indiferencia Defensiva DI 418 217 0.519 0.456
Toque de bola BUNT 2892 1392 0.481 0.409
Sorprendido en base PK 2269 944 0.416 0.672
Out (sobre pelota bateada) OUT 345580 82787 0.240 0.538
Ponche K 120275 24909 0.207 0.517
Cogido robando CS 3741 614 0.164 0.620

La RE inicial total es de .546, promediando todos los tipos de eventos. Noten que HR, 3B, 2B, 1B, NIBB (base por bolas no intencional) y el out tienen todos una RE inicial entre .52 y .56. Esto implica que estos eventos ocurren aleatoriamente por todos los estados base/out. Regresemos a los toques. El RE inicial para el toque de bola regular es .409, lo cual implica que el intento de toque ocurre cuando el potencial de carrera está por debajo de lo normal (final de la entrada o bases limpias). Pero, el RE inicial del sacrificio de toque es 1.058, lo cual es el más grande de cualquier evento. En este caso, el sacrificio se intenta cuando el potencial de carrera es mucho más grande de lo normal (temprano en la entrada y hombres en base).

De este modo, no solo es importante ver cuástas carreras el equipo anota desde el momento que ocurre el evento, también, es importante ver cuántas carreras el equipo espera anotar basado en el contexto base/out cuando ocurre el evento.

Agreguemos otra columna a nuestra tabla: el valor en carrera de un evento, el cual es igual a la diferencia entre el promedio de carreras anotadas hasta el final de la entrada y la RE inicial. (Tabla 4)

Tabla 4. Carreras hasta el final de la entrada por tipo de evento, MLB 1999-2002. (Parte 3)
Event   N Carreras hasta el final de la entrada Promedio de carreras RE Iniciales Valor en carrera
Home Run HR 21026 40838 1.942 0.533 1.409
Triple 3B 3644 5887 1.616 0.553 1.063
Dobles 2B 34121 44728 1.311 0.547 0.764
Embazado por Error RBOE 7323 8286 1.132 0.586 0.546
Sencillo 1B 110538 113308 1.025 0.551 0.474
Embazado por Interferencia INT 60 65 1.083 0.655 0.429
Deadball HBP 6559 6354 0.969 0.584 0.385
Base por Bolas No Intencional NIBB 60572 51432 0.849 0.520 0.102
Passed Ball PB 1176 1206 1.026 0.741 0.285
Wild Pitch WP 5358 5357 1.000 0.716 0.284
Balk BK 624 592 0.949 0.712 0.237
Base Robada SB 10597 8388 0.792 0.597 0.195
Base por Bolas Intencional IBB 4626 3910 0.845 0.743 0.533
Toque de bola BUNT 2892 1392 0.481 0.409 0.072
Indiferencia Defensiva DI 418 217 0.519 0.456 0.063
Sacrificio de Toque SAC 7878 8121 1.031 1.058 -0.027
Sorprendido en base PK 2269 944 0.416 0.672 -0.256
Out (sobre pelota bateada) OUT 345580 82787 0.240 0.538 -0.299
Ponche K 120275 24909 0.207 0.517 -0.310
Cogido robando CS 3741 614 0.164 0.620 -0.456

La tabla ha sido reordenada por la columna valor en carrera. El HR añade como promedio 1.41 carreras hasta el final de la entrada, relativo al rendimiento del jugador promedio. El promedio del out substrae .30 carreras relativo al promedio.

¿Volvemos de nuevo?¿Carreras nevativas?¿Cómo es eso posible? Tratemos de hacer una distinción entre total de carreras absolutas y carreras relativas a alguna escala fijada. El valor en carrera presentado anteriormente son los valores en carrera relativos al jugador promedio. Como vemos anteriormente en la fila out, en esta situación típica (situación promedio), el equipo promedio anotará .538 carreras hasta el final de la entrada. Sin embargo, cuando se produce un out, el equipo promedio anotará .240 carreras hasta el final de la entrada (como se discutió anteriormente). Luego, al producirse el out, se disminuyó la expectativa de carreras que se tenía al inicio de casi .54, de ahí que el valor en carreras del out sea de .3. Este es el costo de un out en situaciones promedio.

A pesar de ser el valor en carrera de los eventos en el béisbol en situaciones promedio, podemos extraer información interesande de esta tabla. Lo primero que resalta es entrar en circulación por un error del rival es más importante que conectar un sencillo y, sin embargo, ninguna de las métricas tradicionales (promedio de bateo, promedio de embazado, slugging,etc.) lo tienen en cuenta o lo que es lo mismo, lo reconocen como una virtud del bateador.

También es interesante que cada 10 bases por bolas intencionales que regalemos le estamos regalando una carrera en potencia al contrario. Tiene el mismo peso en un juego el wild pitch que el pass ball. Cada 4 balk que se cometa le regalamos una carrera en potencia al rival.

El sacrificio de toque tiene un valor negativo, es decir, en situaciones promedio es costoso para el equipo a la ofensiva sacrificar un bateado. ¡Increible no! ¡Cuesta casi lo mismo para el equipo a la ofensiva un ponche que un out por alguna conexión! Tendrían que poncharse 90 bateadores más que los que fallan por otra vía para perdamos una carrera más por culpa de un ponche que las que perdemos por culpa de un out.

¿Realmente queremos robar una base? Robar una base significa una ganacia de .195 carreras, es decir, tendríamos que robar más de 5 bases para aportar una carrera al equipo. Sin embargo, si nos capturan en el intento, estamos disminuyendo en .456 carreras la producción del equipo, es decir, con menos de dos veces que nos capturen robando estamos quitándole una carrera al equipo. ¡Increible! Lo dicen los número.

Dedicaremos un trabajo para analizar particularmente cada uno de estos puntos interesantes: bases robadas, bases por bolas intencionales, sacrificios de toque, etc.

Hasta aquí sabemos como determinar el valor en carrera (lo más importante en un juego: anotar carreras) de cada tipo de evento en situaciones promedio. En el próximo trabajo analizaremos cual es el valor en carrera de cada evento por estados base/out y presentaremos la estadística wOBA.

7 comentarios

Ir al formulario de comentarios

    • Fernando on 16 febrero, 2016 at 2:58 pm
    • Responder

    Yosuan:
    Entré a esta página porque un amigo me la recomendó. No me gusta comentar, nunca lo hago, pero se trata de una pincha de un amigo y no tengo otra que dedicarte unas líneas. Ya revisé completica esta peña y no se hace difícil su navegación, algo muy importante en el periodismo digital. Veo cosas, dentro del punto de vista periodístico, que puede mejorar, sin embargo, felicito a sus integrantes, porque de todos los blogs de la plataforma cubava este es el de más polémica, actualidad y de atinadas opiniones. Sabes que en estos momentos no estoy ejerciendo el periodismo, pero no puedo dejar de estudiar la sabermetría. Todavía me paran varias personas en San José para agradecer mis escritos -gracias a tu ayuda- sobre la sabermetría en el Mayabeque. Ojalá y el administrador del blog te dé libertad para escribir lo que quieras del tema y, de esta forma, este blog se convierta en un referente sabermétrico.
    Todavía el fanático cubano no domina bien este tema. Los “cuadrados” de la Comisión Nacional le han dado entrada al Grupo GIIB, pero de una forma tímida. No dan el brazo a torcer.
    Hace quince días hablé con Dennys Laza sobre la sabermetría. Le decía que Lázaro Vargas le hizo a él una formación en el cuadro, aquí en San José, hace tres años, y le quitó en dos juegos cinco hits. Me decía algo razonable: Mayabeque, con el “conjuntico que tiene”, si aplica la sabermetría, gana más juegos.
    Ojalá y Laza dé contigo. Se quedó boquiabierto cuando le dije que un día fui al Nelson contigo, casualmente traías la laptop y sacaste los datos de Yera. Por ejemplo, en dos srike y una bola, Yerasiempre venía con el mismo lanzamiento (Sinker), y en tres y dos venía recta pa´fuera. Era algo así, no recuerdo bien.
    Si Yera mi pitchea, me convierto en su papá, jajja.
    Un abrazo, hermano. Te felicito por el artículo y déjate ver en San José.
    Para el adminastrador del blog, también van mis felicitciones.

    1. Gracias amigo por la felicitación a Yoshuan y a la página. Si le digo que el amigo Yoshuan tiene las puertas abiertas para publicar todo lo que desee de sabermetría, de hecho ya este es su segundo trabajo y espero que tenga muchos más. Artículos como este le dan vida a los conocimientos de los visitante de la M.D, pues están muy bien fundados y es un placer contar con la colaboración del amigo Yoshuan. Saludos.

      • Yosuan Hernandez on 16 febrero, 2016 at 4:41 pm
      • Responder

      Gracias mi hermano!
      Hace rato que no nos vemos, de hecho hace rato que no veo a nadie del grupo. Tenemos que reunirnos un día y debatir del béisbol (la que se juega fuera) y de la pelota (la que se juega dentro). Este sitio lo sigue mucha gente (es el segundo en la recomendación de la plataforma Reflejos). La idea es que todos nos llevemos una idea, valga la redundancia, del significado de la fórmula del wOBA y con ella el WAR y demás métricas. Así se pierde el mito de que son números inventados que salen del aire.
      El GIIB es lo mejor que tiene este país en sabermetría. Ahora mismo uno de sus fundadores es analista de los Houston Astros!
      Saludos y sigue entrando a la página,

      Yosuan

  1. Muy pero que muy interesante, sin dudas la sabermetria cambiara la forma de dirigir beisbol, estamos a las puertas de una revolución en cuanto a estrategias de juego. Son increíbles algunos datos. En Cuba esto demorara bastante. No puedo explicarme como algunos se muestran reacios a aceptar estas cosas, los números no mienten. Tengo una anécdota: En la etapa que estuve dirigiendo beisbol en categorías infantiles, sin saber que existía la sabermetria, me dedicaba a compilar estadísticas un tanto raras para algunos, de mis alumnos, como cantidad de conexiones fuertes (sin importar si eran hits o outs), veces que se embasaban por cualquier razón, en que conteos eran más efectivos, en que entradas, hacia tablas de rendimientos por entradas, etc. y poco me importaba el averague de bateo y otros promedios clásicos. En un juego crucial, una vez, me aparecí con una alineación que desconcertó a todos, un primer bate que no llegaba a 200 de AVE, pero se embasaba muchísimo por bases por bolas y por error del contrario, un tercer bate que no compilaba tampoco muy buen AVE pero era el que más sólido le daba a la bola(por números) y un lanzador abridor con altísimo PCL pero en las tres entradas iniciales casi no permitía carreras(que luego sustituí en la cuarta) y cosas por el estilo, resultado: el primer bate bateo de 1-0, se embaso dos veces por base y una por error y anoto 2 carreras, el tercer bate de 4-2 con jonrón incluido, al lanzador abridor solo le hicieron una carrera en la tercera entrada y gane el partido 4 carreras por 2. Aquí tengo el trofeo del campeonato. Gracias Yosuan una vez más, no sabes cómo agradezco esos artículos, saludos

      • Yosuan Hernandez on 18 febrero, 2016 at 10:23 am
      • Responder

      Hay algo en el béisbol que es muy importante para valorar a un jugador y es el factor suerte. Un bateador que conecte muchas líneas con bajo AVG tiene poca suerte. En esto influye el posicionamiento defensivo que no es culpa del bateador. Te puedo comentar que alrededor del 71% de las líneas de la serie nacional se convierten hit. Hay una métrica que mide la probabilidad que tiene un bateador de que una conexión dentro del terreno se convierta en hit (BABIP).
      Saludos y gracias por comentar.

    • Slugger on 17 febrero, 2016 at 6:42 pm
    • Responder

    Nunca habia tenido la posibilidad de leer algo directamente del libro de Tom Tango, me parece genial la idea de exponer aqui algo sobre el tema para que todos conozcan mas sobre estos analisis.
    El wOBA es una estadistica muy bien diseñada, en realidad desde el punto de vista conceptual es un indicador mucho mas elaborado los que existian anteriormente, ademas de que trata de reforzar el concepto de OBP en la mente del aficionado. El OBP es una estadistica que ha estado bastante subvalorada y en el juego lo mas importante es embasarse. De hecho en la TV todavia se asocia el AVG cuando se habla de la ofensiva de los equipos enla SN.

    Lo que si creo que la aplicacion de estos conceptos al entorno de nuestras SN debe chocar ciertos con obstaculos como el tamaño de la muestra y los cambios estructurales que cada cierto tiempo acontecen en este entorno.

    Saludos y gracias por esta gran asistencia para los que no han podido leerse el libro

      • Yosuan Hernandez on 18 febrero, 2016 at 9:46 am
      • Responder

      Es muy dificil explicar en la TV en que consiste el wOBA. Por eso creo que es poco difindida esta estadística no solo en Cuba. Las grandes cadenas mundiales como FOX e ESPN no la utilizan mucho. Utilizan más el OBP porque es más fácil de explicar. Los periódicos pudieran tratar de explicarlo, en varios trabajos, como he hecho aquí o al menos intentarlo.
      En cuanto al AVG en para medir la producción ofensiva de un equipo es un error descomunal. De hecho es un error incluso en el orden individual. Todavía no se han dado cuenta que lo más importante en el béisbol es ganar y para ganar hay que fabricar carreras. Por tanto el equipo de mejor ofensiva es el que más carreras anotadas tenga. Eso es simple. Ahora el jugador de mejor ofensiva es que más carreras aporte al equipo: wRAA (carreras por encima de la media). De esta fórmula vamos a hablar después.
      En Cuba se calculan estas métricas, el GIIB lo hace. Después les voy a mostrar algunos datos que son públicos de series anteriores.
      Saludos y gracias por comentar.

Deja un comentario

Your email address will not be published.