“La mejor manera de valorar el aporte ofensivo de un jugador: wOBA (III)”

Por y en colaboración con la peña, Yosuan Hernández Roque

En trabajos anteriores analizamos la manera de calcular el valor en carrera de cada evento del béisbol en situaciones promedio, es decir, con bateadores, lanzadores y corredores promedios. Hoy continuaremos ese análisis pero ahora determinaremos el valor en carrera de los eventos pero por estados base out, hasta obtener los pesos lineales que forman parte de la fórmula para calcular el wOBA.

Valor en carrera por estados/transiciones

Comencemos por dividir las ocurrencias de HR en los 24 estados base/outs que existen en el béisbol. Analicemos la siguiente tabla (Tabla 1.), donde usamos la abreviatura REOI para referirnos a las carreras hasta el final de la entrada (runs to end of inning).

Tabla 1. Carreras al final de la entrada por estados base/out para el HR.

1B

2B

3B

Outs

HR

REOI

Promedio REOI

RE inicial

Valor en carrera

0

5518

8779

1.591

0.555

1.036

1

3498

4528

1.294

0.297

0.997

2

3023

3382

1.119

0.117

1.002

1B

0

1195

3137

2.625

0.963

1.672

1B

1

1401

3213

2.293

0.537

1.721

1B

2

1394

2957

2.121

0.251

1.870

2B

0

292

728

2.493

1.189

1.304

2B

1

535

1243

2.323

0.725

1.599

2B

2

661

1395

2.110

0.344

1.766

3B

0

42

106

2.524

1.482

1.042

3B

1

193

440

2.280

0.983

1.296

3B

2

273

583

2.136

0.387

1.748

1B

2B

0

305

1042

3.416

1.573

1.844

1B

2B

1

544

1826

3.357

0.971

2.385

1B

2B

2

588

1831

3.114

0.466

2.648

1B

3B

0

120

426

3.550

1.904

1.646

1B

3B

1

230

760

3.304

1.243

2.062

1B

3B

2

312

981

3.144

0.538

2.607

2B

3B

0

59

210

3.559

2.052

1.508

2B

3B

1

133

438

3.293

1.467

1.826

2B

3B

2

155

491

3.168

0.634

2.534

1B

2B

3B

0

78

354

4.538

2.417

2.122

1B

2B

3B

1

230

969

4.213

1.650

2.563

1B

2B

3B

2

247

1019

4.126

0.815

3.311

Este es el valor añadido en carreras que un HR crea desde cada estado base/out, según las estadísticas de la MLB de 1999 al 2002. Al leer la primera línea encontramos que hubo 5518 jonrones conectados con las bases limpias sin outs. Desde el momento en que el primer bateador conecta HR hasta el final de la entrada se anotan 8779 carreras. Esto nos da un promedio de 1.591 carreras anotadas hasta el final de una entrada que comienza con HR del primer bateador (incluyendo la carrera que anota este bateador producto del HR). Ya conocíamos del artículo anterior que el promedio de carreras anotadas por un equipo promedio, con un bateador promedio, era de 0.555 carreras al inicio de la entrada. La diferencia es de 1.036 carreras.

¡Espera un minuto! ¿1.036? ¿Por qué no es exactamente una carrera? ¿No nos suma el HR en dicha situación (bases limpias sin outs) una carrera? Debemos recordar qué estamos mirando aquí. Estamos mirando una muestra del rendimiento de un grupo de jugadores (equipos con jugadores que conectaron HR con las bases limpias sin outs) y lo estamos comparándolo con una muestra diferente del rendimiento de un grupo diferente de jugadores (todos los equipos). El primer grupo es diferente al segundo. Como pueden ver, siempre con más de 5000 HR, la diferencia aleatoria entre estas dos muestras causa un error de unos pocos céntimos entre en nuestros cálculos.

Comprobemos la situación de corredor en tercera sin outs. El valor en carrera de un HR es de 1.042 carreras, lo cual es casi lo mismo que sin corredores en circulación. Pero noten que esto ocurrió solo 42 veces. Este es un tamaño para la muestra muy pequeño y claramente no debemos confiar mucho en las conclusiones que podamos extraer de 42 instancias.

¿Cuál puede ser la mejor manera de calcular el valor en carrera del HR? En lugar de calcular cuántas carreras son anotadas al final de una entrada, comparemos el valor en carrera de los estados inicial y final. La diferencia entre ambos estados sería la ganancia en carreras del evento, en este caso el HR. Por supuesto, cualquier carrera anotada realmente durante el evento necesita ser añadida al resultado de la diferencia anterior.

Volvamos a utilizar el HR como nuestro ejemplo. Comienza la entrada con el estado base/out bases limpias sin outs y se conecta un jonrón. El valor en carrera inicial es la expectativa de carreras (RE) del estado bases limpias sin outs: .555 carreras. ¿Cuál es el estado base/out final? Bases limpias sin outs, con una carrera anotada. El valor en carrera del estado final es la expectativa de carreras del estado bases limpias sin outs más uno por la carrera anotada. El valor en carrera del estado final sería 1.555 carreras. La diferencia entre el valor en carrera del estado final (1.555) y el estado inicial (.555) es exactamente una carrera. Está claro que podíamos calcular esto por nosotros mismos.

¿Cómo sería si las bases estuvieran llenas con dos outs? En este caso, el valor en carreras del estado inicial sería .815 carreras anotadas al final de la entrada. Después del HR tenemos 4 carreras anotadas más la expectativa de carreras del estado final bases limpias y dos outs, la cual es .117 carreras. Luego el total del valor en carreras del estado final sería 4.117. La diferencia entre los dos estados es 3.302 carreras, este valor es asignado al HR como la acción que provocó el cambio de estados.

Esto puede traer algunas dudas. ¿Por qué el grand slam (jonrón con bases llenas) no vale exactamente 4 carreras? Porque tenemos previsto que algunas de esos corredores anoten con un bateador promedio. Específicamente, esperamos que se anoten .815 carreras. El valor extra que provee el HR, con un bateador por encima o por debajo del bateador promedio, fue 3.302 carreras. ¿Por qué darle todo el crédito al HR? No se lo damos. Tener tres corredores en circulación con dos outs vale .815 carreras. Este es el crédito que estamos teniendo para los eventos que nos dejan en esta situación.

Cualquier cambio en estado está dado por el evento que causa el cambio en estado. El bateador promedio, viendo tres corredores en circulación con dos outs, tendrá un valor añadido de exactamente cero carreras. Cero, ni más ni menos. Algunas veces se anotarán cuatro carreras. Muchas veces se producirá el tercer out. En general, el número de carreras que él agregará por sus hits y boletos será exactamente contrarrestado por las carreras potenciales que el tercer out evite anotar.

Para calcular el valor en carrera total del promedio de los HR tomaremos el promedio ponderado de los valores en carreras de los 24 estados base/out. Aquí está la Tabla 1 pero modificada para seguir el proceso de transición entre estados que acabamos de describir (Ver Tabla 2). La columna Original nos da el valor en carrera de la tabla anterior (la que nos daba que el HR vale 1.036 carreras cuando se tiene las bases limpias sin outs).

Tabla 2. Valor en carreras del HR por estados base/out.

1B

2B

3B

Outs

HR

Original

RE inicial

RE final

Valor en carrera

0

5518

1.036

0.555

1.555

1.000

1

3498

0.997

0.297

1.297

1.000

2

3023

1.002

0.117

1.117

1.000

1B

0

1195

1.672

0.963

2.555

1.602

1B

1

1401

1.721

0.537

2.297

1.725

1B

2

1394

1.870

0.251

2.117

1.865

2B

0

292

1.304

1.189

2.555

1.367

2B

1

535

1.599

0.725

2.297

1.573

2B

2

661

1.766

0.344

2.117

1.772

3B

0

42

1.042

1.482

2.555

1.073

3B

1

193

1.296

0.983

2.297

1.314

3B

2

273

1.748

0.387

2.117

1.729

1B

2B

0

305

1.844

1.573

3.555

1.983

1B

2B

1

544

2.385

0.971

3.297

2.326

1B

2B

2

588

2.648

0.466

3.117

2.651

1B

3B

0

120

1.646

1.904

3.555

1.651

1B

3B

1

230

2.062

1.243

3.297

2.054

1B

3B

2

312

2.607

0.538

3.117

2.579

2B

3B

0

59

1.508

2.052

3.555

1.504

2B

3B

1

133

1.826

1.467

3.297

1.830

2B

3B

2

155

2.534

0.634

3.117

2.483

1B

2B

3B

0

78

2.122

2.417

4.555

2.139

1B

2B

3B

1

230

2.563

1.650

4.297

2.647

1B

2B

3B

2

247

3.311

0.815

4.117

3.302

Esto produce algo con mucho más sentido. El valor en carrera del HR con las bases limpias (con cualquier número de outs) es exactamente una carrera. Si ustedes toman el promedio ponderado de todos los valores en carrera anteriores para el HR, obtienen el valor en carrera promedio para el HR, el cual es 1.397 carreras.

Repitiendo todo este proceso para todos los eventos obtenemos el valor en carrera de cada uno de los eventos del béisbol (Ver Tabla 3).

Tabla 3. Valor en carrera por evento.

Evento

Valor en carrera

Home Run

HR

1.397

Triple

3B

1.070

Dobles

2B

0.776

Embazado por Error

RBOE

0.508

Sencillo

1B

0.475

Embazado por Interferencia

INT

0.392

Deadball

HBP

0.352

Base por Bolas No Intencional

NIBB

0.323

Passed Ball

PB

0.269

Wild Pitch

WP

0.266

Balk

BK

0.264

Base por Bolas Intencional

IBB

0.179

Base Robada

SB

0.175

Indiferencia Defensiva

DI

0.120

Toque de bola

BUNT

0.042

Sacrificio de Toque

SAC

-0.096

Sorprendido en base

PK

-0.281

Out (sobre pelota bateada)

OUT

-0.299

Ponche

K

-0.301

Cogido robando

CS

-0.467

Recuerden que estos son los valores en carrera de los eventos durante los años 1999-2002 de las Grandes Ligas. Si quisiéramos determinar cuál es el valor en carreras de cada evento para otro periodo de tiempo tendríamos que realizar todos los cálculos que hemos venido haciendo desde el primer artículo pero utilizando los datos del periodo a analizar. Igualmente, pudiéramos determinar el valor en carrera de cada evento para otra liga (en particular la Serie Nacional), en este caso debemos utilizar los datos de la liga en cuestión. Es un error matemático grave utilizar los valores en carreras calculados para un periodo o liga en los cálculos estadísticos de otro periodo o liga. Solo serían válidos para hacer una proyección de la posible actuación de un equipo o jugador.

Promedio de Embazado Ponderado (Weighted On Base Average – wOBA)

El Porciento de Embazado (OBP) es una gran estadística porque te dice algo importante y en un lenguaje claro: ¿Cada qué ritmo un jugador alcanza una base? Él no te dice cuán lejos llegas a avanzar, solo si la alcanzas o no.

El Porciento de Slugging (SLG) es otra gran estadística porque te dice algo importante y en un lenguaje claro: ¿Cuántas bases gana un jugador por su propio esfuerzo por beses al bate? Él no considera los boletos como un evento positivo o negativo (simplemente lo obvia como si no existiera). Él, también, trata de establecer una importancia entre el sencillo y el HR, ponderando este último como cuatro veces por encima del sencillo.

Tenemos una estadística que es deficiente en un área y otra que es deficiente en otra área. ¿Por qué no simplemente combinamos ambas OBP más SLG y la llamamos OPS? Después hablaremos del OPS.

De la sección anterior conocemos los valores en carrera de cada evento. Por ejemplo, sabemos que HR tiene un valor de casi 1.4 por encima del promedio y 1.7 por encima del valor en carreras del out. En las medidas de ritmo, como el OBP, el valor del out en el numerador es cero. Si reconvertimos el valor en carrera de los eventos más comunes relativos al out, tendríamos lo siguiente:

HR 1.70, 3B 1.37, 2B 1.08, lB 0.77, NlBB 0.62.

Esos números son los valores de cada uno de nuestros eventos (relativos a un out, el cual tendría un valor de cero). Si aplicamos estos pesos a las estadísticas de un bateador promedio de la liga y la dividimos por las comparecencias al bate (PA) terminamos con un valor de .300. Este es un número conveniente para un promedio, pero se puede hacer mejor. Podemos ver al OBP para medir la eficacia de un bateador, luego escalemos nuestra nueva estadística para que el valor resultante sea similar a los valores del OBP. Si añadimos un 15% al valor calculado sobre .300 obtendríamos el promedio de OBP de la liga. Luego, añadiremos un 15% a los pesos de cada evento y definamos la nueva estadística como sigue:

wOBA = (.72xNIBB+.75xHBP+.90x1B+.92xRBOE+1.24x2B+1.56x3B+1.95x HR) / PA

Nota: Dependiendo del análisis específico que se haga se puede quitar de las comparecencias al bate (PA) los toques, IBB y otras jugadas.

El wOBA podemos interpretarlo como el aporte en carreras por comparecencias al bate de un jugador a su equipo. En su fórmula los pesos por los cuales se multiplican la cantidad de boletos no intencionales, sencillos, pelotazos, veces que entra en circulación por error, dobles, triples y jonrones son calculados de la menare que hemos descrito en los tres artículos. Por tanto, es fácil entender que varían en dependencia de cual sea la muestra de los datos con los que se calcule.

Por tanto, un bateador que en MLB tenga un wOBA de .320 está sobre la media de la liga, pero en Cuba sería un bateador por debajo de la media. La razón: el promedio de carreras por juego de la pelota cubana es mucho más grande de la media de MLB, luego las acciones ofensivas tienen mayor valor en carreras.

Para los amantes del OPS, se puede demostrar que (OBP x 2 + SLG) / 3 es una aproximación cerrada del wOBA. El boleto aparece en el OBP pero no en el SLG. Algo muy importante: la suma no se puede hacer tan simple como la tenemos porque los denominadores de ambas fórmulas son diferentes, en el OBP son comparecencias al bate mientras en el SLG son veces al bate. Podemos decir, que una aproximación relativamente decente.

4 comentarios

Ir al formulario de comentarios

    • Slugger on 17 marzo, 2016 at 10:49 am
    • Responder

    Gracias Yosuan, once again!!!, por esta valiosa asistencia a todos los que no hemos podido leer ese libro.

    Pero todavia tengo mis dudas

    Si se despeja el valor en carreras del out en la formula original (excluyendo ROE y HBP para hacer mas sencillo el ejemplo) wOBA es el resultado de aplicar los valores en carreras a los hits y boletos, para despues sumarle el valor en carreras del out multiplicado por los hits y boletos.
    Esto se resume de la sgte manera:

    [(0.47*SEN+0.78*DOB+1.07*TRIP+1.40*HR+0.32*NIBB)+0.30*(H+NIBB)] / CB

    A su vez esto significa:
    (0.47*SEN+0.78*DOB+1.07*TRIP+1.40*HR+0.32*NIBB) / CB + 0.30 * OBA

    pues OBA = (H+NIBB) / CB

    Esta parte no la entiendo, porque añadir OBA multiplicado por el valor del out? Que razones existen para añadir el OBA nuevamente?

    En el valor en carreras ya esta incluido el valor por embasado y todos los demas (valor por impulsar corredores o rdi’s como bien le llama Tango, el del avance de corredores, y el de mantener vivo el inning o sea evitar outs precisamente)

    Porque no se dice nada acerca de la exclusion de los intentos de robo?

    Sinceramente no creo que wOBA sea la mejor manera de valorar la ofensiva individual.
    En realidad soy ferviente admirador de los trabajos de Tom Tango, pero el wOBA no me convence mucho, creo que existen mejores variantes, incluso me gustaria debatir el tema con el propio Tango, solo que no tengo correo para hacerlo, el siempre responde a los que le escriben y esta 100% presto a debatir sobre estos temas, una vez lo hice cuando tenia correo y siempre me respondio (hace varios años no tengo correo de salida internacional). Incluso este enfoque del wOBA puede traer otros problemas.

    El OPS es cierto que debe constituir una estadistica del pasado, pero nosotros aqui estamos en la pre-historia, el OPS puede ser positivo para hacer evaluaciones rapidas, a fin de cuentas en estos casos lo que importa es seleccionar al grupo de avanzada, pues el orden entre ellos no es lo realmente importante. Con el OPS la clave esta en llevarse una idea del rendimiento, para ser mas precisos en el orden hay que ir un poco mas lejos.

    Saludos

    • Yosuan Hernandez on 20 marzo, 2016 at 3:10 pm
    • Responder

    Hola Slugger,

    No entiendo como de la fórmula que planteas llegas a la fórmula de wOBA que aparece en el trabajo.
    Una duda: OBA = (H+NIBB) / CB o OBP = (H+NIBB) / CB? Cuándo dices OBA te refieres al OBP?
    La suma a los pesos del valor en carrera del out es una manera de ponderar la acción ofensiva positiva sobre la acción negativa (en este caso el out). La idea es agregarselo a las acciones positivas en lugar de ponerlo en la fórmula como negativo lo que provocaría que un jugador tenga wOBA negativo en el caso de que tenga más acciones negativas que positivas.

    De acuerdo contigo con respecto a las bases robadas. Considero que es una acción ofensiva positiva y se debe tener en cuenta. En la propuesta inicial de Tom Tango (que es la que les presento en el artículo) no aparece. Eso fue hace más de 10 años. Hoy hay muchos sitios diferentes que presentan variaciones en el cálculo. Algunos la incluyen otros no.
    Saludos y gracias por comentar,
    Yosuan

    • Slugger on 21 marzo, 2016 at 7:37 am
    • Responder

    No, Yosuan, estoy tomando como similares el OBA y OBP, o sea OBA = On Base Average, OBP=On Base Percentage estoy tomando como similares ambos conceptos. Es lo mismo, aunque como se conoce el OBA como la formula con los pesos lineales mas el out, ello tiende a confundir, pero debi haber puesto OBP.

    El caso es que me parece arbitrario el tratamiento de los outs, ello termina volviendo a incluir el OBP, esto significa que favorece arbitrariamemte.a jugadores de alto OBP.

    De incluir los intentos de robo, los cogido robando van a tener un valor negativo, pues el valor en carreras del CR es mayor al de los outs, al final se podrian tener algunos wOBA’s negativos por esta razon. El rendimiento negativo no debe ser un problema pues es una realidad.

    La idea es que me parece que pueden haber mejores indicadores que wOBA

      • Yosuan Hernandez on 24 marzo, 2016 at 11:39 am
      • Responder

      Hola Slugger,

      El OBP promedio de MLB el año pasado fue de .317 mientras el wOBA promedio fue de .313 según FanGraph (no tiene en cuenta las bases robadas). Mirando las estadísticas de la temporada pasada puedes encontrar varios jugadores con un OBP cercano a la media y sin embargo sus wOBA están entre los 30 primeros del béisbol. Entre ellos los cubanos Yoenis Cespedes, José Abreu y Nolan Arenado, el venezolano Carlos González. El caso contrario, 7 de los primeros 30 OBP de la Liga tienen wOBA por debajo de los .360. Puede ser que los que tengan alto OBP se sientan venificados el wOBA pero ¿qué es lo más importante en el béisbol? Las carreras y para anotar carreras hay que entrar en circulación. Los Blue Jays anotaron más carreras que cualquier otro equipo y tuvieron casi 10 puntos más de OBP que cualquier otro.

      Qué otras métricas consideras que son mejores que el wOBA?

      No sé si tendrás un correo donde pueda escribirte.

      Saludos,

      Yosuan

Deja un comentario

Your email address will not be published.