DISGRESSIÓ ESTADÍSTICA SOBRE EL NOMBRE JUST (MERESCUT) DE PENALS I D’ALTRES INDICADORS DISCIPLINARIS[1] QUE PODEN INFLUIR EN EL RESULTAT DELS PARTITS

(STATISTICAL DIGRESSION ON THE FAIR (DESERVED) NUMBER OF PENALTIES AND OTHER DISCIPLINARY INDICATORS[2] THAT MAY CHANGE THE OUTCOME OF MATCHES)

ABSTRACT (Catalan & English ):

Els àrbitres tenen la difícil tasca d’assegurar que els partits esportius acabin amb resultats justos, tot mantenint la competició dins del marc del reglament. Això implica que hauran d’interrompre el joc sempre que s’infringeixin les seves normes. Per tant, un equip pot ser castigat per les pròpies infraccions (Indicadors Disciplinaris Negatius: DI (-)) o recompensat per les de l’adversari (Indicadors Disciplinaris Positius: DI (+)), la qual cosa pot conduir a canvis en el resultat, siguin justos o injustos. En un partit determinat (A casa? A domicili? Estat del Camp? etc.) o durant un nombre reduït de temporades (Jugadors? Entrenadors? Normes? etc.), un munt de factors poden influir molt en la quantitat de DI (+/-) , però, què hauríem d’esperar a observar, a mesura que augmenta el nombre de temporades? Tots aquests efectes a curt termini, inclosos els errors involuntaris, haurien de compensar-se i desaparèixer com el soroll de fons? Què hauria de quedar finalment? En cas de sospita d’un biaix sistèmic, cas molt comú entre tota mena d’aficionats, es podria aïllar d’aquesta manera la seva influència per tal de poder avaluar la seva significació estadística?

Els esforços en la investigació relacionada es concentren en la predicció de variables en el futur (superant els algoritmes de les cases d’apostes, si és possible!). Però, a part d’algunes queixes poc estructurades d’alguns fanàtics sobre algun biaix disciplinari basat en simples mitjanes, ni la literatura ni la premsa contenen un enfocament sistemàtic per respondre a aquestes preguntes i predir la quantitat JUSTA (merescuda) de DI (+/-) en el passat. O almenys no he sabut trobar-ne cap, si n’hi hagués. Per la present, es proposa un tal model general, bàsicament una barreja d’atzar i habilitat, utilitzant les variables àmpliament disponibles: Partits o Temporades, per l’atzar, i Punts (Victòries, Empats, Derrotes) o Gols (+/-), per l’habilitat. Aquestes correlacions superen tot tipus d’escrutini estadístic a les cinc principals lligues europees (Premier, Bundesliga, Ligue 1, Serie A, Liga). Es proposen millors variables (com més gran sigui la mostra, millor), inclosos altres DI del mateix signe, però no estan disponibles. En cas que aquest enfocament resulti ser realment original, irònicament reivindico per ell el nom de “Llei d’AMSY”.

El principal problema trobat ha estat la manca de registres DI (+/-) disponibles públicament. Només he trobat dues fonts de valor:

Nombre de Penals (+/-) històric per a la Lliga espanyola (89 temporades): les principals conclusions són que es pot sospitar d’un biaix de Penals (+) en contra del Barcelona i que es pot demostrar un clar doble biaix de Penals (-), a favor del Reial Madrid i contra el Barcelona, mitjançant diverses proves que superen el llindar del 95%. És rellevant tenir en compte que la incidència potencial en punts dels Penals (-) és aproximadament el doble que la dels Penals (+), per a aquests equips de la part superior de la taula. A continuació s’entra en especulacions sobre com s’haurien d’haver distribuït els punts i les lligues, però, per molt importants que siguin els Penals (+/-), en comparació amb d’altres DI, un biaix general i sistèmic només es pot demostrar més enllà del dubte si la majoria, si no totes les DI, en lloc de cancel·lar-se mútuament les influències, mostressin una tendència coherent.

14 anys de Penals (+/-), Targetes Grogues (-), Targetes Vermelles (-) per a les cinc lligues principals esmentades (28 anys per a la Premier League): les principals conclusions són que, malgrat que es detecten alguns biaixos sospitosos o clars, el nombre de temporades és massa baix per diluir-ne les possibles explicacions raonables a mitjà termini.

En aquest treball preliminar, es formula un model teòric (Llei d’AMSY) i es valida amb les dades disponibles, però es necessiten més dades de DI per confirmar si les desviacions observades concorren de fet en un biaix general o si només mostren les imprecisions del model. SI US PLAU: algú té accés a registres històrics dels indicadors disciplinaris rellevants (Faltes (+/-), Fores de Joc (+/-), Penals (+/-), Córners (+/-), Targetes Grogues (+/-), Targetes Vermelles (+/-)) de les 5 principals lligues europees?

Referees have the difficult duty to ensure fair outcomes of sports matches by keeping the contest within the rules, which implies interrupting the game whenever these rules are violated. Any squad may thus be punished for their own violations (Negative Disciplinary Indicators: DI (-)) or rewarded for the opponent’s (Positive Disciplinary Indicators: DI (+)), leading perhaps to changes in the outcome, fair or unfair. In a certain match (Home? Away? Pitch? etc.) or during a reduced number of seasons (Players? Trainers? Rules? etc.) a bunch of factors may have a strong influence on the amount of DI (+/-), but what should we expect to observe as the number of seasons increases? Should all these short-term effects, including unwilling mistakes, compensate themselves and vanish like ground noise? What should eventually remain? In case of a suspected systemic bias, which is not unusual among all kinds of supporters, could its influence be singled out in that way in order to evaluate its statistical significance?

The efforts in the related research are concentrated in predicting variables in the future (outperforming the betting algorithms, if possible!), but, apart from some simple complains by squad supporters about disciplinary bias based upon plain averages, neither the Literature nor the Press contain a systematic approach to answer these questions and predict the FAIR (deserved) amount of DI (+/-) in the past. Or at least I have failed to find one, should any exist. Such a general model is hereby proposed, basically a mixture from chance and skill, using the variables widely available: Matches or Seasons for chance and Points (Wins, Draws, Losses) or Goals (+/-) for skill. Such correlations stand all kinds of statistical scrutiny in the five major European leagues (Premier, Bundesliga, Ligue 1, Serie A, Liga). Better variables are proposed, the larger the sample, the better, including other DI of the same sign, but they are not available to be tested. In case this approach ends up to being truly original, I ironically claim for it the name of “AMSY’s Law”.

The main problem encountered has been the lack of publicly available DI (+/-) records. I only found two valuable sources:

All-time # of Penalties (+/-) for the Spanish Liga (89 Seasons): the main conclusions are that a Penalties (+) bias against Barcelona may be suspected and a clear Penalties (-) double bias (in favour of Real Madrid and against Barcelona) can be shown through several tests to be beyond the 95% threshold. It is relevant to note that the potential incidence in Points of the latter is roughly twice as much that of the former, for these top-table squads. Some speculations about how points and leagues should have been distributed accordingly do follow, but however important Penalties (+/-) are, compared to other DIs, a general, systemic bias can only be proven beyond doubt if the majority, if not all DIs, instead of cancelling each other’s influence, would show a consistent trend.

14 years # of Penalties (+/-), Yellow Cards (-), Red Cards (-) for the 5 mentioned major Leagues (28 years for the Premier League): the main conclusions are that, despite the detection of a few suspected or clear biases, the number of seasons is too low to dilute possible medium-term reasonable explanations for them.

In this preliminary work, AMSY’s Law model is formulated and validated with the available data, but more data is needed to confirm whether the observed deviations indeed concur in a general bias or just show the random limits of the model. PLEASE: anybody has access to all-time records for all Disciplinary Indicators (Freekicks (+/-), Offsides (+/-), Penalties (+/-), Corner kicks (+/-), Yellow cards (+/-), Red cards (+/-)) of the 5 major European Leagues?

[1] Anomeno Indicadors Disciplinaris a totes les modalitats de penalització de l’equip infractor a disposició d’un àrbitre esportiu. Per al futbol: Tirs lliures, Fores de Joc, Fores de Banda, Córners, Penals, Targetes Grogues, Targetes Vermelles.

[2] I call Disciplinary Indicators to all kinds of punishment of a squad having violated the rules at the disposal of a sports referee. For football: Freekicks, Offsides, Throw-ins, Corner kicks, Penalties, Yellow Cards, Red Cards.

INTRODUCCIÓ:

Aquest treball va començar com un petit “divertimento”, però el cert és que se m’ha complicat força. Que me l’he complicat jo mateix amb diverses ramificacions fractals. Si teniu paciència i aneu més enllà dels titulars, ja ho veureu. Si no m’aturo, això acaba en la Bíblia en vers!

M’agraden els esports i n’he practicat una colla, alguns dels quals els procuro anar allargassant. Fa una colla d’anys que vaig deixar el futbol, però hi havia jugat molt, sempre a nivell d’aficionat, ja fos amb l’equip de la facultat, amb diversos grups d’amics o amb les empreses. En tota mena de camps, però sobretot futbol gran. El millor equip amb el que mai he jugat era el de Químiques, dues vegades seguides campió universitari de Catalunya. Dubto molt que m’hi hagués guanyat la vida, però crec que hi entenc prou. Pel que fa al reglament, dec ser dels poquets que se’l va llegir quan m’afectava. En coneixia la lletra i l’esperit i he procurat estar al dia dels canvis, amb els quals no sempre estic d’acord. En qualsevol cas, crec que tinc prou criteri per distingir quan és fora de joc, quan falta, quan penal, quan targeta groga, quan vermella.

Sempre he preferit la pràctica activa dels esports a la seva contemplació ociosa per TV. Com que sóc del Barça, però, procuro veure els seus partits. I no m’agraden els arbitratges que sol rebre. No veig mai els del Madrid, només quan s’enfronta amb el Barça. Si alguna vegada en veig algun, no deixa de sorprendre’m. Ho dic pel biaix arbitral, del qual n’he sigut testimoni tota la vida, amb alguns exemples clamorosos. Sé que sóc un fanàtic del meu equip, però em considero força objectiu. Ho sóc?

El Barça es queixa del àrbitres: aquesta temporada ho han fet Koeman i Piqué, sempre sota l’amenaça de sanció. El més intel·ligent en fer-ho: en Pep Guardiola[3] . Però tots els equips se’n queixen, en algun moment o altre. Fins i tot el mateix Real Madrid ho fa, quan li convé, emprant tota la rècula de mitjans que li són afins, que no són pocs, per no dir que són tots els estatals.

És, per tant, la nostra visió subjectiva, que ens anul·la la perspectiva i la imparcialitat? És tan senzill com que cadascú ho mira des dels seus colors? O bé hi ha quelcom de veritat en algun dels greuges reclamats? Té raó la gent quan coreja “así, así, así gana el Madrí”? O, com diuen molts, que es beneficia els equips grans? Hi hauria alguna manera de saber-ho del cert? Com sempre, hi ha dues possibilitats: Documentar-ho amb proves sobre fets concrets: el cas Di Stefano, el comitè arbitral de José Plaza, el “Villarato” (per posar un exemple contrari), etc. Seria ideal, però no crec que passi. Analitzar-ho amb l’ajuda de les matemàtiques, per veure si apareix un biaix estadístic que sigui significatiu. No sabia com posar-m’hi, però després de veure els enfrontaments directes entre Barça i Madrid d’aquesta Lliga, amb les consegüents discussions acalorades, vaig decidir d’intentar-ho[4] , esperonat per una inesperada remuntada[5].



[3] Com quan demanava als àrbitres que no volia més penals a favor, un any que no n’hi havien assenyalat cap, fins que la temporada no va estar decidida. A partir d’aquell moment en van caure uns quants de seguits.

[4] No podia posar-m’hi sense aprendre de nou l’estadística que vaig oblidar fa dècades i anar una mica més enllà. Ho he repassat tot, però convido els experts a notificar-me qualsevol error o inexactitud.

[5] Després del ridícul final de la qual, va anar de poc que no ho deixés córrer!

Veure text íntegre a “DADES CONTRASTADES: SOBRE LA JUSTÍCIA EN EL FUTBOL (ON JUSTICE IN ASSOCIATION FOOTBALL) (capdret.blogspot.com)“