martes, 31 de enero de 2012

Juicios por jurados

El juicio por jurados debe ser, notablemente, una de las peores ideas que se le haya ocurrido a alguien. Apenas puede culparse a quienes la concibieron. Vivieron antes de que se hubiesen propuesto los principios del muestreo estadístico y el diseño experimental. No eran científicos. Permítaseme explicar esto con una analogía. Y si, al final, alguien objeta el argumento aduciendo que los seres humanos no somos gaviotas argénteas, mi explicación habrá fracasado.
Los adultos de la gaviota argéntea poseen un pico amarillo brillante, con un notable punto rojo cerca del extremo. Sus polluelos pican esa área roja, lo cual induce a los padres a regurgitar el alimento para ellos. Niko Tinbergen, zoólogo y ganador del Premio Nobel —y mi antiguo maestro en Oxford—, ofrecía una variedad de figuras de cartón, que recordaban la cabeza de una gaviota con diversas formas y colores de pico, a polluelos recién nacidos. Para cada color, forma o combinación de ambos, Tinbergen medía las preferencias de los polluelos, contando el número de picadas por unidad de tiempo. La idea era descubrir si los polluelos de gaviota nacían con una preferencia innata por las cosas largas, amarillas y con puntos rojos. Si así era, eso constituía un indicador de que los genes proveían a los polluelos de un detallado conocimiento previo del mundo en el que iban a nacer; un mundo en el cual su comida proviene de los picos de gaviotas argénteas adultas.
La razón de la investigación no es importante y tampoco lo son sus conclusiones. Considérense, en cambio, los métodos que se deben utilizar y las trampas que es necesario evitar si lo que se desea es obtener un resultado correcto en cualquier experimento que se parezca a este. Se hallará que se trata de principios generales aplicables con igual fuerza a los tribunales humanos y a los polluelos de gaviota.
En primer lugar y de manera obvia, la prueba ha de realizarse con más de un polluelo. Podría muy bien ocurrir que algunos polluelos exhibiesen una tendencia hacia el rojo, otros una tendencia hacia el azul y que entre los polluelos de gaviota argéntea no hubiese ninguna tendencia general compartida hacia un color en particular. Por lo tanto, al utilizar un solo polluelo se estaría midiendo nada más que una tendencia individual.
En consecuencia, se debe hacer la prueba con más de un polluelo. ¿Cuántos? ¿Dos es suficiente? No. Ni lo son tres. Y a partir de aquí es necesario que comencemos a pensar de modo estadístico. Para ponerlo en términos sencillos, supongamos que, en un experimento en particular, comparamos únicamente puntos rojos contra puntos azules presentados en forma simultánea, siempre ambos sobre un fondo amarillo. Supongamos que realizamos la prueba con sólo dos polluelos y supongamos que el primero ha elegido el rojo. Si actuaba en forma aleatoria, tenía 50% de posibilidades de hacerlo. Ahora bien, ocurre que el segundo polluelo también ha elegido el rojo. Una vez más, las posibilidades de que el polluelo eligiera ese color, al azar, eran de 50%, incluso si hubiese sido daltónico. Había 50% de posibilidades de que los dos polluelos, eligiendo al azar, coincidiesen (la mitad de las cuatro posibilidades: rojo y rojo, rojo y azul, azul y rojo, azul y azul).Tampoco son suficientes tres polluelos. Si se escriben todas las posibilidades, se hallará que hay un 25% de posibilidades de que, sólo por azar, se presente un veredicto unánime. El 25%, como posibilidad de llegar a una conclusión por las razones incorrectas, resulta inaceptablemente alto.
¿Qué tal si utilizásemos 12 polluelos? Ahora sí. Si, de modo independiente, se ofrecen las dos alternativas a 12 polluelos, la probabilidad de que lleguen, por azar, al mismo veredicto es satisfactoriamente baja: solo una entre 1024.
Pero supongamos ahora que, en lugar de realizar las pruebas con nuestros 12 polluelos de manera independiente, hacemos el ensayo con ellos como grupo. Cogemos ese remolino de picos que no cesan de piar y acercamos al centro del alboroto una figura con un punto rojo y otra figura con un punto azul, cada una de ellas provista de un dispositivo eléctrico que cuantifica las picadas automáticamente. Y supongamos también que el colectivo de polluelos registra 532 picadas para la figura con el punto rojo y cero para la del punto azul. ¿Muestra esta enorme disparidad que esos 12 polluelos prefieren el rojo? Nada de eso. Las picadas no constituyen datos independientes. Los polluelos podrían haber tenido una fuerte tendencia a imitarse unos a otros (o a sí mismos, en efectos interdependientes). Si, por casualidad, se ha dado el caso de que un polluelo primero picara el rojo, los otros podrían haberle copiado y toda la compañía de polluelos se habría unido en un frenesí de imitadoras picadas. De hecho, esto es precisamente lo que hacen los polluelos de la gallina doméstica y probablemente los de las gaviotas hagan lo mismo. Y aun si no fuese, se mantiene el principio de que los datos no son independientes y, por lo tanto, el ensayo no es válido. Los 12 polluelos son estrictamente equivalentes a un solo polluelo y todas las picadas acumuladas, sin importar cuán numerosas sean, bien podrían haber sido una sola picada: equivalen a un único resultado independiente.
Volviendo a los tribunales, ¿por qué se prefieren 12 jurados a un único juez? No será a causa de que sean más sabios, tengan más conocimientos o estén más ejercitados en las artes del razonar. En efecto, no es por eso, en lo más mínimo. Piénsese en las astronómicas indemnizaciones que asignan los jurados en simples casos de difamación. Piénsese en cómo los jurados hacen surgir lo peor de los abogados histriónicos que gustan de complacer al vulgo. Se prefieren 12 jurados a un juez, sencillamente porque son más numerosos. Dejar que un solo juez decida el veredicto sería como dejar que un solo polluelo representase a todas las gaviotas argénteas. Doce cabezas piensan más que una, porque representan 12 evaluaciones de las pruebas.
Pero, para que este argumento fuese válido, las 12 evaluaciones deberían ser realmente independientes. Y, desde luego, no lo son. Doce hombres y mujeres encerrados en una habitación son como una camada de 12 polluelos de gaviota. Si, en efecto, se imitan unos a otros como polluelos, dependerá del caso. Podrían hacerlo y eso es suficiente para invalidar el principio por el cual el juicio por jurados llegaría a ser preferible a un juicio con un único juez.
En la práctica, tal como ha sido documentado y tal como yo recuerdo de los tres jurados en los que tuve la mala fortuna de participar, los jurados están inmensamente sesgados por uno o dos individuos más vehementes que el resto. Hay, también, una fuerte presión para que el veredicto sea unánime, lo que lesiona aun más el principio de independencia de los datos. Aumentar el número de miembros de un jurado no ayuda en mucho (en nada, en estricto principio). Lo que ha de aumentarse es el número de unidades examinadoras independientes.
Curiosamente, el extravagante sistema de juicios por televisión estadounidense ofrece una auténtica posibilidad de mejorar el sistema de jurados. Hacia el final de juicios tales como el de Louise Woodward o el de O. j. Simpson, miles de personas de todo el país habían observado las pruebas tantas veces como el jurado oficial. Una ola de llamadas telefónicas en masa podría producir un veredicto más justo que un jurado. Sin embargo, desafortunadamente, los debates periodísticos, los talkshows en la radio y el cotilleo corriente violarían el Principio de Independencia de los Datos y estaríamos, una vez más, donde empezamos. En todo caso, la masiva transmisión de los juicios, tiene consecuencias horribles. Poco después del juicio de Louis Woodward, Internet bullía con perversidades repletas de errores de ortografía y de gramática incorrecta, los periodistas hacían cola con sus cheques en la mano y el desafortunado presidente del tribunal tuvo que cambiar su número telefónico y contratar un guardaespaldas.
Entonces, ¿cómo se puede mejorar el sistema? ¿Debería encerrarse a los 12 jurados en 12 cámaras de aislamiento para que emitan sus votos de manera separada, de tal modo que constituyan datos auténticamente independientes? Si se objeta que algunas personas podrían ser lo suficientemente poco inteligentes o incapaces de expresarse como para llegar a un veredicto por sí mismas, surge la pregunta de por qué se les permite participar en un juicio por jurados. Quizás haya algo que decir acerca de la sabiduría colectiva que emerge cuando un grupo de personas debate un tema detenidamente en una mesa redonda. Con todo, esto todavía deja sin satisfacer el principio de independencia de los datos.
¿Deberían ser tratados todos los casos por dos jurados diferentes? ¿Por tres? ¿Por 12? Sería demasiado costoso, al menos si cada jurado estuviese compuesto por 12 miembros. Dos jurados de seis miembros o tres jurados de cuatro miembros, constituirían, probablemente, una mejora en relación con el sistema actual. Pero, ¿no hay ninguna forma de poner a prueba los méritos relativos de estas alternativas o de comparar los méritos del juicio por jurados en relación con el que depende de un único juez?
Sí, sí que la hay. La llamaré la Prueba de Concordancia de Dos Veredictos y está basada en el principio de que, si una decisión es válida, dos intentos independientes de llegar a ella deberían tener el mismo resultado. A los fines de la prueba, únicamente costearemos los gastos de tener dos jurados escuchando el mismo caso, a los que no se permitirá hablar con los miembros del otro jurado. Al final, encerraremos a los jurados en dos habitaciones separadas y veremos si llegan al mismo veredicto. Si no lo hacen, ninguno de los veredictos habrá sido probado más allá de toda duda razonable y esto, razonablemente, pondría en duda al propio sistema de jurados.
Para realizar la comprobación experimental del juicio por juez, necesitaremos que dos jueces con experiencia atiendan el mismo caso y les pediremos que lleguen a sus veredictos, separadamente, sin hablar entre sí. Cualquiera de ambos sistemas -el juicio por jurados o el juicio por juez- que obtenga el mayor número de concordancias en un número dado de juicios, será el mejor y, si su puntuación de concordancia es alto, podría dársele crédito con alguna confianza para su futura utilización.
¿Apostaría el lector a que dos jurados independientes llegarían al mismo veredicto en el caso de Louis Woodward? ¿Podría el lector imaginar incluso un único jurado distinto que llegase al mismo veredicto en el caso de O. J. Simpson? Dos jueces, por otra parte, me parece que obtendrían con bastante probabilidad una buena puntuación en la prueba de concordancia. Y si yo llegase a enfrentar cargos por un delito grave, he aquí cómo desearía que se me juzgase. Si fuese culpable, preferiría la bala perdida del juicio por jurados; mientras más ignorantes, prejuiciosos y caprichosos sus miembros, mejor. Pero si fuese inocente y no estuviese disponible el ideal de contar con múltiples personas que tomen sus decisiones en forma independiente, por favor, dadme un juez.


Richard Dawkins, publicado por primera vez en The Observer, el 16 de noviembre de 1997 y reproducido en El capellán del diablo (2005).

No hay comentarios: