martes, 12 de enero de 2010

C-El dilema del prisionero

Hoy, en la clase de Inteligencia Artificial hemos hablado sobre Teoria de Juegos, aunque no hemos jugado mucho la verdad. Tuve esta asignatura en 5º de la carrera, pero no recuerdo mucho de ella porque el profesor apenas venia a darnos clase. Se que aprendi muchas cosas porque era cuestion de aplicar la logica y aun hoy, 10 años despues, recordaba muchas de ellas.
Uno de los ejemplos que ha propuesto ha sido el dilema del prisionero. En la wiki podeis encontrar mucha informacion sobre el, pero me ha parecido interesante plantearlo por eso de estimular la curiosidad de la gente hacia el conocimiento y el razonamiento de problemas.
El problema planteado es el siguiente: Se detiene a dos ladrones pero no se sabe cual de ellos es el que ha robado la joya (esto es un adorno mio para justificar el cuento). Se les aisla para interrogarlos y se les propone por separado que si delatan a su compañero, seran perdonados, pero que al compañero se le condenara a 10 años. Si no quiere delatarlo, se le denunciara por complicidad en robo y solo le caera uno. Sin embargo, si los dos delatan a su compañero, se les denunciara por encubrimiento y se les pondra a cada uno 5 años.




1\2No delataDelata
No delata(-1,-1)(-10,0)
Delata(0,-10)(-5,-5)

¿Cual es la solucion y que deben elegir?
Desde el punto de primera vista, uno piensa en que la mejor opcion es que ambos no delaten y es cierto si tuvieran conexion entre ellos, pero estan aislados y no se considera un sistema cooperativo.
Examinado desde la teoria de juegos, cada jugador ha de elegir la mejor jugada pensando que el otro jugador va a elegir la mejor jugada. Por esto, resulta que la mejor jugada es que ambos delaten a su compañero. Esa opcion es lo que se llama situacion de equilibrio de Nash (si, ese loco de la pelicula "Una mente maravillosa").
Esa situacion no es optima, lo que se denomina Optimo de Pareto, que seria la opcion cooperativa de no delatar, pero es lo que tiene el poder cooperar o no.
Sobre esto hay mucha teoria, pero es algo que solo nos interesa a muy pocos. Gracias a ello se que invertir en juegos "no justos" como loterias y similares no es rentable.

Aprovecho esto tambien para retornar al problema de Monthy Hall.
Recordemos que hay 3 puertas y un concursante elige una. Una vez elegida, se le muestra una de las rechazadas. La discusion estaba en que si se le daba la opcion de cambiar, convenia mas cambiar o no. Yo decia hace 2 meses que no cambiara. Ahora digo si. Extendiendo el problema a mas puertas es mas facil de ver como indico Bernardo. Mi nuevo analisis es el siguiente:
El jugador elige una puerta con probabilidad de acierto 1/3. La probabilidad de no acierto es de 2/3. Lo que hacemos es considerar 2 grupos: La puerta elegida y el resto. En el resto, una vez que te abran una puerta, te queda un grupo que solo muestra una puerta (indiferentemente de las puertas que existan, al final solo te quedara una en el grupo de no elegidas). Considerando esto en que solo hay 2 opciones y que no se habla de puertas, sino de grupos, el primer grupo (puerta elegida) tiene probabilidad 1/3 y el segundo (2 puertas no elegidas de las que solo hay una tapada) tiene probabilidad 2/3. Entendiendolo asi os he de dar la razon y es el planteamiento que he realizado tras recordar lo de teoria de juegos. Como veis, tenia eso aun apuntado por ahi.

2 comentarios:

  1. Te lo dije: cambia de puerta!

    Las situaciones del dilema del prisionero son muy frecuentes en negociación. El problemas es saber identificar cuando te encuentras inmerso en una situación de ese tipo, y conocer la capacidad de tu contraparte para cooperar.

    Y, cambiando de tema ¿un 5.000 para el día 30 de enero?

    Saludos

    José Antonio Pendón

    ResponderEliminar
  2. ¿Ya lo han fijado para ese dia? Yo me apunto como todos los años.

    ResponderEliminar