1.
Introducción
2. ¿Qué es la teoría
de juegos?
4. Aplicaciones de la teoría de
juegos
5. La
economia
6. En la ciencia
politica
7. En la
biologia
8. En la filosofia
9. Propiedades para el conocimiento
común en juego
10. Conocimiento comun de las
reglas
11. Lo que saben y Lo que
creen
12. Comentarios
generales
13. Juegos de suma cero de dos
personas
14. Estrategias maximin y
minimax
15. Punto de silla de
montar
16. Estrategia
dominante
17. Estrategia mixta
18. Modelo de formacion de
colas
19. El modelo de cola de una sola
estacion
20. Nota sobre regla de
prioridad
21. Modelo de cola de una estacion
multiple
22. Simulacion Monte Carlo
23. Tamaño optimo de un equipo de
servicio
1. Introducción
En el presente trabajo de investigación se pretende realizar un
enfoque de la teoría
de juegos con el
fin de conocer a fondo cual es su ciencia, desde
su origen y que es exactamente, por otro lado, a través de
esta investigación deberemos conocer cuales son
las aplicaciones de la teoría
de juegos y sus
aplicaciones, es decir, en que áreas es aplicable la
teoría de juegos con ejemplos muy
prácticos.
La Teoría de Juegos se desarrollo con
el simple hecho de que un individuo se relacionen con otro u
otros. Hoy en día se enfrenta cotidianamente a esta
teoría, en cualquier momento, tenemos por ejemplo cuando
nos inscribimos en un nuevo semestre en la universidad,
cuando la directiva toma la decisión sobre el monto que se
va a cobrar, la directiva está realizando un juego con sus
clientes, en este
caso los alumnos. Para el hombre la
importancia que representa la Teoría de Juegos es
evidente, pues a diario se enfrenta a múltiples
situaciones que son juegos.
Actualmente la Teoría de Juegos se ocupa sobre
todo de que ocurre cuando los hombres se relacionan de forma
racional, es decir, cuando los individuos se interrelacionan
utilizando el raciocinio. Sin embargo, la Teoría de Juegos
tiene todas las respuestas a los todos problemas del
mundo.
2. ¿Qué es
la teoría de juegos?
Evidentemente definir la Teoría de Juegos es tan
absurda como su lógica,
pero la realidad es que la Teoría de Juegos consiste en
razonamientos circulares, los cuales no pueden ser evitados al
considerar cuestiones estratégicas. Por naturaleza, a los
humanos no se les da muy bien pensar sobre los problemas de
las relaciones estratégicas, pues generalmente la
solución es la lógica
a la inversa.
En la Teoría de Juegos la intuición no
educada no es muy fiable en situaciones estratégicas,
razón por la que se debe entrenar tomando en
consideración ejemplos instructivos, sin necesidad que los
mismos sean reales. Por lo contrario en muchas ocasiones
disfrutaremos de ventajas sustanciales estudiando juegos, si se
eligen cuidadosamente los mismos. En estos juegos-juegos, se
pueden desentender de todos los detalles.
Si en lugar de utilizar personajes ficticios utilizamos
personajes reales para los juegos si se observase qué tan
honesto es ese personaje, cómo manipularía la
información obtenida, etc. Para un
especialista en Teoría de Juegos el ser deshonesto, etc.,
sería un error comparable al de un matemático que
no respeta las leyes de la
aritmética porque no le gustan los resultados que
está obteniendo.
3. Origen de la teoría
de juegos
La Teoría de Juegos fue creada por Von Neumann y
Morgenstern en su libro
clásico The Theory of Games Behavior, publicado en 1944.
Otros habían anticipado algunas ideas.Los economistas
Cournot y Edgeworth fueron particularmente innovadores en el
siglo XIX. Otras contribuciones posteriores mencionadas fueron
hechas por los matemáticos Borel y Zermelo. El mismo Von
Neumann ya había puesto los fundamentos en el
artículo publicado en 1928. Sin embargo, no fue hasta que
apareció el libro de Von
Neumann y Morgenstern que el mundo comprendió cuán
potente era el instrumento descubierto para estudiar las relaciones
humanas.
Todavía encontramos profesores mayores que nos
explican que la Teoría de juegos o sirve para nada porque
la vida no es un "Juego de suma
cero", o porque se puede obtener el resultado que uno quiera
seleccionando el apropiado "concepto de
solución cooperativa".
Afortunadamente las cosas han evolucionado con mucha
rapidez en los últimos veinte años, y éste y
otros libros
modernos sobre teoría de juegos ya no padecen algunos de
los presupuestos
restrictivos que Von Neumann y Morgenstern consideraron
necesarios para progresar. Como resultado, lo que la
teoría de juegos prometía en un principio se
está empezando a cumplir. En los últimos
años, sus repercusiones en la teoría
económica sólo se pueden calificar de explosivas.
Todavía es necesario, sin embargo, saber algo de la corta
historia de
juegos, aunque sólo sea para entender por qué se
usan algunos términos.
Von Neumann y Morgenstern investigaron dos
planteamientos distintos de la Teoría de Juegos. El
primero de ellos el planteamiento estratégico o no
cooperativo. Este planteamiento requiere especificar
detalladamente lo que los jugadores pueden y no pueden hacer
durante el juego, y después buscar cada jugador una
estrategia
óptima. Lo que es mejor para un jugador depende de lo que
los otros jugadores piensan hacer, y esto a su vez depende de lo
que ellos piensan del primer jugador hará. Von Neumann y
Morgenstern resolvieron este problema en el caso particular de
juegos con dos jugadores cuyos intereses son diametralmente
opuestos. A estos juegos se les llama estrictamente competitivos,
o de suma cero, porque cualquier ganancia para un jugador siempre
se equilibra exactamente por una pérdida correspondiente
para el otro jugador. El ajedrez, el
backgammon y el póquer son juegos tratados
habitualmente como juegos de suma cero.
La segunda parte del libro de Von Neumann y Morgenstern
desarrollaron el planteamiento coalicional o cooperativo, en el
que buscaron describir la conducta
óptima en juegos con muchos jugadores. Puesto que
éste es un problema mucho más difícil, no es
de sorprender que sus resultados fueran mucho menos precisos que
los alcanzados para el caso de suma cero y dos jugadores. En
particular, Von Neumann y Morgenstern abandonaron todo intento de
especificar estrategias
óptimas para jugadores individuales. En lugar de ello se
propusieron clasificar los modelos de
formación de coaliciones que son consistentes con
conductas racionales. La negociación, en cuanto a tal, no jugaban
papel alguno
en esta teoría. De hecho, hicieron suyo el punto de vista,
que había predominado entre los economistas al menos desde
la época de Edgeworth, según el cual los problemas
de negociación entre dos personas son
inherentemente indeterminados.
A principio de los años cincuenta, en una serie
de artículos muy famosa el matemático John Nash
rompió dos de las barreras que Von Neumann y Morgenstern
se había auto-impuesto. En el
frente no cooperativo, estos parecen haber pensado que en
estrategias la
idea de equilibrio,
introducida por Cournot en 1832, no era en sí misma una
noción adecuada para construir sobre ella una
teoría –de aquí que se restringieran a juegos
de suma cero-. Sin embargo, la formulación general de Nash
de la idea de equilibrio
hizo ver claramente que una restricción así es
innecesaria. Hoy día, la noción de equilibrio de
Nash, la cual no es otra cosa que cuando la elección
estratégica de cada jugador es la respuesta óptima
a las elecciones estratégicas de los otros jugadores. A
Horace y Maurice les fueron aconsejados, por su consultor
especialista en teoría de juegos, que usaran un equilibrio
de Nash. Es tal vez, el más importante de los instrumentos
que los especialistas en teoría de juegos tienen a
disposición. Nash también hizo contribuciones al
planteamiento cooperativo de Von Neumann y Morgenstern. Nash no
aceptó la idea de que la teoría de juegos debe
considerar indeterminados problemas de negociación entre
dos personas y procedió a ofrecer argumentos para
determinarlos. Sus ideas sobre este tema fueron generalmente
incomprendidas y, tal vez como consecuencia de ello, los
años que la teoría de juegos paso en Babia se
gastaron principalmente desarrollando el planteamiento cooperativa de
Von Neumann y Morgenstern en direcciones que finalmente
resultaron improductivas.
La historia de la teoría
de juegos en los últimos veinte años está
demasiado repleta de incidentes para ser contada. Algunos
nombres, sin embargo, no deben ser pasados en silencio. El
acróstico NASH puede ayudar a quienes son. El propio Nash
tiene la letra N, A por Aumann, S es Shapley y también por
Selten y H es por Hansanyi.
Lo que es tal vez más importante sobre los
últimos veinte años de teoría de juegos es
que los mayores progresos se han dado en la teoría no
cooperativa.
Es difícil explicar hacia donde se dirige la
teoría de juegos a una audiencia que no sabe dónde
se encuentra. Estas observaciones, por tanto, son para quienes ya
saben algo de teoría de juegos.
Tengo opiniones muy decididas sobre la dirección que la teoría de juegos
debería tomar, y es reconfortante ver las cosas parece que
se mueven en la dirección correcta. Es justo, sin embargo,
que en algún momento ponga las cartas boca
arriba. Así pues tengo que decir que creo que la mayor
parte de la literatura sobre
"refinamientos del equilibrio de Nash" ha de ser catalogada junto
con las obras de la escolástica medieval. Para ser incluso
más polémico, quiero añadir que los intentos
por hacer del bayesianismo los fundamentos de la teoría de
juegos no deben ser comparados a la construcción de casas sobre arena, sino a
la construcción de castillos en el aire. Visto
retrospectivamente, nos parecerán realmente muy
extraños los intentos actuales de hacer de la
teoría bayesiana de la decisión algo más que
un instrumento analítico conveniente.
4. Aplicaciones de la
teoría de juegos
La Teoría de Juegos actualmente tiene muchas
aplicaciones, sin embargo, la economía es el
principal cliente para las
ideas producidas por los especialistas en Teoría de Juego.
Entre las disciplinas donde hay aplicación de la
Teoría de Juegos tenemos:
No debería sorprender que la Teoría de
Juegos haya encontrado aplicaciones directas en economía. Esta triste
ciencia se
supone que se ocupa de la distribución de recursos escasos.
Si los recursos son
escasos es porque hay más gente que los quiere de la que
puede llegar a tenerlos. Este panorama proporciona todos los
ingredientes necesarios para un juego. Además, los
economistas neoclásicos adoptaron el supuesto de que la
gente actuará racionalmente en este juego. En un sentido,
por tanto, la economía neoclásica no es sino una
rama de la Teoría de Juegos. Los economistas que no se dan
cuenta de ello son como el monsieur Jourdain de Le Bourgeois
Gentilhomme, de Moliere, que se sorprendió de saber que
había estado
hablando en prosa durante toda la vida sin saberlo. Sin embargo,
aunque los economistas pueden haber sido desde siempre
especialistas camuflados en Teoría de Juegos, no
podían progresar por el hecho de no tener acceso a los
instrumentos proporcionados por Von Neumann y Morgenstern. En
consecuencia sólo podían analizar juegos
particularmente simples. Esto explica por qué el monopolio y la
competencia
perfecta se entienden bien, mientras a todas las demás
variedades de competencia
imperfecta que se dan entre estos dos extremos sólo ahora
se les está empezando a dar el tratamiento detallado que
merecen.
La razón por la que el monopolio es
simple desde el punto de vista de la Teoría de Juegos es
que puede ser tratado como un juego con un único jugador.
La razón por que la competencia
perfecta es simple es que el número de jugadores es de
hecho infinito, de manera que cada agente individual no puede
tener un efecto sobre agregados de mercado si el o
ella actúa individualmente.
6. En la ciencia
politica
La Teoría de Juegos no ha tenido el mismo impacto
en la ciencia
política
que en economía. Tal vez esto se deba a que la gente
conduce menos racionalmente cuando lo que está en juego
son ideas que cuando lo que está en juego es su dinero. Sin
embargo, se ha convertido en un instrumento importante para
clarificar la lógica subyacente de un cierto número
de problemas más paradigmáticos.
Un ejemplo de Teoría de Juegos en la Ciencia
Política
es el siguiente:
La elección de programa: Hay dos
partidos, los Formalistas y los Idealistas. Ninguno de los dos se
preocupa en absoluto por cuestiones de principio. Sólo se
preocupan por el poder y, por
tanto, eligen el programa con el
programa con el único objetivo de
maximizar el voto en las próximas elecciones. Los
votantes, por otra parte, sólo se preocupan por cuestiones
de principio y, por ende carecen por completo de fidelidad a los
partidos. Para simplificar, las opiniones que un votante puede
tener se identifican con los números reales en el
intervalo (0. 1), en otras palabras, el conjunto de valores de x
que satisfacen 0 menor igual a x menor igual a 1. Podemos
imaginarnos que este intervalo representa el espectro
político de izquierda a derecha. Así, alguien con
la opinión x = 0, se cree que la sociedad
debería estar organizada como un hormiguero, mientras que
alguien en la opinión x = 1 cree que debería estar
organizada como una piscina llena de tiburones.
Cada partido centra su programa en algún punto
del espectro político y no puede cambiar su
posición posteriormente. Los votantes votan por el partido
que se encuentra más cerca de su posición. Dado que
se supone que los votantes se encuentran distribuidos
uniformemente sobre el espectro político, es decir, que
una fracción l de la población sostiene opiniones que se
encuentran en cualquier intervalo de longitud l, es
fácil ver cuántos votos conseguirá cada
partido una vez que han elegido programa. El secreto está
en buscar el votante mediano entre aquellos cuyas opiniones se
encuentran entre los programas de
ambos partidos. El votante mediano se encuentra a medio partido
entre las posiciones políticas
de los dos partidos. Luego los que se encuentran a la derecha del
mediano votante votarán por un partido, y los que se
encuentran a la izquierda lo harán por el otro.
Supongamos que los partidos bajan al ruedo
político uno a uno. Los Idealistas escogen en primer
lugar, y luego lo hacen los Formalistas. ¿Dónde
debería colocarse cada uno? Problemas como éste
puede ser resueltos por inducción hacia atrás. Para cada
programa posible x, los Idealistas se preguntan qué
ocurriría si se colocarán en x. Si x es menor a
½, los Formalistas responderían colocándose
inmediatamente a la derecha de x. Entonces los Idealistas
recogerían una fracción x de los votantes y los
Formalistas recogerían 1-x. Por tanto, los Idealistas
ganarían menos de la mitad del voto. Lo mismo ocurre si
los Idealistas se sitúan en x menor a ½, excepto
que ahora los Formalistas responderán colocándose
inmediatamente a su izquierda. Por tanto, lo mejor para los
Idealistas es colocarse en el centro del espectro
político. Los Formalistas también se
colocarán en x = ½, y el voto se dividirá
mitad y mitad.
Este modelo puede
tener sentido en la escena política americana. Ciertamente
es difícil para muchos europeos encontrar diferencias
significativas entre Demócratas y Republicanos. El
modelo, sin
embargo, tiene poco parecido con la escena política
europea. ¿Deberían los americanos deducir, por
tanto, que los partidos
políticos europeos de verdad se toman en serio los
principios que
hacen suyos? Una conclusión así seria prematura
porque es dudoso que la situación europea pueda ser
razonablemente analizada con un modelo de dos partidos, y esto es
cierto incluso para un país como Gran Bretaña en el
que sólo dos de los partidos consigue un número
importante de votos en la mayoría de elecciones. Para
explorar esta cuestión veamos como cambiarían las
cosas si tuviéramos que tomar en consideración un
tercer partido.
En este modelo el partido Institucionistas escoge
programa después de los Idealistas y Formalistas. Esto
cambia mucho las cosas. Los Idealistas y los Formalistas
ciertamente no se colocarán ahora en el centro del
espectro político. Si lo hicieran los Institucionistas se
podrían colocar inmediatamente a su derecha o a su
izquierda. Entonces recogerían la mitad del voto dejando
que los primeros partidos se dividan la otra mitad. Un
razonamiento por inducción hacia atrás, algunas
sutilezas surgen debido al hecho que disponemos de un
número infinito de opiniones políticas,
lo cual hace ver que los Idealistas y los Formalistas se
colocarán en x = ¼ y x = ¾, dejando que los
Institucionalistas adopten la posición centrista x =
½, como se muestra en la
Figura anterior parte (b). Los primeros partidos recibirán
entonces 3/8 de los votos cada uno, y los Institucionalistas
sólo recogerán ¼.
Pero ¿Por qué querrían los
Institucionalistas entrar en la arena política está
condenados al papel de
Cenicienta, con los primeros partidos en el papel de Hermanas
Feas?. Modifiquemos, por tanto, el modelo de manera que los
instuticionistas consideren que vale la pena formar un partido
sólo si pueden prever que recibirán más del
26% de los votos. En este caso los Idealistas se moverán
un poco hacia el centro, aunque no lo bastante como para que los
Institucionalistas puedan entrar flanqueándolos por la
izquierda. Por tanto, sólo se moverán desde x =
0,25 a x = 0,26. Análogamente, los Formalistas se
moverán desde x = 0.75 a x = 0.74. El resultado
será una elección con dos partidos como lo muestra la parte
(c) de la Figura anterior. En esta elección los Idealistas
y los Formalistas se dividen el voto a partes iguales y los
Institucionalistas se quedan fuera.
Un comentarista político ignorante de la amenaza
supone la entrada de los Institucionalistas podría
fácilmente malinterpretar las razones por las que los
Idealistas y los Formalistas han elegido sus programas. El
comentarista podría incluso llegar a pensar que cada
partido ni siquiera intenta hacerse con el centro por cuestiones
de principio. Pero es sólo tras un análisis estratégico que la conducta de los
dos partidos puede ser evaluada correctamente. Obsérvese,
en particular, que su conducta ha sido determinada por algo que
de hecho no llegó a ocurrir. Como Sherlock Holmes
explicaba, a menudo lo importante es que el perro no ladró
aquella noche.
Es imposible igualar el entusiasmo con que los
biólogos evolucionistas que usan la teoría de
juegos explican de conducta animal. No sé si escogen
historias poco delicadas deliberadamente, para dar un poco de
sabor a sus relatos con implicaciones sexuales, o si éstos
son realmente los mejores ejemplos para ilustrar de qué
manera la teoría de juegos es relevante. En cualquier
caso, lo que los biólogos dicen sobre el pez sol es
esto.
Hay dos clases de machos en esta especie. El primero es
un individuo regularmente hogareño que necesita siete
años para alcanzar la madurez. Una vez alcanzada,
construye un nido que atrae a las hembras que ponen que ponen
huevos. Cuando los huevos han sido puestos, no sólo los
fertiliza, sino que defiende la familia
resultante lo mejor que puede mientras, la hembra continua su
vida independientemente. La otra clase de macho es un golfo. Por
lo que dicen los biólogos, es poco más que un
órgano sexual autopropulsado. Este posee ventaja sobre los
machos normales, que consiste en alcanzar la madurez en
sólo dos años. Sin embargo, es incapaz de
responsabilizarse por su familia. En lugar
de ello, espera escondido hasta que una hembra ha puesto sus
huevos respondiendo a las señales de un macho normal tenga
la oportunidad de hacerlo. Si el golfo tiene éxito, el
macho normal defiende una familia que no
está relacionada con él en absoluto y que lleva por
el contrario los genes del golfo.
La teoría de juegos sirve para explicar por que
las dos clases de machos pueden coexistir en proporciones
fijas.
Para que una historia de teoría de juegos se aguante en
este contexto, necesitamos una explicación de cómo
los genes se distribuyeron exactamente en la forma necesaria para
asegurar a cada pez optimizaría, dada la mezcla actual en
la población de hogareños golfos. No
basta con decir que la Naturaleza, "con
las garras y las fauces llenas de sangre",
actuará de forma que sólo quienes se adaptan
sobreviven. Esta respuesta rehuye el problema de cómo y
por qué resulta que a veces adaptarse implica actuar
racionalmente. Esta parece ser una de esas grandes cuestiones que
no tienen respuestas fáciles.
Los especialistas en Teoría de Juegos creen que
pueden demostrar formalmente por qué incluso el individuo
más egoísta puede descubrir que con frecuencia,
cooperar con sus vecinos en una relación a largo plazo
redundará en su propio interés
ilustrado. Con este fin estudian los equilibrios de juegos con
repetición –juegos que los mismos jugadores juegan
una y otra vez-. Pocas cosas han descubierto en esta área
hasta el presente que hubieran sorprendido a David Hume, quien
hace ya unos doscientos años articuló los
mecanismos esenciales. Estas ideas, sin embargo, están
ahora firmemente basadas en modelos
formales. Para avanzar más, habrá que esperar
progresos en el problema de la selección de equilibrios en
juegos con múltiples equilibrios. Cuando estos progresos
se den, sospecho que la filosofía social sin teoría
de juegos será algo inconcebible – y que David Hume
será universalmente considerado como su verdadero
fundador.
9. Propiedades para
el
conocimiento común en juego
El Filósofo Hobbes dijo
que un hombre se
caracteriza por su fortaleza física, sus pasiones,
su experiencia y su razón.
Fortaleza Física: esta
determina lo que alguien puede o no puede hacer. Un atleta puede
planear correr una milla en cuatro minutos, pero sería
imposible para la mayoría ejecutar este plan. La
teoría de juegos incorpora estas consideraciones en las
reglas del juego. Esta determinan lo que es factible para un
jugador. Más exactamente, un jugador queda limitado a
escoger en el conjunto de sus estrategias en el juego.
Pasión y Experiencia: estas corresponden a las
preferencias y creencias de un jugador. En la mayoría de
los casos, ambas deben ser conocimiento
común para que sea posible realizar un análisis en términos de la
teoría de juegos.
Razón: en problemas de decisión unipersonales, los
economistas simplemente suponen que los jugadores maximizan sus
pagos esperados dadas sus creencias. En un juego las cosas son
más complicadas, porque la idea de equilibrio da por
supuesto que los jugadores saben algo acerca de cómo
razona todo el mundo.
10. Conocimiento
comun de las reglas
Como en muchos resultados de la teoría de juegos,
no es inmediatamente evidente que esta conclusión dependa
de que el valor de n
debe ser conocimiento común. Sin embargo, si el valor n no es
de conocimiento común existe equilibrio de
Nash.
La noción de equilibrio es fundamental para la
Teoría de Juegos. Pero por qué anticipamos que los
jugadores usarán estrategias de equilibrio.
Dos tipos de respuestas hay, en primer lugar del tipo
educativo, estos suponen que los jugadores tengan al equilibrio
como el resultado de razonar cuidadosamente. No se acepte ante
frases que empiezan, "si yo pienso que él piensa que yo
pienso …", por lo contrario, los jugadores proseguirían
con razonamiento así hasta el final, por difícil
que fuera.
Sin embargo, la respuesta eductiva no es la única
posible. También hay respuestas evolutivas. Según
éstas, el equilibrio se consigue, no porque los jugadores
piensan todo de antemano, sino como consecuencia de que los
jugadores miopes ajustan su conducta por tanteo cuando juegan y
se repiten durante largos períodos de tiempo.
Racionalizabilidad: es la forma que se comporta alguien
bayesiano-racional cuando ha de tomar una decisión en
situaciones donde el resultado de la decisión a tomar
depende de sucesos inciertos para quien ha de tomarla. El o ella
actúa como si dispusiera de una medida de probabilidad
subjetivas a los sucesos de los que no está seguro.
En un juego finito de dos jugadores, ningún
jugador sabe con seguridad que
estrategia pura,
incluso si el oponente mezcla, el resultado final será que
se juega alguna estrategia pura, la cual terminará por
utilizar el oponente. Un jugador bayesiano-racional, por tanto,
asigna una probabilidad
subjetiva a cada una de las alternativas posibles. Entonces el
jugador escoge una estrategia que maximiza su pago esperado con
respecto a estas probabilidades subjetivas. Por tanto, el o ella
se comportan como si estuviera escogiendo una respuesta
óptima a una de las estrategias mixtas del oponente, si la
estrategia mixta para la que se elige una respuesta
óptima.
La Teoría de Juegos da por supuesto que las
creencias de un jugador sobre lo que un oponente hará
depende de lo que el jugador sabe acerca del oponente. Sin
embargo, no está ni mucho menos claro lo que debemos
suponer acerca de lo que los jugadores saben de su oponente. La
idea de racionalizabilidad se construye sobre la hipótesis de que por l menos debería
ser conocimiento común que ambos jugadores son
bayesianos-racionales.
Equilibrio Correlacionado: Aumann sugiere que
deberíamos asumir que es "conocimiento común" que
los jugadores comparten el mismo universo del
discurso.
Sugiere, además que los estados de este universo
W se deben suponer
completos. Estos significa que si usted alguna vez llega a saber
que ha ocurrido con seguridad,
entonces usted absolutamente todo lo que concebiblemente pudiera
ser relevante para usted a la hora de tomar una decisión.
La descripción de un estado, por
tanto, debe especificar cada detalle del "mundo posible" que
representa. Esto incluye no sólo como se comportan los
jugadores, sino también cuáles son sus estados
mentales. Ya que los jugadores son bayesianos-racionales, sus
estados mentales se pueden resumir en dos cosas:
11. Lo que saben y Lo que
creen
Bayesianismo: el Bayesianismo no requiere habilidades
mentales excepcionales por parte de los jugadores. Estos revisan
mecánicamente sus probabilidades subjetivas a medida que
disponen de nueva información, y entonces deciden qué
hacer por el método
igualmente mecánico de maximizar su pago esperado dadas
las creencias actuales.
Los bayesianos ingenuos piensan que no es necesario
preguntarse de dónde salen las probabilidades a priori de
los jugadores, o cómo saben estos cuáles son sus
particiones de posibilidades, en particular, creen que la
racionalidad bayesiana dota a quienes la hacen suya con la
capacidad de coger del aire sus
creencias subjetivas. Esta actitud lleva
a bayesianos que son muy ingenuos a argumentar que la
teoría de juegos es una pérdida de tiempo. Es
indudablemente cierto que si no necesitáramos preocuparnos
de por qué la gente cree en lo que cree, entonces las
consideraciones sobre equilibrios se harían
irrelevantes.
Durante las dos décadas que
siguieron a la segunda guerra
mundial, uno de los progresos más interesantes de la
teoría económica fue la teoría de los juegos
y el comportamiento
económico, publicada en un libro de este titulo bajo la
autoridad
conjunta de Jhon Von Neumann y Oskar Morgenstern. Actualmente, el
consenso parece ser que la teoría de los juegos es
más relevante al estudio de problemas comerciales
específicos que a la teoría económica
general, por que representa un enfoque único al
análisis de las decisiones comerciales en condiciones de
intereses competitivos y conflictivos.
El principal objetivo de la
teoría de los juegos es determinar los papeles de conducta
racional en situaciones de "juego" en las que los resultados son
condicionales a las acciones de
jugadores interdependientes. Un juego es cualquier
situación en la cual compiten dos o más jugadores.
El ajedrez y el
póker son buenos ejemplos, pero también lo son el
duopolio y el oligopolio en
los negocios. La
extensión con que un jugador alcanza sus objetivos en
un juego depende del azar, de sus recursos físicos y
mentales y de los de sus rivales, de las reglas del juego y de
los cursos de
acciones que
siguen los jugadores individuales, es decir, sus estrategias. Una
estrategia es una especificación de la acción que
ha de emprender un jugador en cada contingencia posible del
juego.
Se supone que, en un juego, todos los jugadores son
racionales, inteligentes y están bien informados. En
particular, se supone que cada jugador conoce todo el conjunto de
estrategias existentes, no solo para él, sino
también para sus rivales, y que cada jugador conoce los
resultados de todas las combinaciones posibles de las
estrategias.
Igualmente, en una gran variedad de juegos, el resultado
es una variable aleatoria cuya distribución de probabilidades debe ser
establecida para que pueda ser posible una solución para
el juego. A este respecto, debe observarse que las decisiones de
los jugadores interdependientes no se toman en un vacío y
que los pagos resultantes de estas decisiones dependen de las
acciones emprendidas por todos los jugadores. Esta
interdependencia implica que puede ser inapropiado suponer que
los pagos están siendo generados por un proceso
probabilista invariante que no es afectado por el curso de
acción que uno escoja. En otras palabras, la acción
que emprende un jugador puede dictar los actos de otros jugadores
o influir en la probabilidad de que se comporten en una forma
particular. Esta potencialidad de posibles efectos en los
resultados es la que distingue la toma de
decisiones en conflictos y
la toma de
decisiones en un medio incierto.
La clase más sencilla de modelo de juego
rigurosamente adversario, en el que los resultados posibles son
calificados en orden opuesto por los jugadores. Entre esta clase,
él más común es el juego de suma constante,
en el que la suma de las ganancias de los jugadores es igual,
cualesquiera que sea su distribución entre ellos. Un caso
especial, y el único que consideraremos, de juegos de suma
constante se llama juego de suma cero de dos personas.
13. Juegos de suma cero
de dos personas
Dos compañías de autobuses, A y B,
explotan la misma ruta entre dos ciudades y están
enzarzadas en una lucha por una mayor parte del mercado. Puesto
que la parte total del mercado es un 100 por 100 fijo, cada punto
porcentual ganado por uno debe ser perdido por el otro. Se dice
que tal situación es un juego de suma cero de dos personas
por las razones obvias de que el juego es jugado por dos
jugadores diametralmente opuesto y que la suma de las ganancias y
perdidas es siempre cero.
Si se supone que la compañía A y la
compañía B esta considerando las
tres mismas estrategias para ganar una mayor parte
relativa del mercado como sigue:
- a1 o b1: Sirve refrescos
durante el viaje. - a2 o b2: Introduce autobuses
con aire
acondicionado. - a3 o b3: Anuncia diariamente en
estaciones de televisión en las dos
ciudades.
Por comodidad, se supone que ante de comenzar el juego
ambas compañías no están asiendo
ningún esfuerzo especial y comparte por igual el mercado
–50 por 100 cada una. Además, si se supone
también que cada compañía no puede emplear
mas de uno de estas actitudes o
estrategias al mismo tiempo y que las tres estrategias tienen
idénticos costos.
Por estos supuestos, hay un total de 3 x 3 = 9
combinaciones posibles de movimientos, y cada una es capas de
afectar a la parte del mercado en una forma especifica. Por
ejemplo, si A y B sirvan refrescos durante el viaje, se dice que
A perdería 10 por 100 de la parte del mercado a favor de
B, lo que puede indicar que los refrescos de B son mas para los
gustos de los clientes,
igualmente, si A anuncio y B, por ejemplo, sirve refrescos, se
supone que A ganaría 20 por 100 del mercado en perjuicio
de B; evidentemente, la publicidad en
televisión
parece ser más eficaz que servir refrescos.
Ahora, por cada una de las 9 combinaciones puede
determinar ganancias o perdidas del mercado para A como se indica
en la siguiente matriz de
pagos.
| b1 | b2 | b3 |
a1 | -10 | -11 | -1 |
a2 | 9 | -8 | -6 |
a3 | 20 | -10 | -13 |
14.
Estrategias maximin y minimax
El enfoque conservador a la lección de la mejor
estrategia es suponer lo peor y actuar de conformidad con ello.
Así según este enfoque y con referencia en la
matriz de
pagos. Si A decide sobre la estrategia a1,
supondría que B escogerá la estrategia
b2, reduciendo con ello el pago a1 para A
aun valor mínimo o de seguridad de –11.
Análogamente, los valores de
seguridad para a2 y a3 son –8 y
–3, respectivamente.
Obsérvese que los valores de
seguridad para los distintos movimientos que puede hacer A son
los mínimos de filas. Dados estos valores
mínimos, hará bien en emplear aquella estrategia
que da el máximo de estos valores de seguridad
mínimos. En el ejemplo A debe adoptar a2 y
aspira a un pago de –8 a B. Esta regla de decisión,
que conduce a la elección del mayor de los valores
mínimos en que puede resultan cada estrategia, se llama
estrategia maximin.
La compañía B, según esta actitud
conservadora, supondría que por cada una de sus acciones,
la respuesta de A será tal que la ganancia de A en parte
del mercado es la máxima posible. Por ejemplo, si B emplea
la estrategia b1, supondría que A adoptara la
estrategia a3, la cual dará la peor perdida
posible para B. Análogamente, los peores pagos para
b2 y b3 son –8 y –1, los
máximos valores en las columnas 2 y 3,respectivamente.Asi,
vemos que el máximo en cada columna es el peor pago por un
movimiento
correspondiente hecho por B. El mejor de estos peores pagos es
claramente el valor mínimo de estas cifras mas altas. Esta
cifra –8 en la columna 2, correspondiente a la estrategia
b2 y el movimiento
contrario a2. Por tanto, la emisión optima,
llamada estrategia minimax de B, es b2.
Se puede observar según la regla maximin de A y
la regla minimax de B el pago es –8. Esta cantidad se llama
valor del juego es positivo, se dice que el juego es a favor de
A: si negativo, favorece a B; y si cero, se dice que el juego es
equitativo. La solución de nuestro problema da un pago de
–8, que indica que el juego favorece a B por que B gana 8
por 100 del mercado a expensas de A.
Se ha alcanzado ahora un punto en el que si A adopta
estrategia maximin a2 su pago es exactamente igual al
que B espera que obtenga A sí B emplea la estrategia
minimax b2. Un lector puede poner en duda el acierto
de tales reglas de decisión. Por ejemplo, ¿ por
qué A no se esfuerza por ganar 20 por 100 de la parte del
mercado empleando a3, en vez de perder 8 por 100 a
favor de B empleando a2?. La respuesta es que, si A lo
hiciera así B podría tomar b2 por lo que
A podría perder 10 a 13 por 100 del mercado a favor de B,
en vez de perder solo 8 por 100. Similarmente, puede arguirse que
B debe adoptar b2 por lo que A podría perder 10
o 13 por 100 del mercado a favor de B, en pensas de A. Sin
embargo, este pago solo es posible sí A hace el movimiento
de a3.
En otro caso, la ganancia de B seria menor de 8.
Argumentos similares usados en la "cautela" dictan que
a2 y b2 son las mejores estrategias para A
en B respectivamente, por que esta combinación ofrece a A
y B una medida de seguridad. Esto es así por que el
criterio de decisión maximin de A da a A la
"máxima" parte del mercado que puede impedirse a B que
reduzca más, y que la regla minimax de B ofrece B la
"mínima" parte del mercado que puede impedirse a A que
aumente más.
En otras palabras las estrategias maximin y minimax
conducen a los dos jugadores del juego a situaciones en las que
ningún jugador tiene razón o incentivo alguno para
cambiar su posición. A no desea cambiar por que cuando B
juega b2, el se encuentra mejor jugando a2
que a1 o a3. B no desea cambiar por que
cuando A juega a2 se encuentra mejor jugando
b2 que b1 o b3. Evidentemente,
se ha alcanzado una situación de equilibrio.
El pago en tal punto de
equilibrio es la solución minimax y se conoce como
punto de silla de montar de la matriz de pagos en el sentido de
que es el mínimo de sus datos de columna.
Considerémosla solución del par de decisiones en
nuestro ejemplo a2 y b2. Cuando A adopte
a2 el pago se reduce de 9 a –8 y luego aumenta
de –8 a -6. Cuando B escoge b2, su pago
disminuye de –11 a –8 y luego aumenta de –8 a
–10. El numero –8 en medio forma un valle cuando es
visto desde la segunda fila forma una cordillera cuando es visto
desde la segunda columna. La solución minimax semeja
exactamente una silla de montar: de ahí el nombre de
"punto en silla de montar", que es a la vez un mínimo,
como un valle máximo, como una cordillera.
Es posible que pueda haber mas de un punto en silla de
montar en la matriz de pagos de un juego. Si es así, los
pagos correspondientes a los puntos en silla de montar es
empleado para determinar movimientos óptimos para los dos
jugadores se puede considerar el siguiente juego, por
ejemplo:
Estrategia de B
| b1 | b2 | B3 | Mínimo de fila |
a1 | 2 | -3 | 7 | -3 |
a2 | 5 | 5 | 6 | 5º |
a3 | 1 | 4 | -4 | -4 |
Máximo de columna | 5º | 5º | 7 |
Aquí se tienen dos puntos en silla de montar; uno
corresponde a a2 y b1, y el otro
corresponde a a2 y b2. Según el
criterio minimax, el jugador A haría el movimiento
a2. Al hacerlo, no importa si el jugador B emplea la
estrategia b1 o b2, por que en cada caso B
debe pagar a A una cantidad de, por ejemplo, 5
útiles.
También, puesto que el valor del juego en este
ejemplo es positivo, se dice que el juego favorece A.
Se dice que un juego de suma cero de dos personas es
rigurosamente determinado si existe un punto en silla de montar,
por que ese punto en es una solución aceptada al juego de
encontrar la mejor estrategia para cada uno de los dos
jugadores.
Se dice que un jugador posee una estrategia dominante si
una estrategia particular es preferida a cualquier otra
estrategia a disposición de el. Es posible que cada uno de
los dos jugadores tenga estrategia dominante.
Es una combinación de dos estrategias escogidas a
azar, una cada vez, según determinadas probabilidades, en
contraste con una estrategia pura que no contiene tales elementos
de azar.
18. Modelo de formacion de colas
Modelos de formacion de colas basicos
El esfuerzo de A.K. Erlang por analizar la
congestión de tráfico telefónico, con objeto
de satisfacer la demanda de
servicios
surgida al azar del sistema
telefónico automático de Copenhague en 1909,produjo
una nueva teoría que ha llegado a conocerse como
teoría de formación de cola o línea de
espera. Esta teoría es uno de los instrumentos más
valiosos de la ciencia de administración de empresas, por que muchos
problemas de la gerencia
pueden caracterizarse como problemas de "llegada y
partida"
En los problemas de formación de cola, a menudo
se habla de clientes, tales como personas que esperan la
desocupación de líneas telefónicas, la
espera de máquinas para ser reparadas y los aviones que
esperan aterrizar y estaciones de servicios,
tales como mesas en un restaurante, operarios en un taller de
reparación, pistas en un aeropuerto, etc. Los problemas de
formación de colas a menudo contienen una velocidad
variable de llegada de clientes que requieren cierto tipo de
servicio, y
una velocidad
variable de prestación del servicio en la
estación de servicio.
Cuando se habla de líneas de espera, se refieren
a las creadas por clientes o por las estaciones de servicio. Los
clientes pueden esperar en cola simplemente por que los medios
existentes son inadecuados para satisfacer la demanda de
servicio; en este caso, la cola tiende a ser explosiva, es decir,
a ser cada vez mas larga a medida que transcurre el tiempo. Las
estaciones de servicio pueden estar esperando por que los
medios
existentes son excesivos en relación con la demanda de los
clientes; en este caso, las estaciones de servicio podrían
permanecer ociosas la mayor parte del tiempo. Los clientes puede
que esperen temporalmente, aunque las instalaciones de servicio
sean adecuadas, por que los clientes llegados anteriormente
están siendo atendidos. Las estaciones de servicio pueden
encontrar temporal cuando, aunque las instalaciones sean
adecuadas a largo plazo, haya una escasez ocasional de demanda
debido a un hacho temporal. Estos dos últimos casos
tipifican una situación equilibrada que tiende
constantemente hacia el equilibrio, o una situación
estable.
En la teoría de la formación de colas
generalmente se llama sistema a un
grupo de
unidades físicas, integradas de tal modo que pueden operar
al unísono con una serie de operaciones
organizadas. La teoría de la formación de colas
busca una solución al problema de la espera prediciendo
primero el comportamiento
del sistema. Pero una solución al problema de la espera
consiste en no solo en minimizar el tiempo que los clientes pasan
en el sistema, sino también en minimizar los costos totales de
aquellos que solicitan el servicio y de quienes lo
prestan.
19. El modelo de cola de una sola
estacion
Analíticamente, este modelo se construye con el
siguiente conjunto de supuestos:
- LLEGADA DE CLIENTE O
INSUMO: Se supone que las llegadas se producen al azar y
que la probabilidad de una llegada durante cualquier intervalo
de tiempo de longitud fija permanece constante,
independientemente de lo que ha sucedido anteriormente y de la
longitud de la cola. En otras palabras se supone que las
llegadas obedecen la ley de
probabilidades de Poisson con una frecuencia media de llegadas,
o promedio de llegadas, l , por unidad de tiempo.
Aquí,l
es igual para cualquier unidad de tiempo. Si se define de
nuevo la unidad de tiempo, como en un cambio de un
segundo a un minuto, por supuesto,l cambia su valor numérico
apropiadamente. Su reciproca, 1/l es el promedio de unidades de tiempo
entre dos llegadas sucesivas. Por esta hipótesis, la
probabilidad de exactamente n en una unidad de tiempo se da
por: Pn =l
n e-l / n! - DISCIPLINA DE COLA O REGLA DE PRIORIDAD:
Cuando un cliente llega al sistema, generalmente ha de esperar
antes de que se le preste servicio. Su partida es influida,
entre otras cosas, por la disciplina
de cola, la regla establecida por la cual los clientes que
esperan en la cola son servidos. Si se supone vigente la regla
acreditada por el tiempo de el primero que llega, el primero en
ser servido. Nuestra regla también abarca el requisito
de que ningún cliente del sistema partirá sin
recibir servicio. - PRODUCCION: Este criterio se refiere al numero
de estaciones de servicio y la distribución del tiempo
de servicio. - FRECUENCIA DE SERVICIO: Se supone
también que él número de clientes servidos
por la única estación sigue la Ley de Poisson
con el promedio de frecuencias de servicio representado
como m .Por
tanto: Pn = m n
e-m
/ n! , es la probabilidad de n servicios por una
unidad de tiempo. Se observa que 1/m es el tiempo medio de servicios de la
variable aleatoria exponencial "tiempo de servicio.
Cuando se satisfacen estos supuestos, se tiene un
modelo matemático para problemas de formación de
colas de una sola estación, el primero en llegar, el
primero en ser servido.
20. Nota sobre regla de
prioridad
Esta regla es muy apropiada si la " injusticia"
será resentida, o si los clientes son de igual importancia
y requieren en promedio la misma cantidad de servicio. Pero en
muchas situaciones puede haber fuertes razones para la practica
de reglas de prioridad. Por esta regla de prioridades tenemos, en
realidad, dos colas: una para los clientes rápidos y otra
para los lentos.
La reducción relativa del tiempo de espera medio
por nuestra nueva disciplina de
cola depende de tres factores:
- El parámetro de
utilización. - La razón del tiempo de servicio medio de los
clientes rápidos a la de los clientes lentos. Sea
s1 el tiempo medio de servicio para clientes
rápidos y s2 para clientes lentos; entonces,
podemos designar esta razón por R=
s1/s2 que obviamente varia de 0
a1. - La fracción F del numero total de clientes
rápidos, f, al número total de clientes, n; es
decir, F= f /n. Nuevamente F varía de 0 a 1.
21. Modelo de cola de una
estacion multiple
Existe un modelo de cola de estación de servicio
múltiple cuando los clientes de una sola cola pueden ser
servidos por mas de una estación de servicio igualmente
bien. Aquí, todas las k, k >= 2, estaciones de servicio
tienen idéntica capacidad de servicio, y la cola es
única en el sentido de que una línea de espera
alimenta a todas las estaciones como en los sistemas de "
tome un numero" de las tiendas al por menor.
La simulación
Monte Carlo es la amiga de los matemáticos no refinados.
Para comprenderla y usarla, se necesita poca capacitación matemática. Puede ser adaptada
fácilmente a cualquier situación, con tal que las
alternativas puedan ser especificadas cuantitativamente y que los
datos
requeridos puedan ser calculados con aceptable
confianza.
Monte Carlo es un proceso de
resolver un problema simulando datos originales con generadores
de números al azar. Su aplicación sólo
requiere dos cosas básicas:
- Se debe tener un modelo que represente una imagen de
realidad tal como lo vemos. El modelo en este caso no es mas
que la distribución por probabilidades de la variable
que se considera. El mérito importante de la simulación es que puede ser aplicada
aunque las distribuciones de probabilidades no puedan ser
expresadas explícitamente en cualquiera de las formas
teóricas, tales como aquellas que han sido presentadas
en este texto. Todo
lo que se requiere es una tabla o un gráfico de una
distribución de una variable directa o, indirectamente,
por el uso de registros
pasados. - Es un mecanismo para simular el modelo. El mecanismo
pudo ser cualquier generador de números al azar, tal
como un par de dados, un puntero giratorio, una rueda de
ruleta, una tabla de dígitos al azar o una computadora
de alta velocidad apropiadamente instruida. - El método
Monte Carlo es para simular, mediante procedimientos
al azar, situaciones del mundo real de naturaleza
probabílistica.
23. Tamaño optimo de
un equipo de servicio
El tamaño optimo de un equipo de servicio se
considera un segundo ejemplo de simulación Monte Carlo.
Una nueva empresa
industrial que ha estado en el negocio por espacio de 3000 horas
de operación, tiene en uso un gran numero de
máquinas idénticas. Tiene una sola estación
de servicio con un equipo de operarios, La reparación de
cualquier maquina es un esfuerzo conjunto del equipo. Cuando la
estación de servicio es ocupada por una maquina y ocurren
otras descomposturas, se crea una línea de espera. Se han
registrado cuidadosamente durante las 3000 horas pasadas datos
sobre él numero de computadoras
por hora y él número de reparaciones que requieren
varios periodos de tiempo para prestarles servicio. Las
probabilidades de estos dos conjuntos de
hechos basados en datos del pasado se indican en los cuadros 1 y
2,respectivamente.
Descomposturas por | Probabilidad | Probabilidad Acumulativa | Intervalo de números al |
0 | 0.900 | 0.900 | 000-899 |
1 | 0.090 | 0.990 | 900-989 |
2 | 0.008 | 0.998 | 990-997 |
3 | 0.002 | 1.000 | 998-999 |
cuadro 1,datos sobre
descomposturas
HORAS DE | PROBABILIDAD | PROBABILIDAD | INTERVALO DE NUMEROS AL AZAR DE |
1 | 0.251 | 0.251 | 000-250 |
2 | 0.375 | 0.626 | 251-625 |
3 | 0.213 | 0.839 | 626-838 |
4 | 0.124 | 0.963 | 839-962 |
5 | 0.037 | 1.000 | 963-999 |
cuadro 2, datos sobre tiempo requerido
para reparacion
Se considera que los dos conjuntos de
hechos son estadísticamente independientes. Una prueba Chi
Cuadrado sobre las frecuencias absolutas conjuntas
mostraría si la independencia
estadística es razonable.
Lo primero que debemos hacer es asignar intervalos de
números al azar a descomposturas de maquinas por hora
y a números de horas requeridos para reparar las
máquinas. Estos intervalos se dan en las ultimas columnas
de los cuadros 1 y 2. Obsérvese que en ambos casos los
intervalos de números al azar asignados n
proporcionales a las probabilidades de ocurrencia de los hechos
respectivos.
- La Teoría de Juegos consiste en razonamientos
circulares, los cuales no pueden ser evitados al considerar
cuestiones estratégicas. La intuición no educada
no es muy fiable en situaciones estratégicas,
razón por la que se debe entrenar. - La Teoría de Juegos fue creada por Von Neumann
y Morgenstern en 1944. Otros habían anticipado algunas
ideas. Los economistas Cournot y Edgeworth fueron
particularmente innovadores en el siglo XIX. Otras
contribuciones posteriores mencionadas fueron hechas por los
matemáticos Borel y Zermelo. - A principio de los años cincuenta, en una
serie de artículos muy famosa el matemático John
Nash rompió dos de las barreras que Von Neumann y
Morgenstern se habían auto-impuesto. - La Teoría de Juegos actualmente tiene muchas
aplicaciones, entre las disciplinas tenemos: la
Economía, la Ciencia Política, la Biología y la
Filosofía. - Según el Filósofo Hobbes un
hombre se
caracteriza por su fortaleza física, sus pasiones, su
experiencia y su razón. - Hay dos tipos de respuesta, la del tipo educativo,
los jugadores suponen que tienen al equilibrio como el
resultado de razonar cuidadosamente y un segundo tipo de
respuestas, las evolutivas, según éstas, el
equilibrio se consigue, no porque los jugadores piensan todo de
antemano, sino como consecuencia de que los jugadores miopes
ajustan su conducta por tanteo cuando juegan y se repiten
durante largos períodos de tiempo. - Racionabilidad: es la forma que se comporta alguien
bayesiano-racional cuando ha de tomar una decisión en
situaciones donde el resultado de la decisión a tomar
depende de sucesos inciertos para quien ha de
tomarla. - Los jugadores son bayesianos-racionales, sus estados
mentales se pueden resumir en dos cosas: lo que saben y lo que
creen. - Las estrategias maximin y minimax conducen a los dos
jugadores del juego a situaciones en las que ningún
jugador tiene razón o incentivo alguno para cambiar su
posición. - Se dice que un jugador posee una estrategia dominante
si una estrategia particular es preferida a cualquier otra
estrategia a disposición de él. - Estrategia mixta es una combinación de dos
estrategias escogidas a azar, una cada vez, según
determinadas probabilidades, en contraste con una estrategia
pura que no contiene tales elementos de azar.
Autor:
Costales Felipe
Republica Bolivariana de Venezuela
i.u.p. santiago mariño
San Cristóbal, Junio de 200
felcos[arroba]cantv.net