En la teoría de juegos, un juego estocástico, introducido por Lloyd Shapley a principios de 1950, es un juego dinámico con transiciones probabilísticas jugado por uno o más jugadores.
El juego se desarrolla en una secuencia de etapas.
Al comienzo de cada etapa del juego se está en algún estado.
Los jugadores eligen acciones y cada jugador recibe un pago que depende del estado actual y las acciones elegidas.
El juego se mueve a un nuevo estado aleatoriamente cuya distribución depende del estado previo y las acciones elegidas por los jugadores.
El procedimiento se repite en el nuevo estado y el juego continúa por un número finito o infinito de etapas.
El pago total a un jugador se toma a menudo como la suma descontada de los pagos etapa por etapa o el límite inferior de los promedios de las rentabilidades de cada etapa.
Los juegos estocásticos generalizan tanto los procesos de decisión de Markov y los juegos repetidos.
Los ingredientes de un juego estocástico son: un conjunto finito de jugadores
; Un espacio de estados
, (Ya sea un conjunto finito o un espacio medible
, un conjunto de jugadores
, Un conjunto de acciones
(Ya sea un conjunto finito o un espacio medible
); una transición de probabilidad
son los perfiles de acción a
{\displaystyle P(A\mid m,s)}
es la probabilidad de que el siguiente estado este en
, dado el estado actual es
y el perfil de acción actual es
El juego comienza en un estado inicial
, a continuación, elija simultáneamente acciones
, posteriormente observe el perfil de acción
de acuerdo a la probabilidad
Una jugada del partido estocástico,
, Define una corriente de pagos