Optimal policies for constrained average-cost Markov decision processes
We give mild conditions for the existence of optimal solutions for a Markov decision problem with average cost, under m constraints of the same kind, in Borel actions and states spaces. Moreover, there is an optimal policy that is a convex combination of at most m + 1 deterministic policies.
Autores principales: | González Hernández, Juan, Villarreal, César Emilio |
---|---|
Formato: | Artículo |
Lenguaje: | inglés |
Publicado: |
2009
|
Materias: | |
Acceso en línea: | http://eprints.uanl.mx/1957/1/Top.pdf |
Ejemplares similares

Design of flat halfband filters with sharp transition and differentiators through constrained quadratic optimization
por: Platas Garza, Miguel Ángel, et al.
Publicado: (2017)
por: Platas Garza, Miguel Ángel, et al.
Publicado: (2017)

Stationary probability density of stochastic search processes in global optimization
por: Berrones, Arturo
Publicado: (2008)
por: Berrones, Arturo
Publicado: (2008)

An Optimized Covering Spheroids by Spheres
por: Pankratov, Alexander, et al.
Publicado: (2020)
por: Pankratov, Alexander, et al.
Publicado: (2020)

The Dial-a-Tour Problem: A study of Single and Bi-Objective Optimization Methods
por: Hernández López, Óscar Alejandro
Publicado: (2024)
por: Hernández López, Óscar Alejandro
Publicado: (2024)

The Dial-a-Tour Problem: A study of Single and Bi-Objective Optimization Methods
por: Hernández López, Óscar Alejandro
Publicado: (2024)
por: Hernández López, Óscar Alejandro
Publicado: (2024)

Sliding mode regulator as solution to optimal control problem for non-linear polynomial systems
por: Basin, Michael, et al.
Publicado: (2010)
por: Basin, Michael, et al.
Publicado: (2010)

Repayment policy for multiple loans, Yasmín A. Ríos-Solís, Mario A. Saucedo-Espinosa, Gabriel A. Caballero-Robledo, detailed data
por: Ríos Solís, Yasmín Agueda, et al.
por: Ríos Solís, Yasmín Agueda, et al.

Efficient methods for solving power system operation scheduling challenges: the thermal unit commitment problem with staircase cost and the very short-term load forecasting problem
por: Lezama Lope, Uriel Iram
Publicado: (2023)
por: Lezama Lope, Uriel Iram
Publicado: (2023)

Efficient methods for solving power system operation scheduling challenges: the thermal unit commitment problem with staircase cost and the very short-term load forecasting problem
por: Lezama Lope, Uriel Iram
Publicado: (2023)
por: Lezama Lope, Uriel Iram
Publicado: (2023)

Análisis de la decisión individual de uso permanente en el proceso de asimilación de nuevas tecnologías de información
por: García Sánchez, Noé
Publicado: (1997)
por: García Sánchez, Noé
Publicado: (1997)

Metodología de apoyo a la decisión multicriterio para la clasificación de clientes de negocios desde el enfoque de CRM
por: Machado de Armas, Dayli
Publicado: (2020)
por: Machado de Armas, Dayli
Publicado: (2020)

Análisis de la decisión individual de uso permanente en el proceso de asimilación de nuevas tecnologías de información
por: García Sánchez, Noé
Publicado: (1997)
por: García Sánchez, Noé
Publicado: (1997)

Metodología de apoyo a la decisión multicriterio para la clasificación de clientes de negocios desde el enfoque de CRM
por: Machado de Armas, Dayli
Publicado: (2020)
por: Machado de Armas, Dayli
Publicado: (2020)

Geometría
por: Villarreal, César Emilio, et al.
Publicado: (2007)
por: Villarreal, César Emilio, et al.
Publicado: (2007)

Geometría
por: Villarreal, César Emilio, et al.
Publicado: (2007)
por: Villarreal, César Emilio, et al.
Publicado: (2007)

El orden medible como herramienta de simulación
por: Villarreal, César Emilio
Publicado: (2007)
por: Villarreal, César Emilio
Publicado: (2007)

Predicción teórica de nanoestructuras de oro protegidas con tioles
por: Cárdenas Zavala, César Emilio
Publicado: (2021)
por: Cárdenas Zavala, César Emilio
Publicado: (2021)

Predicción teórica de nanoestructuras de oro protegidas con tioles
por: Cárdenas Zavala, César Emilio
Publicado: (2021)
por: Cárdenas Zavala, César Emilio
Publicado: (2021)

Smart Corrosion Monitoring in AA2055 Using Hidden Markov Models and Electrochemical Noise Signal Processing
por: Martínez Ramos, Cynthia, et al.
Publicado: (2025)
por: Martínez Ramos, Cynthia, et al.
Publicado: (2025)

Robust Dynamic Programming in N Players Uncertain Differential Games
por: Jiménez Lizárraga, Manuel, et al.
Publicado: (2020)
por: Jiménez Lizárraga, Manuel, et al.
Publicado: (2020)

Decision policy scenarios for just-in-sequence (JIS) deliveries
por: Cedillo Campos, Miguel Gastón, et al.
Publicado: (2017)
por: Cedillo Campos, Miguel Gastón, et al.
Publicado: (2017)

Propuesta didáctica : desarrollo de habilidades para la identificación y graficación de funciones en la asignatura de Matemáticas IV en el nivel medio superior
por: Cantú Hernández, Juan José
Publicado: (1999)
por: Cantú Hernández, Juan José
Publicado: (1999)

Propuesta didáctica : desarrollo de habilidades para la identificación y graficación de funciones en la asignatura de Matemáticas IV en el nivel medio superior
por: Cantú Hernández, Juan José
Publicado: (1999)
por: Cantú Hernández, Juan José
Publicado: (1999)

Diseño de controladores y de observadores discretos para sistemas no lineales
por: Guerra Torres, César
Publicado: (2001)
por: Guerra Torres, César
Publicado: (2001)

Estabilidad y controlabilidad robusta de sistemas lineales con incertidumbre multilineal
por: Elizondo González, César
Publicado: (1999)
por: Elizondo González, César
Publicado: (1999)

Implementación de códigos polares usando esquemas caóticos de orden fraccionario
por: Brunet César, Harairis
Publicado: (2024)
por: Brunet César, Harairis
Publicado: (2024)

Estabilidad y controlabilidad robusta de sistemas lineales con incertidumbre multilineal
por: Elizondo González, César
Publicado: (1999)
por: Elizondo González, César
Publicado: (1999)

Diseño de controladores y de observadores discretos para sistemas no lineales
por: Guerra Torres, César
Publicado: (2001)
por: Guerra Torres, César
Publicado: (2001)

Implementación de códigos polares usando esquemas caóticos de orden fraccionario
por: Brunet César, Harairis
Publicado: (2024)
por: Brunet César, Harairis
Publicado: (2024)

Análisis estructural con elementos finitos
por: Molina Rodríguez, Julio César
Publicado: (1992)
por: Molina Rodríguez, Julio César
Publicado: (1992)

Problema de equilibrio de Stackelberg con incentivos y costo aleatorio del seguidor
por: García García, Julio César
Publicado: (2021)
por: García García, Julio César
Publicado: (2021)

Análisis estructural con elementos finitos
por: Molina Rodríguez, Julio César
Publicado: (1992)
por: Molina Rodríguez, Julio César
Publicado: (1992)

Problema de equilibrio de Stackelberg con incentivos y costo aleatorio del seguidor
por: García García, Julio César
Publicado: (2021)
por: García García, Julio César
Publicado: (2021)

Descubrimiento de relaciones entre microservicios a través de un grafo relajado de dependencias extraído con análisis de bitácoras
por: Iracheta Villarreal, Javier
Publicado: (2024)
por: Iracheta Villarreal, Javier
Publicado: (2024)

Descubrimiento de relaciones entre microservicios a través de un grafo relajado de dependencias extraído con análisis de bitácoras
por: Iracheta Villarreal, Javier
Publicado: (2024)
por: Iracheta Villarreal, Javier
Publicado: (2024)

Propuesta didáctica sistema de tareas para el aprendizaje significativo en matemáticas III, en las condiciones de la Preparatoria 15 de la U.A.N.L.
por: Villarreal González, Silvia Graciela
Publicado: (1999)
por: Villarreal González, Silvia Graciela
Publicado: (1999)

Propuesta didáctica sistema de tareas para el aprendizaje significativo en matemáticas III, en las condiciones de la Preparatoria 15 de la U.A.N.L.
por: Villarreal González, Silvia Graciela
Publicado: (1999)
por: Villarreal González, Silvia Graciela
Publicado: (1999)

Modelo de política óptima de dividendos (Model for a dividend optimal policy)
por: Nuñez Pérez, Jorge, et al.
Publicado: (2013)
por: Nuñez Pérez, Jorge, et al.
Publicado: (2013)

Desarrollo e implementación de un sistema de inferencia
difuso en un juego serio que ayude a fortalecer
el razonamiento lógicomatemático
por: López Sánchez, Alicia Yesenia, et al.
Publicado: (2021)
por: López Sánchez, Alicia Yesenia, et al.
Publicado: (2021)

Diseño de territorios comerciales con costos de ruteo
por: Salazar Acosta, Juan Carlos
Publicado: (2009)
por: Salazar Acosta, Juan Carlos
Publicado: (2009)
Ejemplares similares
-
Design of flat halfband filters with sharp transition and differentiators through constrained quadratic optimization
por: Platas Garza, Miguel Ángel, et al.
Publicado: (2017) -
Stationary probability density of stochastic search processes in global optimization
por: Berrones, Arturo
Publicado: (2008) -
An Optimized Covering Spheroids by Spheres
por: Pankratov, Alexander, et al.
Publicado: (2020) -
The Dial-a-Tour Problem: A study of Single and Bi-Objective Optimization Methods
por: Hernández López, Óscar Alejandro
Publicado: (2024) -
The Dial-a-Tour Problem: A study of Single and Bi-Objective Optimization Methods
por: Hernández López, Óscar Alejandro
Publicado: (2024)