TY - JOUR AU - Sladký, Karel TI - Identification of optimal policies in Markov decision processes JO - Kybernetika PY - 2010 SP - 558 EP - 570 VL - 46 IS - 3 PB - mathdoc UR - http://geodesic.mathdoc.fr/item/KYB_2010__46_3_a18/ LA - en ID - KYB_2010__46_3_a18 ER -