TY - JOUR AU - Sladký, Karel TI - Identification of optimal policies in Markov decision processes JO - Kybernetika PY - 2010 SP - 558 EP - 570 VL - 46 IS - 3 UR - http://geodesic.mathdoc.fr/item/KYB_2010_46_3_a18/ LA - en ID - KYB_2010_46_3_a18 ER -