Conception et analyse de la forme limite d'une famille de coefficients statistiques d'association entre variables relationnelles. II
Mathématiques informatique et sciences humaines, Tome 119 (1992), pp. 75-100

Voir la notice de l'article provenant de la source Numdam

Cette étude offre une large vision de synthèse prospective ; mais aussi, des résultats techniques précis sur une famille très générale que nous avons élaborée de coefficients d'association entre variables descriptives relationnelles à partir de leur observation empirique sur un ensemble O d'objets élémentaires. Un même coefficient est obtenu à partir d'une forme de normalisation statistique par rapport à une hypothèse d'absence de liaison, d'un indice brut d'association. Ce dernier suppose une représentation de type ensembliste des deux variables relationnelles à comparer. Le cas où les deux variables sont unaires introduit et pose clairement le problème. Nous étudions particulièrement le cas où les deux relations induites par les deux variables sont binaires. Ce cas est d'une extrême utilité en analyse des données qualitatives. La normalisation suppose le centrage et la réduction par l'écart type de l'indice brut aléatoire. C'est une expression particulière de la variance de ce dernier qui permet de mettre en évidence la forme limite du coefficient d'association dans des conditions qu'on appréhende clairement. On considère avec soin les cas très importants de la comparaison de deux variables qualitatives nominales ou ordinales. L'expression limite permet de se rendre compte d'un point de vue purement formel de la nature de la normalisation ainsi effectuée. Nous abordons ensuite un cas assez général de comparaison de deux relations q-aires pour lequel l'essentiel des calculs est fourni. Enfin, nous exprimons les recherches actuelles et développements futurs, en situant la place de ce travail dans l'aspect «classification hiérarchique» de notre approche en analyse des données.

This study gives a large synthesis view and prospective on a very general family of association coefficients between descriptive relational variables, that we have elaborated. On the other hand, very accurate technical results are provided. We assume the empirical observation of the descriptive variables on a set O of elementary objects. A given coefficient is obtained by a statistical normalization of a raw association index with respect to a hypothesis of no relation (or independence). The raw index s is conceived from a set theoretic representation of the two relational variables to be compared. The case where the two variables associated are unary, provides a clear setting up of the comparison problem. We particularly analyze the case where the two relations on O, induced by the two descriptive variables to be compared, are binary. The latter case is extremely useful in qualitative data analysis. The normalization of the raw index s takes into account the distribution of the random raw index S under an independence hypothesis. The reduction of the “centred” index [s-E(S)] where E denotes the mathematical expectation] is done with the standard deviation var(S). It is a specific expression of the variance var(S), which enables to set up the limiting from of an association coefficient, under natural asymptotic conditions. Then, we carefully study the very important cases where the descriptive variables are nominal or ordinal qualitative variables. The limit expression permits to realize the nature of the normalization, from a purely formal point of view. Next, we take up the study of the general case of the comparison of two q-ary relations. Accurate results are given in the latter context. Finally, we express our current research and their future development ; more particularly by situating the place of this work in our approach of data analysis by means of hierarchical classification.

@article{MSH_1992__119__75_0,
     author = {Lerman, Isra\"el-C\'esar},
     title = {Conception et analyse de la forme limite d'une famille de coefficients statistiques d'association entre variables relationnelles. {II}},
     journal = {Math\'ematiques informatique et sciences humaines},
     pages = {75--100},
     publisher = {Ecole des hautes-\'etudes en sciences sociales},
     volume = {119},
     year = {1992},
     mrnumber = {1195699},
     zbl = {0851.62040},
     language = {fr},
     url = {http://geodesic.mathdoc.fr/item/MSH_1992__119__75_0/}
}
TY  - JOUR
AU  - Lerman, Israël-César
TI  - Conception et analyse de la forme limite d'une famille de coefficients statistiques d'association entre variables relationnelles. II
JO  - Mathématiques informatique et sciences humaines
PY  - 1992
SP  - 75
EP  - 100
VL  - 119
PB  - Ecole des hautes-études en sciences sociales
UR  - http://geodesic.mathdoc.fr/item/MSH_1992__119__75_0/
LA  - fr
ID  - MSH_1992__119__75_0
ER  - 
%0 Journal Article
%A Lerman, Israël-César
%T Conception et analyse de la forme limite d'une famille de coefficients statistiques d'association entre variables relationnelles. II
%J Mathématiques informatique et sciences humaines
%D 1992
%P 75-100
%V 119
%I Ecole des hautes-études en sciences sociales
%U http://geodesic.mathdoc.fr/item/MSH_1992__119__75_0/
%G fr
%F MSH_1992__119__75_0
Lerman, Israël-César. Conception et analyse de la forme limite d'une famille de coefficients statistiques d'association entre variables relationnelles. II. Mathématiques informatique et sciences humaines, Tome 119 (1992), pp. 75-100. http://geodesic.mathdoc.fr/item/MSH_1992__119__75_0/