L'attribuzione dei testi gramsciani: metodi e modelli matematici
La Matematica nella società e nella cultura, Série 1, Tome 3 (2010) no. 2, pp. 235-269.

Voir la notice de l'article provenant de la source Biblioteca Digitale Italiana di Matematica

In questo lavoro illustriamo un metodo matematico per affrontare iproblemi di attribuzione di autore, sviluppato in vista della nuova "Edizione Nazionale degli scritti di Antonio Gramsci". Il metodo è basato su alcune importanti idee della matematica moderna, che offrono interessanti prospettive nell'analisi dei testi.
In this paper we discuss a mathematical approach to authorship attribution we have developed in view of the new "Edizione Nazionale degli scritti di Antonio Gramsci". The techniques we use are based on some important ideas of modern mathematics, which provide interesting perspectives on the analysis of texts.
@article{RIUMI_2010_1_3_2_a3,
     author = {Basile, Chiara and Benedetto, Dario and Caglioti, Emanuele and Degli Esposti, Mirko},
     title = {L'attribuzione dei testi gramsciani: metodi e modelli matematici},
     journal = {La Matematica nella societ\`a e nella cultura},
     pages = {235--269},
     publisher = {mathdoc},
     volume = {Ser. 1, 3},
     number = {2},
     year = {2010},
     zbl = {1250.94026},
     mrnumber = {2767070},
     language = {it},
     url = {http://geodesic.mathdoc.fr/item/RIUMI_2010_1_3_2_a3/}
}
TY  - JOUR
AU  - Basile, Chiara
AU  - Benedetto, Dario
AU  - Caglioti, Emanuele
AU  - Degli Esposti, Mirko
TI  - L'attribuzione dei testi gramsciani: metodi e modelli matematici
JO  - La Matematica nella società e nella cultura
PY  - 2010
SP  - 235
EP  - 269
VL  - 3
IS  - 2
PB  - mathdoc
UR  - http://geodesic.mathdoc.fr/item/RIUMI_2010_1_3_2_a3/
LA  - it
ID  - RIUMI_2010_1_3_2_a3
ER  - 
%0 Journal Article
%A Basile, Chiara
%A Benedetto, Dario
%A Caglioti, Emanuele
%A Degli Esposti, Mirko
%T L'attribuzione dei testi gramsciani: metodi e modelli matematici
%J La Matematica nella società e nella cultura
%D 2010
%P 235-269
%V 3
%N 2
%I mathdoc
%U http://geodesic.mathdoc.fr/item/RIUMI_2010_1_3_2_a3/
%G it
%F RIUMI_2010_1_3_2_a3
Basile, Chiara; Benedetto, Dario; Caglioti, Emanuele; Degli Esposti, Mirko. L'attribuzione dei testi gramsciani: metodi e modelli matematici. La Matematica nella società e nella cultura, Série 1, Tome 3 (2010) no. 2, pp. 235-269. http://geodesic.mathdoc.fr/item/RIUMI_2010_1_3_2_a3/

[1] C. Basile - D. Benedetto - E. Caglioti - M. Degli Esposti, An example of mathematical authorship attribution, Journal of Mathematical Physics, 49, 1-20 (2008). | DOI | MR | Zbl

[2] D. Benedetto - E. Caglioti - V. Loreto, Language Trees and Zipping, Phys. Rev. Lett. 88, n. 4, 048702-1, 048702-4 (2002).

[3] W. R. Bennett, Scientific and engineering problem-solving with the computer, Prentice-Hall, Inc. Englewood Cliffs, New Jersey (1976).

[4] L. L. Cavalli-Sforza - P. Menozzi - A. Piazza, Storia e geografia dei geni umani, Milano, Adelphi 2000.

[5] R. Clement - D. Sharp, Ngram and Bayesian Classification of Documents for Topic and Authorship, Lit. Ling. Comp. 18, n. 4 423 (2003).

[6] A. De Morgan, in Memoirs of Augustus de Morgan by his wife Sophia Elizabeth de Morgan with Selections from his Letters, (Longman's Green and Co., London, 1851/1882).

[7] P. Grassberger, Data compression and entropy estimates by non-sequential recursive pair substitution, ArXiv:physics/0207023

[8] J. W. Grieve, Quantitative Authorship Attribution: a History and an Evaluation of Techniques. http://hdl.handle.net/1892/2055, Lit. Ling. Comp. 22, 251 (2007).

[9] P. Juola, Cross-entropy and linguistic typology, Proceeding of New Methods in Language Processing 3, Sidney, 1998.

[10] P. Juola, Authorship Attribution, Foundations and Trends in Information Retrieval, vol. 1, no. 3, 233-334 (2006).

[11] D. V. Khmelev - O. V. Kukushkina - A. A. Polikarpov - D. V. Khmelev, Using literal and grammatical statistics for authorship attribution, Problemy Peredachi Informatsii, 37 (2), 2000, pagg. 96-108, translated in English in Problems of Information Transmission, 37 (2001) 172-184. | DOI | MR | Zbl

[12] V. Keselj - F. Peng - N. Cercone - C. Thomas, N-gram-based Author Profiles for Authorship Attribution, Proceedings of the Conference Pacific Association for Computational Linguistics, PACLING'03, Dalhousie University, Halifax, Nova Scotia, Canada, August 2003, pagg. 255-264.

[13] V. Keselj - N. Cercone, CNG Method with Weighted Voting Ad-hoc Authorship Attribution Competition (AAAC), June 2004. Part of ALLC/ACH 2004 conference.

[14] D. V. Khmelev - F. J. Tweedie, Using Markov Chains for Identification of Writers, Lit. Ling. Comp. 16, 3: 299-307 (2001).

[15] A. A. Markov, Primer statisticheskogo issledovanija nad tekstom "Evgenija Onegina" illjustrirujuschij svjaz' ispytanij v tsep. (An example of statistical study on the text of "Eugene Onegin" illustrating the linking of events to a chain.), Izvestija Imp. Akademii nauk VI, 153-162 (1913).

[16] A. A. Markov, Ob odnom primeneni statisticheskogo metoda. (On some application of statistical method), Izvestija Imp. Akademii nauk serija VI, 4: 239-42 (1916).

[17] T. C. Mendenhall, The characteristic curves of composition, Science, vol. IX, 237-249 (1887).

[18] J. R. Pierce, La Teoria dell'Informazione, Milano, Mondadori, 1963.

[19] A. Puglisi - D. Benedetto - E. Caglioti - V. Loreto - A. Vulpiani, Data compression and learning in time sequences analysis, Phys. D 180, no. 1-2, 92-107 (2003). | DOI | MR | Zbl

[20] C. E. Shannon, A Mathematical Theory of Communication, The Bell System Technical Journal 27, 1948, p. 623. | DOI | MR

[21] W. J. Teahan, Text classification and segmentation using minimum cross-entropy, Proceedings of the International Conference on Content-based Multimedia Information Access (RIAO 2000), pages 943-961. C.I.D.-C.A.S.I.S, Paris, 2000.

[22] I. H. Witten - A. Moffat - T. C. Bell, Managing Gigabytes, second edition, Morgan Kaufmann Publishers, 1999.

[23] A. D. Wyner, Typical sequences and all that: Entropy, Pattern Matching and Data Compression, 1994 Shannon Lecture, IEEE Information Theory Society Newsletter, July 1995.

[24] J. Ziv - A. Lempel, A universal algorithm for sequential data compression, IEEE Transactions on Information Theory, IT-23 no. 3, pagg. 337-343 (1977). | DOI | MR | Zbl

[25] J. Ziv - N. Merhav, A measure of relative entropy between individual sequences with application to universal classification, IEEE Transactions of Information Theory, 39 (4), 1993, pagg. 1270-1279. | DOI | MR | Zbl