Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
I corpora nell’antichità
Raccolte di testi tramandate oralmente e successivamente fissate in
forma scritta
Non concepiti per il fine della ricerca linguistica, ma impatto
linguistico fondamentale
Statistica linguistica
rango: il posto che un’unità lessicale occupa in una lista di frequenza
di ordine decrescente, e il numero intero che denota questo posto
• George Kingsley Zipf (1935; 1949) > il rango cresce proporzionalmente
al decrescere delle frequenze (legge di Zipf) > relazione inversa tra la
frequenza di una parola in un corpus e il suo rango
• Avvento dei computer > base per lo sviluppo di risorse testuali in
formato elettronico > nascita dell’odierna linguistica dei corpora
• corpus based > ricerche basate su corpora, il corpus è la base sulla quale
verificare un’ipotesi scientifica > strutture grammaticali
• corpus driven > il corpus stesso suggerisce, attraverso l’osservazione delle
regolarità d’uso, fenomeni frequenti e generalizzazioni teoriche > lessico-
sintassi
Corpus based
• Randolph Quirk, primi anni ‘60
• Survey of the English Usage (SEU) < Brown Corpus + testi orali
• A Comprehensive Grammar of English Language (1985)
«Web as Corpus»
• Limitazioni
• Motori di ricerca dedicati agli studi linguistici
Vantaggi e disvantaggi > web corpora