Sei sulla pagina 1di 20

La geografia delle lingue in Asia

L'Asia è una regione geografica del mondo, comunemente considerata un continente. È una parte
del supercontinente euroasiatico. L'Asia è decisamente il più vasto dei continenti del mondo, con
una superficie di oltre 4,3 volte più grande di quella dell'Europa e pari a circa un terzo di tutte le
terre emerse e, con oltre 4 miliardi di abitanti, è di gran lunga il più popolato. L'Asia si trova
(quasi del tutto) nell'emisfero boreale, e si presenta nel suo complesso come una massa
continentale compatta di grandi dimensioni, ed è il solo continente ad essere bagnato da tre
oceani: l'Atlantico (con il Mar Glaciale Artico e il Mar Mediterraneo), l'Indiano e il Pacifico.

La massa continentale si spinge a sud con le tre grandi penisole dell'Arabia, del subcontinente
indiano e dell'Indocina. A quest'ultima seguono, come prolungamento naturale, le isole
dell'Indonesia, mentre più a est, nell'Oceano Pacifico, vi sono grandi festoni di isole che, dalle Curili
al Giappone e alle Filippine, delimitano mari costieri.
L'Asia è il continente con la maggiore altitudine media (oltre 1000 m); dal punto di vista
geografico, può essere divisa in quattro grandi regioni: la regione settentrionale, pianeggiante,
costituita dal bassopiano turanico-siberiano e dal tavolato siberiano; la regione mediana, con i
giganteschi sistemi montuosi; la regione meridionale, frazionata in tre grandi penisole e la regione
orientale con migliaia di isole.

Le lingue dell’Asia

Secondo Ethnologue al 2022 in Asia si parlano 2.314 lingue raggruppate in diverse famiglie
linguistiche, alcune delle quali si trovano solo nel continente asiatico mentre altre stabiliscono un
collegamento tra questo continente e il resto del mondo.
La popolazione asiatica è di circa 4,7 miliardi di abitanti di cui i principali Stati sono la Cina (1,45
miliardi), l’India (1,4 miliardi), l’Indonesia (279 milioni), il Pakistan (230 milioni), il Bangladesh (171
milioni), il Giappone (125 milioni), le Filippine (116 milioni), il Vietnam (99 milioni), l’Iran (88 milioni),
la Turchia (85 milioni). La Russia, che ha una grande estensione sul continente asiatico, viene
comunque generalmente considerata europea; la Turchia, pur essendo la penisola anatolica
geograficamente considerata asiatica, a volte viene inclusa fra gli Stati europei.

Tra le lingue che originariamente si sono sviluppate solo nel continente asiatico vi sono:

• la famiglia altaica, che comprende lingue come il turco, il mongolo o il manciù;


• la famiglia dravidica, presente nell'India meridionale e nello Sri Lanka, che comprende lingue
come il tamil o il malayalam;
• la famiglia sino-tibetana, che comprende, tra l'altro, il cinese, il birmano e il tibetano;
• la famiglia austroasiatica, che comprende il vietnamita, il laotiano o il khmer; alcuni autori la
mettono in relazione con la famiglia austronesiana e con quella daica (thailandese) e propongono
un grande gruppo austrico;
• ci sono, infine, le lingue chukchi-kamchadal, praticamente estinte.
Le lingue dell’Asia/3
Le famiglie che si estendono oltre il continente sono:

• la famiglia afroasiatica, con l'arabo come legame più evidente con l'Africa;
• la famiglia indoeuropea, con lingue come il farsi, il curdo, l’hindi, il bengali, l’urdu, il pashto, il
nepalese, ecc., che, insieme alla famiglia uralica – ossetico, mansi, hanti –, costituiscono il legame
linguistico con l'Europa;
• la famiglia eschimo-aleutina-yupik, che collega l'Asia all'America;
• la famiglia austronesiana, che comprende, tra l'altro, lingue quali l'indonesiano, il malay
(malese), il tagalog o il giavanese, e che collega il continente asiatico all'Oceania.
La distribuzione geografica delle famiglie linguistiche in Asia
Le famiglie linguistiche più rilevanti in Asia
- Altaiche
- Caucasiche
- Indo-Iraniche
- Afro-Asiatiche (Semitiche)
- Dravidiche
- Sino-Tibetane
- Tai-Kadai
- Hmong-Mien
- Austroasiatiche
- Austronesiane
- Siberiane
La famiglia linguistica altaica

La cosiddetta ipotesi altaica suggerisce un'ascendenza comune per diverse famiglie linguistiche
universalmente accettate parlate in tutta l'Eurasia, vale a dire la famiglia turca, mongola,
tungusica, coreana e giapponese. L'ipotesi ha due versioni comuni. Quello "stretto" afferma che
turco, mongolico e tungusico sono genealogicamente correlati tra loro e formano un clade
distinto. La versione "ampia" espande questo clade per includere anche il coreano e il giapponese.
Il clade risultante è tradizionalmente etichettato come la macrofamiglia altaica, sebbene alcuni
ricercatori usino il termine "macrofamiglia altaica" specificamente per il clade [turco, mongolico,
tungusico], mentre lo stesso più coreano e giapponese può essere indicato come "macro-altaico '
o, usando un termine di recente introduzione, 'macrofamiglia transeurasiatica’.

Nel 1844, il filologo finlandese Matthias Castrén propose un raggruppamento più ampio che in
seguito venne chiamato famiglia Uralo-Altaica, che includeva turco, mongolo e manciu-tunguso (o
tungusico) come ramo "altaico", e anche le lingue finno-ugriche e samoiediche come ramo
"uralico" (sebbene Castrén stesso usasse i termini "tatarico" e "chudico"). 

Il nome "altaico" si riferiva ai monti Altai nell'Asia centro-orientale, che sono all'incirca al centro
dell'area geografica delle tre famiglie principali. Il nome "uralico" si riferiva ai monti Urali. Mentre
l'ipotesi della famiglia Uralo-Altaica può ancora essere trovata in alcune enciclopedie, atlanti e
riferimenti generali simili, dagli anni '60 è stata pesantemente criticata. Anche i linguisti che
accettano la famiglia altaica di base, come Sergei Starostin, scartano completamente l'inclusione
del ramo "uralico". Nel 1857, lo studioso austriaco Anton Boller suggerì di aggiungere il giapponese
alla famiglia Uralo-Altaica.

Negli anni '20, G.J. Ramstedt e E.D. Polivanov hanno sostenuto l'inclusione del coreano. Decenni
dopo, nel suo libro del 1952, Ramstedt rifiutò l'ipotesi Uralo-Altaica, ma includeva nuovamente il
coreano nella famiglia altaica, un'inclusione seguita dalla maggior parte dei principali altaicisti
(sostenitori della teoria) fino ad oggi. Il suo libro conteneva il primo tentativo completo di
identificare le corrispondenze regolari tra i sistemi sonori all'interno delle famiglie linguistiche
altaiche.
Il libro di Roy Andrew Miller del 1971 «Japanese and the Other Altaic Languages» convinse la
maggior parte degli altaicisti che anche il giapponese appartenesse alla famiglia altaica. Da allora,
si presume generalmente che il "macro-altaico" includa turco, mongolo, tungusico, coreano e
giapponese.
Nel 2017, Martine Robbeets ha proposto che il giapponese (e forse anche il coreano) sia nato come
lingua ibrida. Ha proposto che la casa ancestrale delle lingue turca, mongolica e tungusica fosse da
qualche parte nella Manciuria nord-occidentale. Un gruppo di quei parlanti proto-altaici
("transeurasiatici") sarebbe emigrato a sud nella moderna provincia di Liaoning, dove sarebbero
stati per lo più assimilati da una comunità agricola con una lingua simile all'austronesiana. La
fusione delle due lingue avrebbe portato al proto-giapponese e al proto-coreano.

Le lingue turche
Le lingue turche sono rappresentate da circa 180 milioni di parlanti, dall'Europa occidentale, dove
solo in Germania ci sono circa 1,8 milioni. Si va dai turchi e una parte dei curdi che parlano turco,
agli Uiguri occidentali della provincia cinese del Gansu o agli Jacuzi della Kolyma inferiore in Siberia.
In Europa (compresa la parte europea della Russia) le lingue turche divennero la seconda famiglia
linguistica più numerosa con circa 25 milioni di parlanti, dopo l’indoeuropeo e prima dell’uralico.

Secondo Ethnologue ci sono 41 lingue turciche, fra cui le più importanti sono il Turco (88 milioni di
locutori, di cui 74 in Turchia), l’Uzbeco (del Nord con 25 milioni, del Sud con 4 milioni),
l’Azerbaigiano (del Nord con 9 milioni, del Sud con 14 milioni), il Kazako (con 13 milioni), il
Turkmeno (con 7 milioni), il Kirghiso (con 5 milioni). Fra le lingue parlate in Russia, si segnala il
Tataro (5 milioni), mentre fra quelle parlate in Cina, l’Uiguro (10 milioni).
Le famiglie altaiche

Le lingue mongole
Le lingue mongole sono parlate da circa 8 milioni di parlanti, che vivono soprattutto in Cina
("Mongolia interna"), Mongolia ("Mongolia esterna"), Federazione russa (Buriazia; Calmucchia,
ecc.), Afghanistan. Una di queste lingue, il Calmucco, è parlato in Europa dal XVII secolo.
Secondo Ethnologue vi sono 13 lingue mongole. Fra le lingue più parlate il Mongolo Centrale (circa
2,6 milioni di locutori in Mongolia) e il Mongolo Periferico in Cina.

Le lingue tunguse
Il più piccolo gruppo di lingue altaiche è diffuso in Estremo Oriente in Russia e Cina. Sebbene i loro
locutori siano dispersi in un vasto territorio, sono composti solo da 50.000 - 75.000 persone. E il
numero di locutori con una buona conoscenza è ancora inferiore. Praticamente tutti sono bilingui,
di solito in russo o cinese. Nonostante questo status quo piuttosto pessimistico e una prognosi
ancora peggiore, il popolo tungusico ha lasciato tracce sostanziali nella storia dell'Estremo Oriente
(soprattutto i Manciù, fondatori della dinastia Qing, progressivamente sinizzata).
Secondo Ethnologue vi sono ancora 11 lingue tungusiche.
Le famiglie altaiche

La lingua coreana
La lingua coreana è parlata da circa 77 milioni di locutori soprattutto in Corea del Sud (48 milioni di
locutori), Corea del Sud (23 milioni di locutori), Cina (2,7 milioni) e Giappone (quasi 1 milione). Al di
fuori dell’Asia, più di 1 milione di locutori si trova negli USA.

La lingua giapponese
Il giapponese è parlato da circa 123 milioni di persone, quasi tutte in Giappone. Secondo
Ethnologue, oltre al Giapponese, devono essere consideratw ben 11 lingue delle Isole Ryukyu.
Le lingue delle Ryukyu erano originariamente e tradizionalmente parlate in tutte le isole Ryukyu,
un arco insulare che si estende tra l'isola giapponese meridionale di Kyushu e l'isola di Taiwan. La
maggior parte di loro sono considerate "decisamente in pericolo" o "in pericolo critico" a causa
della diffusione del giapponese continentale.
Poiché l'antico giapponese ha mostrato diverse innovazioni che non sono condivise con le lingue
Ryukyu, i due rami devono essersi separati prima del VII secolo. Il trasferimento dal Kyushu alle
Ryukyu potrebbe essere avvenuto più tardi e forse ha coinciso con la rapida espansione della
cultura agricola Gusuku nel X e XI secolo.
Le lingue caucasiche

Le lingue caucasiche sono un gruppo di lingue parlate nell'area del Caucaso, le quali sono state
raggruppate per contiguità geografica, ma non per accertati rapporti di parentela. La lingua
caucasica con il maggior numero di locutori è il georgiano, con circa 7,5 milioni di parlanti. Altre
lingue diffuse nell'area caucasica, come l'armeno e l'azero appartengono a famiglie linguistiche
diverse e non sono comprese nell'elenco. Le lingue caucasiche meridionali, dette anche lingue
cartveliche, sono 5 di cui la più importante è appunto il georgiano. Le lingue caucasiche occidentali,
spesso indicate come lingue caucasiche nord-occidentali, sono anche esse 5 secondo Ethnologue,
comprendendo l’Abcaso (circa 600.000 locutori soprattutto in Georgia e Turchia) e le lingue
circasse (circa 1,5 milioni di locutori fra Russia e Turchia). Le lingue caucasiche orientali, spesso
indicate come lingue caucasiche nord-orientali, sono 31 secondo Ethnologue, in gran parte in
Russia fra cui il Ceceno (circa 1,3 milioni parlanti), l’Inguscio (circa 400 mila) e l’Àvaro (800 mila).

La situazione etnica del Caucaso


Le lingue caucasiche
Le lingue indo-iraniche

Le lingue indo-iraniche attualmente si articolano in tre sottofamiglie:

- Lingue Iraniche;
- Lingue Nuristani;

- Lingue Indoarie.

Secondo Ethnologue, al momento sono riconosciute ben 448 lingue in questa famiglia, derivante
dall’indo-europeo, di cui rappresenta anche il ramo con maggior numero di parlanti, circa 1,5
miliardi di locutori. Nel gruppo iranico ricorrono alcune delle lingue di più antica attestazione
all’interno della famiglia indoeuropea, ovvero, l’avestico, l’antico persiano, sanscrito, vedico. Tra le
lingue più note appartenenti alla famiglia linguistica indo-iranica ricordiamo: l’Hindi e l’Urdu (India
e Pakistan), il Bengalese (India e Bangladesh), il Curdo (Turchia, Iraq, Iran e Siria), il Persiano (Iran,
Afghanistan). A questa famiglia appartiene pure il Romaní, unica lingua indo-iranica europea.
Le lingue iraniche

Le lingue iraniche hanno un numero stimato di 150-200 milioni di parlanti di madrelingua.


L'avestico e l'antico persiano, compresi nel ramo iranico, costituiscono due delle lingue
indoeuropee di più antica attestazione. Questo ramo è chiamato "iranico" perché i suoi membri
principali, incluso il persiano, sono stati parlati in un'area centrata intorno all'altopiano iranico sin
da tempi antichi.

Le antiche lingue iraniche cominciarono a dividersi e a evolvere separatamente quando le varie


tribù iraniche migrarono e si insediarono in vaste aree dell'Europa sudorientale (Iazigi, Sciti),
dell'altopiano iranico e dell'Asia centrale e probabilmente della Siberia meridionale (Saci) dove
successivamente si sarebbero estinte a causa dell'espansione turco-mongola medioevale.

Il gruppo orientale include il sogdiano, il corasmiano, il sacio e l'avestico (anche noto come
"Battriano antico"); il gruppo nordoccidentale comprende il medo; il gruppo sudoccidentale
comprende l'antico persiano. L'avestico è attestato principalmente attraverso l'Avestā, il libro
sacro del mazdeismo o zoroastrismo. L'antico persiano invece attraverso numerose iscrizioni in
caratteri cuneiformi.
Le lingue iraniche

Quello che è conosciuto nella linguistica iranica come "medio-iranico" si ritiene abbia avuto origine
intorno al IV secolo a.C. e sia durato fino al IX d.C. Di nuovo, geograficamente, si può suddividere
anch'esso in due grandi famiglie, occidentali e orientali.

Le prime comprendono le due lingue medio persiane, ossia il partico (o arsacide) e il pahlavi (o
sasanide), mentre le seconde il battriano, il sogdiano, il corasmiano, il sacio e l'antico osseto
(scito-sarmatico). Le due lingue occidentali erano linguisticamente molto affini tra loro, ma
alquanto distinte rispetto alle loro controparti orientali. D'altra parte queste ultime mantenevano
una somiglianza maggiore con le lingue iraniche antiche. Esse erano scritte in diversi alfabeti
aramaici, evolutisi dall'alfabeto aramaico imperiale degli Achemenidi.

Il medio-persiano o pahlavi era la lingua ufficiale dell'Impero sasanide. Fu in uso dal III secolo fino
alla fine del X. Era la lingua anche dei Manichei, dei quali sopravvive una letteratura piuttosto
limitata. L'alfabeto aramaico imperiale in quest'epoca conobbe una significativa maturazione.
In seguito alla conquista islamica dell'Iran ci furono importanti cambiamenti nel ruolo dei diversi
dialetti persiani all'interno dell'impero. L'antico prestigio del medio persiano fu rimpiazzato da un
nuovo dialetto standard chiamato dari come lingua ufficiale della corte. Il nome Dari viene dalla
parola che fa riferimento alla corte imperiale, dove fiorirono molti poeti e mecenati sostenitori
della letteratura.

La dinastia Saffaride in particolare fu la prima di una serie di numerose dinastie ad adottare


ufficialmente la nuova lingua nell'857. Si pensa che il Dari sia stato pesantemente influenzato dai
dialetti regionali dell'Iran orientale, laddove invece lo standard del pahlavi era stato basato
maggiormente sui dialetti occidentali.
Questo nuovo dialetto di prestigio divenne la base del moderno persiano standard.

Studiosi persiani medievali associarono il termine "Dari" con la provincia orientale del Khorasan,
mentre utilizzarono il termine "Pahlavi" in riferimento ai dialetti nordoccidentali, delle aree tra la
provincia di Isfahan e l'Azerbaigian, e "Parsi" (persiano proprio) per i dialetti del farsi. Essi stessi
peraltro segnalarono che la lingua non ufficiale della nobiltà era un'altra ancora, il "Khuzi", messo
in relazione con la provincia orientale del Khūzestān. La conquista islamica inoltre segnò una
rottura anche per il fatto di adottare la scrittura araba per scrivere il persiano. Essa fu adattata
all'uso con l'introduzione di alcune lettere aggiuntive. Questo processo probabilmente richiese un
certo tempo, durante la seconda metà dell'VIII secolo, quando la vecchia scrittura medio-persiana
cadde in disuso.

La scrittura araba è quella ancora oggi in uso per il persiano contemporaneo.


La scrittura della lingua tagica fu resa con l'alfabeto cirillico negli anni venti/trenta del XX secolo,
per iniziativa del governo sovietico. L'area geografica in cui furono parlate le lingue iraniche è stata
ridimensionata in diverse zone dall'espansione di varie lingue vicine. L'arabo si diffuse in alcune
parti dell'Iran occidentale (Khuzestan), e le lingue turche si sono estese in buona parte dell'Asia
centrale, soppiantando diverse lingue iraniche, come il sogdiano e il battriano, in zone oggi facenti
parte di Turkmenistan, Uzbekistan e Tagikistan. Inoltre soppiantarono anche l'antica lingua iranica
parlata nell'Azerbaigian, nota come Azari.

Le lingue iraniche

Secondo Ethnologue, le lingue iraniche sono attualmente 85 così suddivise:

Lingue Orientali
a loro volta suddivise in
Nord-Orientali (fra cui l’Osseto in Russia, con circa 500.000 locutori in Ossezia del Nord)
e Sud-Orientali (lingue del Pamir e lingua Pashtu, coufficiale in Afghanistan).

Lingue Occidentali
a loro volta suddivise in
Lingue Nord-Occidentali (fra cui il Beluci in Pakistan e Iran, lingua non ufficiale, ma che si stima
abbia fra i 6 e i 7 milioni di locutori, e il Curdo in Turchia, Iran e Iraq)
e Lingue Sud-Occidentali (fra cui il Fārsī in Iran, il Darī in Afghanistan, il Tojiki in Tagikistan, in realtà
tre varianti del Persiano).
Le lingue iraniche
Le lingue iraniche
Le lingue curde

Le lingue curde non costituiscono un'unica entità linguistica standardizzata, si tratta invece di un
continuum di varietà linguistiche strettamente legate tra loro, parlate in Asia Occidentale.
Generalmente la lingua curda viene distinta in quattro sottogruppi: la varietà settentrionale
(Kurmancî), varietà centrale (Sorani), varietà meridionale (Pehlewani) e il Laki.
Secondo Ethnologue al 2022 i parlanti delle lingue curde sono circa 21 milioni soprattutto fra
Turchia, Siria, Iran e Iraq.
Le prime testimonianze scritte in lingua curda risalgono a non prima del XVI secolo e non sono
particolarmente rilevanti per lo studio delle evoluzioni della lingua.
La formazione iniziale del curdo sarebbe avvenuta in un ambiente sud-occidentale iraniano, vale a
dire le aree settentrionali del Fars in Iran. L'espansione settentrionale dei curdi nell'allora Armenia
iniziò tra l'VIII e il IX secolo d.C. e continuò per un periodo di diversi secoli.Alcuni indizi riguardanti
la cronologia di questi eventi possono essere ottenuti dalla datazione delle parole in prestito
armeno in curdo. Il punto di origine di questa espansione verso nord è considerato il nord dell'Iraq,
l’Hakkari e la sponda meridionale del lago Van.
Le lingue curde
Le lingue persiane: Fārsī, Darī e Tojiki

Il persiano gode dello status di lingua ufficiale o di Stato nei tre paesi iranofoni di Iran, Afghanistan
e Tagikistan, dove è chiamato rispettivamente Fārsī, Darī e Tojiki.
È parlata come lingua madre dalla maggioranza della popolazione in Iran e Tagikistan e da
un'ampia minoranza in Afghanistan (i cui membri sono anche chiamati "tagiki" etnici). In tutti e tre
i paesi è ampiamente utilizzato come lingua di comunicazione, istruzione e commercio anche da
non madrelingua.
In Uzbekistan, una vivace minoranza di popolazione di lingua tagika vive ancora nelle città di
Samarcanda e Bukhara. Inoltre, consistenti comunità di espatriati o esiliati di lingua persiana
vivono in paesi adiacenti, come Emirati Arabi, Iraq, Turchia, Pakistan, e in altri paesi come Russia,
Australia, Giappone, Israele, Stati Uniti, Canada e in vari paesi di Europa occidentale. La maggior
parte degli iraniani, afgani e tagiki vi sono emigrati dalla seconda metà del XX secolo.
La stima di Ethnologue è di 77 milioni di locutori di Fārsī in Iran, 12-15 milioni della lingua Darī e circa
10 milioni di lingua Tojiki (questi ultimi in Tagikistan, Afghanistan e Uzbekistan).
Le lingue persiane: Fārsī, Darī e Tagico

Lo status ufficiale del persiano è stato stabilito per la Repubblica islamica dell'Iran nella
Costituzione del 1979 e per l'Afghanistan nella Costituzione del 2004. Sebbene lo status del Fārsi
come lingua ufficiale e nazionale dell'Iran non sia stato seriamente messo in discussione nella
recente storia del Paese, lo status del Darī è stato più contestato nell'Afghanistan moderno.
Il pashtu, la lingua madre della popolazione a maggioranza afgana (50-55%), ha ricevuto la
preferenza politica sul Darī dagli anni '30 ed è stata chiamata la "lingua nazionale" dell'Afghanistan
nella Costituzione del 1964. Ha perso questo privilegio dopo il Colpo di Stato comunista del 1978, e
da allora è stata solo una delle due lingue ufficiali insieme al Darī.
Il Darī ha di conseguenza consolidato la sua posizione dominante de facto nell'amministrazione e
nella comunicazione interetnica, ma l'antagonismo etnico-culturale pashto-tagiko continua a
permeare la politica afgana fino ad oggi.
Le lingue persiane: Fārsī, Darī e Tagico

La costituzione tagika del 1994 specificava il tagico come lingua di stato e il russo come lingua di
comunicazione interetnica, ma nel 2009 è stata approvata in parlamento una legge che
confermava il tagico come unica lingua ufficiale, limitando così l'uso del russo. La politica della
tagikizzazione linguistica era stata perseguita sistematicamente dopo l'indipendenza nel 1991, in
modo simile alla "uzbekizzazione" nel vicino Uzbekistan, ecc.
L'atteggiamento dei tagiki nei confronti del russo sembra essere pragmatico al giorno d'oggi, in
quanto rimane una lingua importante nell'istruzione e nel mondo accademico, ed è altrettanto
importante per quei tagiki che vanno in Russia come lavoratori ospiti. La vera sfida è per la
minoranza uzbeka di circa il 15% che viene sempre più emarginata e percepita come gli agenti
interni dell'uzbekizzazione in Tagikistan.
Mentre l'unità del persiano come lingua nei tre paesi iranofoni può essere affermata su basi
linguistiche e sarebbe sostenuta dalla maggior parte dei parlanti nei tre paesi (soprattutto in Iran e
Afghanistan), per il tagico si può ipotizzare una tendenza a sviluppare un'identità linguistica
distinta. Ciò si basa principalmente sull'uso della scrittura cirillica (rispetto alla scrittura araba usata
per Fārsi e Darī), sulla forte influenza lessicale del russo durante il XX secolo e sulla lunga influenza
dell'uzbeko sulla grammatica del tagico (soprattutto sui suoi dialetti settentrionali).
Le lingue pashtu

La lingua pashtu è una lingua iranica parlata in Afghanistan e Pakistan. È di gran lunga la lingua
iranica orientale più diffusa e parlata, essendo anche l'unica di tale sottogruppo a superare il
milione di locutori (essendo la seconda l'osseto che ha circa mezzo milione di parlanti) e l'unica a
non essere minacciata.

Al 2022, è parlata da quasi 60 milioni di parlanti totali. Ethnologue (2022) non la calcola comunque
come una lingua unitaria, ma come una lingua tripartita: pashtu settentrionale (30,2 milioni di
parlanti totali), pashtu centrale (8,5 milioni) e pashtu meridionale (19,7 milioni).

Si reputa che la lingua abbia avuto origine nelle aree corrispondenti alle province afghane del
Kandahar e dell'Helmand. Da quando la capitale fu spostata da Kandahar a Kabul nel Settecento, è
più utilizzata ufficialmente la lingua persiana (Darī) rispetto all'afgano/pashtu. Il pashtu, insieme al
persiano (Darī), è una delle due lingue ufficiali dell'Afghanistan.
Le lingue nuristani

Le Lingue Nuristani costituiscono una sotto-famiglia delle Lingue indoiraniche. Queste lingue sono
parlate nella Provincia del Nurestan, in Afghanistan. L'emergenza storica delle lingue nuristani in
rapporto alle altre lingue indoiraniche resta difficile da valutare.
Queste lingue erano denominate anticamente «lingue kafire». Questo termine è oggi però
rigettato, perché si riferisce al Kafiristan, l'antico nome dato dai musulmani al Nurestan, che
significa «paese dei pagani», con una accezione oggi da considerarsi assolutamente negativa. Dopo
il 1896, anno della conquista e dell'islamizzazione della regione, i Nuristani non sono più politeisti.
Il primo ad identificare le lingue nuristani fu G.A. Grierson nel 1906. Sfortunatamente, egli le
raggruppa con le Lingue dardiche. Fu il norvegese Georg Morgenstierne che stabilì in seguito che
le lingue dardiche sono chiaramente delle Lingue indoarie e che le lingue nuristani formano un
gruppo assai differente. In seguito, parecchie ipotesi vennero presentate per tentare di spiegare
l'origine delle lingue nuristane.
Le lingue nuristani

C'è stata controversia sul fatto che le lingue Nûristânî siano più strettamente legate ai rami
iraniano o indo-ariano dell'indo-iraniano.
Alcuni studiosi hanno indicato la preponderanza dei cambiamenti sonori indo-ariani medi nelle
lingue nûristânî come prova del loro essere indo-ariani.
Ma i primi cambiamenti sonori distintamente Nûristânî coincidono con quelli del primo iraniano.
Le lingue Nûristânî furono prima ai margini dell'influenza linguistica indo-iraniana, poi all'interno
della sfera iraniana e solo successivamente all'interno della sfera indo-ariana.
Pertanto, è da escludere un'origine indoariana delle lingue nûristânî.
Secondo le loro storie, i Nûristânî arrivarono nella regione ben dopo gli indo-ariani, dopo essere
fuggiti dall'assalto dell'Islâm da Khorasân a Kandahâr a Kâbul a Kâpisâ a Kâma nella provincia
afghana di Nangarhâr, entrando nell'attuale Nûristân solo all'indomani della conquista islamica di
Nangarhâr verso il 1000 d.C.
Attualmente Ethnologue classifica solo 6 lingue nuristane con appena circa 100.000 locutori.
Le lingue nuristane in Afghanistan
Le lingue indoariane

Le lingue indoariane o indoarie sono parlate principalmente nel subcontinente indiano, indicato
anche come Asia meridionale. I paesi rappresentati da quest'area includono India, Pakistan,
Bangladesh, Nepal, Bhutan e le isole dello Sri Lanka e delle Maldive.
Secondo Ethnologue, vi sono attualmente 220 lingue indoariane, fra cui le più parlate sono le
lingue derivate dall’Indostano, ossia le lingue ufficiali di India, l’Hindi, con più di 600 milioni di
parlanti, e di Pakistan, ossia l’Urdu, con circa 230 milioni di parlanti.
Altre lingue rilevanti sono il Bengalese (273 milioni di parlanti), lingua ufficiale del Bangladesh e di
alcuni Stati dell’India, il Punjabi, lingua di Pakistan e India, che conta circa 120 milioni di parlanti, il
Marathi, 99 milioni di locutori, il Gujarati, 62 milioni di parlanti.
Le lingue indoariane: la classificazione

Le classificazioni sono sempre piuttosto complicate per questa lingua, privilegiando criteri
geografici.
Ethnologue individua questi raggruppamenti:

- Divisioni Intermedie (101 lingue)


- Orientali (9 lingue in India, Nepal, fra cui il Nepali e un lingua delle Fiji);
- Occidentali (92 lingue in India, Pakistan e Turchia, fra cui il Punjabi, il Gujarat, ecc., ma
comprende anche il Romaní);

- Linguaggi Esterni (94 lingue)


- Orientali (45, fra cui il Bengalese);
- Nordoccidentali (34, fra cui le lingue dardiche);
- Meridionali (15, fra cui il Marathi e il Maldiviano);

- Lingue Tharu (5 lingue del Nepal);

- Lingue Hindi occidentali (14 lingue, in particolare il ramo Indostano, con Hindi e Ursu);

- Non classificate (al momento 13 lingue).


Le lingue indoariane
Le lingue indoariane: la posizione geolinguistica

La posizione geolinguistica delle lingue indo-ariane è delimitata dalla catena montuosa himalayana
a nord e ad est, essendo così separate per quanto riguarda il facile accesso e la comunicabilità dal
resto del subcontinente asiatico. La parte meridionale si estende nell'Oceano Indiano, dividendolo
nel Mar Arabico e nel Golfo del Bengala. Il punto più meridionale dell'area è l'isola dello Sri Lanka,
dove il dravidico separa il singalese dall'indoariano continentale per mille chilometri. Nel sud-ovest
ci sono le Maldive, dove si parla Dhivehi. A ovest, le montagne separano il subcontinente dall'Asia
occidentale di lingua iraniana, permettendo alcuni modesti contatti, principalmente attraverso i
passi.
Le lingue indoariane hanno una lunga storia di trasmissione, non solo sotto forma di opere
letterarie e trattati che trattano argomenti logici, filosofici e rituali, ma anche in descrizioni
fonetiche, fonologiche e grammaticali.
Le lingue sono divisibili in tre fasi principali: indoariano antico, medio e nuovo (o moderno).
L’evoluzione storica delle lingue indoariane

Si stima che la separazione della lingua proto-indo-iraniana in proto-iraniana e proto-indo-ariana sia


avvenuta intorno al 1800 a.C. o prima. La data di composizione degli inni più antichi del Rigveda è
nella migliore delle ipotesi vaga, generalmente stimata intorno al 1500 a.C. Sia Asko Parpola
(1988) che J.P. Mallory (1998) collocano il luogo della divisione dell'indo-ariano dall'iraniano nella
cultura dell'età del bronzo del Complesso archeologico Battriano-Margiano.
Chiamata anche la "civiltà di Oxus". Essa è centrata sull'alto Amu Darya (fiume Oxus) in Battriana,
la maggior parte dei siti urbani si trova in realtà nella Margiana (moderno Turkmenistan) sul delta
del fiume Murghab e nel Kopet, catena montuosa del Dagh. Ci sono alcuni siti successivi
(1950–1450 a.C. circa) nella Battriana settentrionale, attualmente conosciuta come Uzbekistan
meridionale.
Parpola (1999) elabora il modello e ipotizza che gli indo-ariani "proto-rigvedici" si siano insediati in
quell’area intorno al 1700 a.C. Presuppone la prima presenza indo-ariana nell'orizzonte del tardo
Harappa dal 1900 a.C. circa, e l'intrusione "proto-rigvedica" (proto-dardica) nel Punjab come
corrispondente alla cultura tombale di Gandhara dal 1700 a.C. circa. Secondo questo modello, il
rigvedico all'interno del più ampio gruppo indo-ariano è il diretto antenato delle lingue dardiche,
con lessicali persiani su una grammatica indoaria.
L’evoluzione storica delle lingue indoariane

Le prime attestazioni di questo gruppo si hanno dal vedico, la lingua usata negli antichi testi del
subcontinente indiano, il canone fondamentale dell'induismo, conosciuti come i Veda. Il
superstrato indoario nella lingua del Mitanni risale ad un periodo simile a quello dei Rigveda, ma è
evidenziato solo da pochi prestiti.
All'incirca nel IV secolo a.C. venne codificata la lingua sanscrita e standardizzata dal grammatico
Pānini, lingua chiamata "sanscrito classico" per convenzione. All'infuori del sanscrito, che
costituiva una lingua letteraria, i dialetti vernacolari (detti pracriti), continuavano ad evolversi.
Nel medioevo i pracriti si diversificarono i vari dialetti detti medio-indiani.

"Apabhramśa" è il termine convenzionale per i dialetti di transizione tra i medio-indiani e i primi


indiani moderni, coprendo un lasso di tempo tra il VI ed il XIII secolo. Alcuni di questi dialetti furono
al centro di una considerevole produzione letteraria; Il Sravakachar di Devasena (datato intorno al
930) viene considerato il primo libro hindi.

Il maggior cambiamento avvenne con l'invasione musulmana dell'India tra il XIII ed il XVI secolo.
Nel fiorente impero moghul il persiano divenne molto influente e una lingua di prestigio alle corti
islamiche. Ad ogni modo il persiano venne presto sostituito dall'urdu. Questa lingua indoaria
nacque come combinazione di elementi lessicali persiani su una grammatica indoaria.
L’evoluzione storica delle lingue indoariane

Le due principali lingue che si formarono dagli Apabhramśa furono il bengali e l'hindi; altre lingue
minori furono il gujarati, l'oriya, il marathi, ed il punjabi.

Nelle zone a maggioranza hindi, la forma principale era il Braj-bhasha, che viene parlato ancora
oggi, ma venne rimpiazzato come dialetto guida dal Khari Boli. Comunque larga parte del
vocabolario hindi deriva dal persiano-arabo.

Questa condizione rimase fino alla ripartizione del Dominion dell'India in due stati separati, India e
Pakistan, nel 1947.

L'indostano (urdu) venne rimpiazzato dall'hindi standard come lingua ufficiale dell'India, e in breve
le parole di origine persiana o araba dell'urdu cominciarono ad essere eliminate dal corpus lessicale
hindi, al fine di rendere la lingua ufficiale più "indiana". Ciò comportò l'inizio della sanscritizzazione
della lingua.

Le parole persiane nel parlato comune vennero lentamente rimpiazzate da parole sanscrite, a
volte prese direttamente in prestito, o in composti moderni. Al giorno d'oggi esiste un continuum
hindi-urdu, con una lingua urdu pesantemente arabizzata da un lato e un hindi sanscritizzato
dall'altra, anche se la grammatica di base rimane identica. La maggior parte della gente parla una
via di mezzo, il cosiddetto "indostano".
La lingua Hindi

Gli sforzi per portare avanti la causa dell'hindi raggiunsero il massimo del successo quando
l'Ottavo Programma della Costituzione indiana del 1950 prevedeva che la lingua nazionale della
Repubblica indipendente dell'India fosse l'hindi, scritto in caratteri Devanāgarī.
Questa decisione non è stata presa, tuttavia, senza un dibattito sostanziale su quale particolare
registro all'interno del cosiddetto nesso hindi/urdu/hindustani doveva costituire la base della
lingua nazionale.
Sebbene tutte le prove indichino che Gandhi e Nehru avessero favorito uno stile della lingua né
fortemente sanscritizzato né eccessivamente persiano-arabizzato e scritto in caratteri devanāgarī
o persiano-arabi, negli anni successivi all'indipendenza, l'hindi fu sempre più conformato in un
maniera sempre più fortemente sanscritizzata.
Negli ultimi anni la situazione in India per quanto riguarda lo status dell'hindi ha continuato ad
evolversi. All'inizio del ventesimo secolo, e anche negli anni '50 e '60, era generalmente vero che
esistevano pochi veri madrelingua di Khari Boli. La maggior parte dei cosiddetti parlanti hindi erano
in realtà madrelingua dell'uno o dell'altro dialetto regionale dell'hindi, ma con un certo grado di
competenza nella lingua standard appresa attraverso l'istruzione formale.
Attualmente si sono fatti sentire chiaramente gli effetti di mezzo secolo di sforzi da parte del
governo indiano. Ora ci sono decine di milioni di persone, tra cui molte che vivono in aree
geografiche che sarebbero state considerate il cuore di altre lingue, Braj, Avadhi, Bhojpuri, ecc. la
cui lingua madre è ora una varietà dell’Hindi standardizzato. Inoltre, la massiccia diffusione delle
moderne tecnologie di comunicazione, tra cui radio, televisione, film e ora Internet, ha avuto un
effetto standardizzante e ha portato una forte esposizione dell’Hindi standardizzato a porzioni
significative della popolazione dell'India settentrionale.

La lingua Urdu

La lingua urdu, parola di origine turcica il cui significato è "accampamento (imperiale)", e dalla
quale deriva anche la parola italiana "orda", è attualmente la lingua ufficiale del Pakistan insieme
all'inglese e una delle 22 lingue ufficiali riconosciute dall'India.
Storicamente, l'urdu si è sviluppato principalmente dalla lingua subregionale dell'area di Delhi.
Sotto il Sultanato di Delhi (dal 1211 al 1504 d.C.), la lingua di Delhi fu portata in gran parte dell'India
con gli eserciti musulmani e i loro commercianti indù, nonché da mistici e predicatori sūfī,
trasformandola in una lingua franca.
Quando la capitale dell'Impero Mughal (dal 1526 al 1757 d.C.) fu spostata da Agra a Delhi nel 1648
(e chiamata Shāhjahānābād in onore dell'imperatore Shāh Jahān), la corte reale di circa 10.000
persone emigrarono.
Mentre le élite parlavano e scrivevano persiano, la base presumibilmente parlava una forma di
lingua indostana. Vi era anche un afflusso di persone dalle aree circostanti, per lo più che parlavano
il Kauravī e, in numero minore, altri dialetti.
La lingua che si sviluppò nel Forte Rosso, o Urdū-e-muc aliā ['l'accampamento esaltato'], si
discostò gradualmente dal dialetto della Vecchia Delhi, o Karkhandari. La lingua del Forte Rosso
(chiamata variamente e in modo confuso Hindavī, Rekhta o Zabān-e-Urdū-e-Mucallā) mostra una
maggiore influenza da Braj rispetto al dialetto della Vecchia Delhi.
Il nome 'Urdu' deriva dal termine descrittivo Zabān-e-Urdū-e-Mucallā, ovvero 'lingua
dell'accampamento esaltato', e si vede per la prima volta in un distico scritto da un poeta,
all’incirca nel 1776. La lingua del Forte Rosso iniziò ad essere usata per la prima volta come lingua
letteraria nelle composizioni in cui era mescolata con il persiano (da cui il termine Rekhta, che
significa "sparso" o "misto").
Le lingue dravidiche

La famiglia linguistica dravidica comprende 85 lingue secondo Ethnologue, parlate da circa 222
milioni di persone in tutta l'Asia meridionale. Sebbene attualmente queste lingue siano parlate
nell'India meridionale, in alcune parti dell'India orientale e centrale e in sacche isolate nel Pakistan
occidentale, si ipotizza che il dravidico avesse una volta una distribuzione più ampia.
Vi sono comunità di immigrati di lingua dravidica in tutto il mondo, comprese grandi popolazioni in
Sri Lanka, Singapore e Malesia.
Le lingue dravidiche sono classificate in sottogruppi meridionali, centromeridionali, centrali e
settentrionali.
Le quattro principali lingue letterarie – Kannada (o Canarese, 58,6 milioni di parlanti), Malayalam
(37 milioni di locutori), Tamil (86,4 milioni di parlanti) e Telugu (95,7 milioni di parlanti) - sono
riconosciute come lingue programmate dalla costituzione dell'India. Sono rispettivamente le
lingue ufficiali degli stati di Karnataka, Kerala, Tamil Nadu, Telangana/Andhra Pradesh. Il tamil è
anche una lingua ufficiale in Sri Lanka e Singapore.
La domanda su quando e da dove le persone che parlavano lingue dravidiche sono entrate nel
subcontinente indiano non può essere risolta in modo soddisfacente sulla base delle prove
archeologiche o linguistiche disponibili. Ci sono stati numerosi tentativi di dimostrare connessioni
genetiche esterne, ma nessuno è particolarmente convincente.
La civilizzazione matura della Valle dell’Indo
Le lingue dell’India

La Costituzione dell'India ha definito l'uso della hindi e dell'inglese come le due lingue ufficiali per il
governo nazionale.

Classifica, inoltre, un insieme di 22 lingue registrate, che possono essere ufficialmente adottate dai
diversi stati per necessità amministrative, come uno strumento di comunicazione tra il governo
nazionale e quello degli stati e per gli esami pubblici condotti per le selezioni degli impiegati del
governo centrale. In ogni caso, non esiste una "lingua nazionale" indiana.

Secondo i piani, l'inglese avrebbe dovuto cessare di essere lingua ufficiale (cioè allo stesso livello
dello hindi) dal 1965, dopodiché sarebbe continuato il suo uso come "lingua ufficiale
supplementare associata" fino al momento in cui un comitato nominato avrebbe potuto decidere
una transizione completa allo hindi, basata su una revisione periodica. Tuttavia, dopo proteste di
alcuni stati come Tamil Nadu, in cui è bassa la penetrazione dello hindi, "il sistema di lingua
gemellare" è ancora accettato. A causa del rapido processo di industrializzazione e dell'influenza
multinazionale sull'economia indiana, l'inglese continua ad essere un mezzo di comunicazione
popolare ed influente nel governo e nel commercio quotidiano.
Le lingue dell’India
Con l’Ottavo Programma della Costituzione l’India ha inizialmente riconosciuto 14 lingue regionali
che possono essere inserite come lingue ufficiali dei diversi Stati.

Con il Ventunesimo Emendamento della Costituzione indiana nel 1967 è stata riconosciuta come
lingua regionale anche il Sindhi.

Con il Settantunesimo Emendamento del 1992 sono stati inclusi il Konkani, il Manipuri (Meitei) e il
Nepali, aumentando così il numero delle lingue regionali ufficiali dell'India a 18.

Nel 2003 con il Novantaduesimo Emendamento, sono state inserite anche il Bodo, il Dogri, il
Maithili e il Santali.

Nel 2011 con il Novantaseiesimo Emendamento, la lingua Oriya è stata ridenominata Odia.

Le lingue riconosciute sono: Assamese, Bengali, Bodo, Dogri, Gujarati, Hindi, Kannada, Kashmiri,
Konkani, Maithili, Malayalam, Manipuri, Marathi, Nepalese, Oriya (Odia), Punjabi, Sanscrito, Santali,
Sindhi, Tamil, Telugu, Urdu.

Oltre agli Stati e ai Territori dell’Unione, l'India ha regioni amministrative autonome a cui può
essere consentito di selezionare la propria lingua ufficiale - un esempio calzante è il Consiglio
territoriale del Bodoland in Assam che ha dichiarato la lingua bodo come ufficiale per la regione,
oltre ad Assamese e inglese già in uso e il bengalese come lingua ufficiale nella Barak Valley.
La geografia delle lingue in India
La geografia delle lingue in India nel 2011
La geografia delle lingue in India nel 2011
La geografia delle lingue in India nel 1931
La geografia delle lingue indoeuropee in India al 2011
La geografia delle lingue dravidiche in India al 2011
La geografia delle lingue austro-asiatiche in India al 2011
La geografia delle lingue tibeto-birmane in India al 2011
La geografia delle lingue programmate in India al 2011
Le lingue del Sud Est Asiatico

Il sud-est asiatico è una regione di grande diversità linguistica e geografica dove si parlano
centinaia di lingue, appartenenti a cinque famiglie diverse. Il sud-est asiatico continentale
comprende Myanmar, Thailandia, Laos, Cambogia e Vietnam. Il sud-est asiatico peninsulare e
insulare comprende Malesia, Singapore, Indonesia, Brunei, Timor orientale e Filippine.
Nell'est del sud-est asiatico continentale predomina il Mon-Khmer,
al centro il Tai-Kadai (o Kra-Dai),
nell'ovest il Tibeto-Birmano,
nel sud-est asiatico peninsulare e insulare, l’Austronesiano.
A queste si deve aggiungere un gruppo più piccolo di lingue, lo Hmong-Mien.
Le lingue del Sud Est Asiatico

Il Mon-Khmer è originario del sud-est asiatico continentale, essendo esistito nella regione per molti
millenni.
Due dei suoi membri, Khmer e Vietnamita, sono le lingue nazionali della Cambogia e del Vietnam,
ma la maggior parte delle altre sono parlate da piccole comunità sparse in remote regioni
montuose.
Il Tibeto-Birmano è probabilmente imparentato con il cinese e potrebbe essere un discendente di
un'ipotetica lingua ancestrale (proto-sino-tibetana) che sarebbe stata parlata nella valle del Fiume
Giallo almeno 6.000 anni fa. Le migrazioni portarono quelle che sarebbero diventate le lingue
tibetane sull'altopiano del Tibet, mentre altre, seguendo una direzione sud-ovest lungo le valli
fluviali in Myanmar, India e Nepal, hanno prodotto una dozzina di rami diversi. Il birmano è la
lingua nazionale del Myanmar, ma le altre lingue tibeto-birmane del sud-est asiatico sono per lo più
parlate da minoranze, le cosiddette "tribù delle colline" distribuite nel nord e nell'est del Myanmar
e in alcune enclavi della Thailandia settentrionale, del Laos e della Cina meridionale.
Le lingue del Sud Est Asiatico

Il Tai-Kadai è una famiglia arrivata relativamente da poco, che ha avuto origine, probabilmente,
nell'area di confine tra la Cina meridionale e il Vietnam settentrionale, e si è diffuso nel Myanmar
orientale, in Thailandia e in Laos all'inizio del secondo millennio d.C. Il tailandese e il laotiano sono
lingue nazionali; altri membri della famiglia sono parlati da un numero minore di persone nelle
regioni settentrionali del Vietnam, Laos e Myanmar. L'arrivo del Hmong-Mien nella regione è
ancora più recente. Dalla Cina meridionale, fu spinto dall'espansione della popolazione Han, nel
XIX e XX secolo, al Vietnam del nord, al Laos e alla Thailandia, ma dopo la fine della guerra del
Vietnam, molti dei suoi parlanti emigrarono fuori dall'Asia.
Si pensa, infine, che le lingue austronesiane discendano da un unico antenato, probabilmente
parlato a Taiwan circa 5.000 anni fa. Si estendono dalle isole dell'Oceania a est, attraverso il
sud-est asiatico insulare e fino all'isola africana del Madagascar a ovest. Il malese è la lingua
nazionale della Malesia, del Brunei e dell'Indonesia, il giavanese e il sundanese sono grandi lingue
regionali di Java mentre il tagalog è stato scelto come lingua nazionale delle Filippine. Le lingue dei
Chăm del sud del Vietnam, del sud della Cambogia e dell'isola cinese di Hainan si trovano,
eccezionalmente, sulla terraferma.
Le lingue austroasiatiche

Le lingue austroasiatiche sono originarie del sud-est asiatico e costituiscono una famiglia ampia ed
eterogenea.
In epoca preistorica alcuni gruppi austroasiatici migrarono nell'Asia meridionale producendo
un'importante divisione tra le lingue Munda dell'India e le lingue Mon-Khmer che rimasero nella
loro patria.
Le lingue austroasiatiche si trovano nel sud-est asiatico continentale e nell'India nord-orientale e
centrale.
Nel sud-est asiatico predominano in Cambogia e Vietnam, ma in Thailandia, Laos, Myanmar e
Malesia peninsulare sono in minoranza, oscurate da lingue molto più ampie delle famiglie
Tai-Kadai, Tibeto-Birmane e Austronesiane.
La famiglia austroasiatica è tradizionalmente divisa nella piccola sottofamiglia Munda e nella
grande Mon-Khmer.
Le lingue asliane della Malesia e le lingue nicobaresi delle isole Nicobare (una parte dell'India) sono
state provvisoriamente incluse all'interno delle lingue Mon-Khmer ma la loro classificazione è
controversa.
La sottofamiglia Mon-Khmer ha più di cento lingue e un certo numero di rami la cui relazione
reciproca è anche controversa. Alcune classificazioni recenti fanno coincidere l’Austroasiatico e il
Mon-Khmer, considerando le lingue Munda solo un altro ramo della famiglia.
Le lingue austroasiatiche
Le lingue Munda

Le Munda sono lingue atipiche austroasiatiche i cui parlanti potrebbero essere migrati a ovest in
epoca preistorica in India dalla loro terra natale del sud-est asiatico.
La loro marcata divergenza dall'austroasiatico tradizionale a livello fonologico, morfologico e
sintattico, unita all'incorporazione di un certo numero di parole Munda nel sanscrito, suggeriscono
che questa migrazione sia molto antica. I parlanti Munda sono popoli tribali che abitano,
principalmente, l'India nord-orientale, cercando riparo nelle giungle e nelle colline dove vivono
praticando un tipo primitivo di agricoltura.
Le lingue munda sono parlate principalmente nell'India nord-orientale e centrale con alcune
comunità in Nepal e Bangladesh. All'interno dell'India nord-orientale, predominano nello stato di
Jharkhand di recente creazione e sono anche piuttosto numerosi in Orissa, Bihar e Bengala
Occidentale. Nell'India centrale, una lingua Munda (Korku) è parlata in una piccola area che
attraversa il confine tra Madhya Pradesh e Maharashtra.

Secondo Ethnologue sono 23 le lingue Munda classificate. Le principali lingue Munda sono:

il Santali, una lingua programmata dell’India, che è rimasta allo stadio orale fino agli anni
Venti-Trenta del XX secolo, ma che è probabilmente radicata in India fin dal 4000-3500 a.C.
Attualmente conta 7,4 milioni di locutori;

il Mundari, parlato dalle tribù Munda, che conta circa 1,1 milioni di parlanti;

l’Ho è anche essa una lingua tribale parlata da circa 1,5 milioni di locutori.

Secondo Ethnologue sono 144 le lingue Mon-Khmer classificate, parlate da circa 90-100 milioni di
locutori. Esse possono essere così classificate:

• Khmeriche;
• Bahnariche;
• Moniche;
• Katuiche;
• Peariche;
• Khmuiche;
• Palaung-Wa;
• Khasiche;
• Vietiche;
• Aslian;
• Nicobaresi.
Le lingue Mon-Khmer
Il Khmerico è composto da due lingue: il Khmer centrale o standard, la lingua nazionale della
Cambogia, e il Khmer settentrionale, parlato nel sud-est della Thailandia. La prima, con 15 milioni di
parlanti, è la seconda lingua austroasiatica più grande dopo il vietnamita ed è una delle più antiche
lingue registrate del sud-est asiatico. Il secondo è parlato da 1,4 milioni di persone.

Il Bahnarico è un grande gruppo di lingue, parlato da circa un milione di persone, nel Vietnam
centro-meridionale, nel Laos meridionale e nella Cambogia orientale. Le lingue principali sono il
bahnar con 160.000 parlanti, lo sre (o koho) con 130.000, il mnong con 120.000 e il sedang con
100.000.

Il ramo Monico ha solo due lingue, Mon del Myanmar sudorientale e Thailandia centrale e Nyahkur
della Thailandia. Il numero di parlanti Mon riportati varia notevolmente, da 100.000 a un milione.
Mon possiede una lunga documentazione scritta, attestata per la prima volta nel regno di
Dvaravati. Quando fu distrutta dai Khmer nel X secolo, la maggior parte dei Mon emigrò
nell'attuale Myanmar. I pochi parlanti rimasti del Nyahkur sono i discendenti di quei Mon che
rimasero in Thailandia.
Le lingue Mon-Khmer

Le lingue katuiche sono parlate principalmente nel Laos meridionale e nelle regioni adiacenti del
Vietnam, oltre a sacche in Thailandia e Cambogia. Il numero totale di parlanti Katuico è di circa 1,5
milioni. Le lingue principali sono il Bru orientale (140.000) e il Ta'oih superiore (60.000) del Laos e
del Vietnam, il Kataang (110.000) del Laos, il Katu orientale (60.000) del Vietnam, il Sô (20.000) del
Laos e della Thailandia, il Kuy (500.000) del Thailandia e Cambogia.

Le lingue peariche della Cambogia occidentale e della Thailandia sudorientale sono parlate da
popolazioni molto piccole e sono tutte in via di estinzione.

Il ramo Khmuico è composto da circa una dozzina di lingue situate nel nord del Laos e nelle regioni
vicine della Thailandia e del Vietnam. Il Khmu con circa 600.000 parlanti è il più grande.

Le due dozzine di lingue Palaung-Wa sono sparse in tutto il Myanmar, nel nord della Thailandia, nel
nord del Laos e nella provincia cinese dello Yunnan. I due più importanti linguaggi, Wa con 1,4
milioni di parlanti e Palaung con, forse, 600.000, sono distribuiti in Myanmar e Yunnan.
Le lingue Mon-Khmer

Le lingue khasiche costituiscono un piccolo gruppo confinato quasi nella provincia di Meghalaya
nell'India nord-orientale. Includono il Khasi parlato da circa un milione di persone, il Pnar con
100.000 parlanti e il più piccolo War Jaintia diviso tra Bangladesh e Meghalaya con 30.000 parlanti.

Il ramo vietico è parlato in Vietnam con minoranze in Laos e Cambogia. Il primo linguaggio è il
vietnamita, la più grande lingua austroasiatica, con 79 milioni di parlanti, seguito dal muong con 1,3
milioni di parlanti e diverse lingue minori.

Oltre una dozzina di lingue asliane, parlate da quasi 100.000 persone, si trovano nelle catene
montuose della penisola malese e nelle sacche della Thailandia meridionale e peninsulare. I più noti
sono il Semai e il Temiar con rispettivamente 45.000 e 27.000 locutori.

Il nicobarese comprende una mezza dozzina di lingue in via di estinzione parlate da circa 25.000
persone nelle isole Nicobare, situate nell'Oceano Indiano orientale e appartenenti all'India.
Le lingue mon-khmer
Le lingue Tai-Kadai, o Kra-Dai o Kam-Tai

Il Tai-Kadai è un gruppo numeroso, di 91 lingue secondo Ethnologue, originario, probabilmente,


nell'area di confine tra la Cina sudorientale e il Vietnam settentrionale che si è diffuso attraverso la
migrazione nella maggior parte dei paesi del sud-est asiatico continentale.
La profondità temporale della famiglia è di circa due millenni. Un tempo si pensava appartenessero
al sino-tibetano, le lingue tai-kadai sono ora considerate una famiglia indipendente.
La famiglia Tai-Kadai predomina in Thailandia e nel vicino Laos, nonché nel Myanmar orientale. Ha
anche locutori nel nord del Vietnam, nel sud della Cina continentale e nell'isola di Hainan, al largo
della costa cinese, oltre a una manciata nell'India nord-orientale.
Le lingue Tai-Kadai sono divise in quattro rami:
Tai,
Kam-Sui,
Kra o Kadai e
Hlai,
più l'isolato Ong Be.
Il ramo del Tai è il più grande e ha la più ampia distribuzione con membri in Thailandia, Laos,
Vietnam, Myanmar, Cina e India. Gli altri rami e l’Ong Be sono limitati alla Cina meridionale e al
Vietnam del nord.
Le lingue Tai-Kadai, o Kra-Dai o Kam-Tai

Il nome "Kra–Dai" è stato proposto da Weera Ostapirat (2000), poiché Kra e Dai sono gli autonimi
ricostruiti rispettivamente dei rami Kra e Tai.
"Kra–Dai" da allora è stato utilizzato dalla maggior parte degli specialisti che lavorano sulla
linguistica del sud-est asiatico.
Il nome "Tai–Kadai" è usato in molti riferimenti, ma Ostapirat (2000) e altri suggeriscono che sia
problematico e confuso, preferendo invece il nome "Kra–Dai".
"Tai–Kadai" deriva da un'obsoleta biforcazione della famiglia in due rami, Tai e Kadai, proposta per
la prima volta da Paul K. Benedict (1942).
Nel 1942 Benedict collocò tre lingue Kra (Gelao, Laqua, o Qabiao, e Lachi) insieme all'Hlai in un
gruppo che chiamò "Kadai", da ka, che significa "persona" in Gelao e Laqua (Qabiao) e Dai, una
forma di un autonimo Hlai.
Le lingue Tai-Kadai, o Kra-Dai o Kam-Tai

Le lingue Tai si suddividono in Tai sudoccidentale, Tai Centrale e Tai settentrionale

Il Tai sudoccidentale è il gruppo più numeroso dell'intera famiglia, con oltre 67 milioni di parlanti.
Comprende le lingue nazionali della Thailandia (Thai) e del Laos (Lao), nonché una delle più grandi
lingue minoritarie del Myanmar (Shan). Il tailandese meridionale e il Kam Muang (tailandese del
nord) sono considerati dialetti del tailandese da alcuni studiosi e come lingue indipendenti da altri.
Si stima che i parlanti Thai siano 43 milioni, il Lao 4,3 milioni, lo Shan 4 milioni.. Inoltre, il Kam
Muang (Thai del Nord) e il Thai meridionale, forse dialetti del Thai, sono parlati rispettivamente da
8 e 4,9 milioni di locutori.

Il Tai centrale, parlato nel sud della Cina e nel nord del Vietnam, ha circa 8,5 milioni di parlanti.
Comprende lo Zhuang meridionale con 5,5 milioni di parlanti che vivono nella Cina meridionale, più
tre lingue esclusivamente nordvietnamite: Tày (1,5 milioni di parlanti), Nung (860.000) e Cao Lan
(145.000).

Il Tai settentrionale, comprende il Bouyei e lo Zhuang settentrionale, parlate a nord ea sud del
fiume Hongshui, nella Cina meridionale, rispettivamente da 3 e 10,5 milioni. Quest'ultimo è un
continuum dialettale, da non confondere con l'omonima lingua appartenente al gruppo Centrale. Il
Saek, generalmente trattata come una lingua del tai settentrionale, ma che mostra alcune
peculiarità fonologiche che la distinguono da tutte le altre lingue tai, aveva 25.000 altoparlanti nel
1990.
Le lingue Tai-Kadai, o Kra-Dai o Kam-Tai

Le Lingue Kam-Sui sono tutte parlate nel sud della Cina, da circa 2 milioni di persone. Includono
Dong (Kam) con 1.600.000 parlanti, Sui con 230.000, Mulan con 90.000, Maonan con 30.000,
Chadong con 20.000, Poi con 15.000, Mak con 10.000 e Ai-Cham con 2.700.

Le lingue Kra, conosciute anche come Kadai, sono un piccolo numero di lingue della Cina
meridionale e del Vietnam del Nord, parlate da circa 25.000 persone. Includono Lachi e Gelao nella
Cina meridionale e nel Vietnam del Nord con, rispettivamente, 10.000 e 7.900 parlanti, Buyang
parlato da 2.000 persone nella Cina meridionale e Laha con 1.400 parlanti nel Vietnam del Nord.

Le lingue Hlai, parlate nell'isola di Hainan, al largo della costa meridionale della Cina, includono Hlai
(Li) con 700.000 parlanti e Jiamao con 54.000.

L’ Ong Be, conosciuto anche come Lingao, è un isolato sulla costa settentrionale dell'isola di
Hainan. I locutori sono circa 600.000 persone.
Le lingue Kra-Dai o Tai-Kadai
Le lingue Hmong-Mien

La Hmong-Mien è una famiglia di 39 lingue secondo Ethnologue, parlate dai gruppi etnici Miao e
Yao nel sud della Cina e nel nord sud-est asiatico.
Sebbene condivida una serie di caratteristiche con le lingue della stessa area (cinese, tai-kadai e
mon-khmer), è considerato geneticamente non correlato ad esse.
Il nucleo dei parlanti Hmong-Mien vive nel sud della Cina, in particolare nelle province di Guizhou,
Guangxi, Hunan e Yunnan, con una presenza minore in Sichuan, Guangdong, Hubei, Jiangxi e
nell'isola di Hainan.
Durante il diciannovesimo e l'inizio del ventesimo secolo, si trasferirono nel nord del Vietnam, nel
Laos e nella Thailandia, pressati dall'espansione dei cinesi Han. Dopo la fine della guerra del
Vietnam, decine di migliaia di parlanti Hmong-Mien emigrarono in Francia, Stati Uniti e Australia.
La Hmong-Mien è divisa in due rami:

Hmongica o Miao in cinese, in cui le lingue principali sono il Hmong con 2,7 milioni di parlanti, il
Hmon (Miao) con 2,1 milioni di locutori e lo Xong (Qo Xiong) con 1 milione di parlanti.

Mienica o Yao in cinese, la cui lingua più importante è il Lu Mien con 900 mila locutori.

Le lingue Hmong-Mien
Le lingue siberiane

Oltre alle famiglie altaiche già menzionate (di cui il tungusico è oggi una famiglia minore della
Siberia), ci sono un certo numero di piccole famiglie linguistiche isolate parlate in tutta l'Asia
settentrionale.
Queste includono le lingue uraliche della Siberia occidentale (meglio conosciute per l'ungherese e
il finlandese in Europa), le lingue yenisei (legate al turco e alle lingue athabaske del Nord America),
lo Yukaghir, il Nivkh di Sakhalin, l’Ainu del Giappone settentrionale, il Chukotko-Kamchatkano nella
Siberia più orientale e l’eschimo-aleutino.
Alcuni linguisti hanno notato che le lingue coreane condividono più somiglianze con le lingue
paleosiberiane che con le lingue altaiche. Solo la microfamiglia Yeniseica, totalmente
indipendente, che contiene l'odierna Ket e diversi parenti estinti documentati, sembra veramente
autoctona della Siberia vera e propria.
Le lingue e le etnie siberiane

Potrebbero piacerti anche