T3. La diversitat lingüística en el món d'ara. Famílies lingüístiques. Les llengües romàniques i el català en la Romània
La diversitat lingüística constitueix un patrimoni cultural de la humanitat de valor incalculable. Segons les estimacions actuals, es parlen al món entre 6.000 i 7.000 llengües, depenent dels criteris emprats per distingir llengua de dialecte. El catàleg Ethnologue (SIL International) documenta 7.168 llengües en la seva edició més recent, mentre que el projecte Glottolog en registra més de 8.000, incloent-hi varietats històriques.
La distribució de les llengües és extremament desigual. Papua Nova Guinea, amb només 8 milions d'habitants, concentra més de 800 llengües, mentre que territoris molt més extensos en tenen molt poques. Aproximadament el 96% de les llengües són parlades per només el 4% de la població mundial. Per contra, les 10 llengües més parlades (xinès, espanyol, anglès, hindi, àrab, bengalí, portuguès, rus, japonès i panjabi) concentren gairebé la meitat dels parlants del món.
La mort de llengües és un fenomen accelerat: els lingüistes estimen que el 50-90% de les llengües actuals desapareixeran durant el segle XXI. Segons la UNESCO, una llengua s'extingeix cada dues setmanes. Les causes són múltiples: la globalització, la pressió de les llengües dominants, les polítiques assimilacionistes, els desplaçaments de població i la manca de transmissió intergeneracional. Una llengua es considera en perill quan els infants ja no l'aprenen com a primera llengua.
La diversitat lingüística no és només una qüestió cultural: les llengües codifiquen coneixements únics sobre el medi ambient, la medicina tradicional, les tècniques artesanals i les cosmovisions. La hipòtesi Sapir-Whorf, tot i les seves versions més matisades actuals, suggereix que cada llengua estructura d'alguna manera la percepció de la realitat. La pèrdua d'una llengua és irreversible i comporta la desaparició de tot aquest patrimoni immaterial.
Iniciatives com l'Any Internacional de les Llengües Indígenes (2019), la Dècada de les Llengües Indígenes (2022-2032) de l'ONU o projectes de documentació i revitalització intenten frenar aquesta erosió, però els recursos són escassos davant la magnitud del problema.
La lingüística comparada, desenvolupada al segle XIX, va establir que les llengües es poden agrupar en famílies segons el seu origen comú. Dues llengües pertanyen a la mateixa família si deriven d'un ancestre comú (protollengua) demostrable mitjançant correspondències fonètiques sistemàtiques i cognats (paraules amb origen comú).
La família indoeuropea és la més estudiada i la més estesa territorialment, incloent-hi les llengües majoritàries d'Europa, l'Iran, el Pakistan i el nord de l'Índia. El protoindoeuropeu, reconstruït per comparació, es parlaria fa uns 6.000 anys, probablement a les estepes pòntiques. Les branques principals són: romànica, germànica, eslava, cèltica, bàltica, indoirànica, hel·lènica, albanesa i armènia.
La família sinotibetana és la segona més nombrosa en parlants, incloent-hi el xinès mandarí (la llengua amb més parlants natius del món) i les llengües tibetobirmanes. La família afroasiàtica inclou l'àrab, l'hebreu, l'amazic (berber) i les llengües cuixítiques i txàdiques.
Les famílies ameríndies són nombroses i diverses: la classificació de Joseph Greenberg en només tres grups (esquimoaleutià, na-dené i amerindi) és controvertida; la majoria d'especialistes reconeixen desenes de famílies separades. Les llengües australianes aborigen, les papuanes i les africanes (níger-congo, nilosaharianes, khoisan) completen el panorama de la diversitat.
Existeixen també llengües aïllades, sense parentiu demostrat: el basc (euskera) a Europa, l'ainu al Japó, el burushaski al Pakistan, el coreà (tot i possibles vincles amb el japonès). El sumeri, l'etrusc i l'ibèric són llengües aïllades extingides. Les llengües criolles, sorgides de la criollització de pidgins, presenten genealogies complexes.
La tipologia lingüística complementa la classificació genètica estudiant les característiques estructurals: llengües aglutinants (turc, finès), flexives (llatí, rus), aïllants (xinès, vietnamita) i polisintètiques (moltes ameríndies).
Les llengües romàniques constitueixen una família de llengües derivades del llatí vulgar, la varietat oral i quotidiana del llatí emprada per les classes populars i els soldats de l'Imperi Romà. La romanització, procés de difusió de la llengua i cultura llatines, va substituir progressivament les llengües preromanes (ibèric, cèltic, etrusc) a la majoria de territoris de l'imperi occidental.
El llatí vulgar no era homogeni: presentava variacions regionals que, amb el temps i l'aïllament provocat per la caiguda de l'Imperi Romà (476 dC), van divergir fins a esdevenir llengües diferents. Els primers textos romànics apareixen a partir del segle IX: els Juraments d'Estrasburg (842) en romànic occidental (protofrancès) i germànic, les Glosses Emilianenses (segle X) amb anotacions en romanç hispànic i basc.
Les llengües romàniques actuals es classifiquen en dos grans grups: romànic occidental (portuguès, gallec, asturlleonès, castellà, aragonès, català, occità, francoprovençal, francès, retoromànic) i romànic oriental (italià, sard, romanès, dàlmata extint). Algunes classificacions afegeixen un subgrup iberoromànic i un gal·loromànic.
Els trets que diferencien el romànic occidental de l'oriental inclouen la sonorització de les oclusives sordes intervocàliques (ROTA > roda en occidental, ruota en italià) i el tractament de les palatals llatines. Dins del romànic occidental, el català comparteix trets amb l'occità (tractament de la A tònica llatina, plurals en -s) que l'apropen al gal·loromànic.
El procés de fragmentació del llatí vulgar va ser gradual. El concepte de "llengua pont" designa l'estadi intermedi en què encara hi havia intercomprensió entre varietats veïnes. La consciència de parlar llengües diferents es va desenvolupar paral·lelament a la formació dels regnes medievals i l'aparició de tradicions literàries pròpies.
La posició del català dins la Romània ha estat objecte de debat acadèmic des del segle XIX. Les principals propostes de classificació han oscil·lat entre la vinculació al gal·loromànic (occità, francès), la integració en l'iberoromànic (castellà, portuguès) o la consideració com a llengua pont entre ambdós grups.
Wilhelm Meyer-Lübke, en la seva Gramàtica de les llengües romàniques (1890-1902), classificava el català com una varietat de l'occità. Aquesta posició era compartida per altres romanistes com Friedrich Diez. El propi Pompeu Fabra, en la seva joventut, va considerar el català com una prolongació meridional de l'occità.
La reivindicació de la individualitat del català va ser defensada per Antoni M. Alcover i, especialment, per Ramón Menéndez Pidal en l'article "Sobre los límites del valenciano" (1908). Menéndez Pidal argumentava que, tot i les afinitats amb l'occità, el català havia desenvolupat una personalitat lingüística pròpia des de l'Edat Mitjana. Germà Colón ha estat el defensor més destacat de la posició del català com a llengua pont gal·loibèrica.
Des del punt de vista fonètic, el català comparteix amb l'occità (i en general amb el gal·loromànic) la conservació de la A tònica llatina (PRATU > prat, no prado), l'evolució dels grups consonàntics CL-, PL-, FL- (CLAMARE > clamar, no llamar), i la morfologia del plural en -s. Amb l'iberoromànic comparteix la diftongació de Ĕ i Ŏ tòniques en alguns contextos i trets lèxics.
La posició actual dels romanistes és majoritàriament favorable a considerar el català com una llengua romànica independent, amb afinitats especialment estretes amb l'occità dins del conjunt gal·loromànic, però amb trets específics que en justifiquen l'autonomia. L'Institut d'Estudis Catalans i la Secció Filològica han defensat sempre aquesta posició.
La formació del català, com la de totes les llengües romàniques, és el resultat de la interacció del llatí vulgar amb les llengües que el van precedir (substrat), les que s'hi van superposar (superstrat) i les que han conviscut al seu costat (adstrat).
El substrat preromà del català inclou elements de les llengües ibèrica (costa oriental), cèltica (interior) i basca (Pirineus). Tot i la dificultat d'identificar amb certesa les aportacions substràtiques, se'ls atribueixen alguns trets fonètics (com la suposada influència basca en el pas F- > h- en gascó, tot i que el català conserva la F-) i lèxic específic. Paraules com esquerra, barranc o bassa podrien tenir origen preromà. El suffix -arro/-erra (cigarro, xaparro) és considerat ibèric.
El superstrat germànic, resultat de les invasions del segle V i especialment del domini visigot (segle V-VIII), va deixar empremta sobretot en el lèxic: termes militars (guerra, guanyar, guaita), jurídics (alou, feu), onomàstica (noms com Guifré, Bernat, Arnau) i topònims (acabats en -encs). La influència germànica també s'ha relacionat amb canvis fonètics com la diftongació dels grups inicials llatins.
El superstrat àrab, resultat de la conquesta islàmica (711-801 al territori català), va ser menys intens que a la Península sud però va deixar un llegat lèxic notable: termes agrícoles (séquia, xaloc, alfàbia, sínia, sénia), domèstics (matalàs, catifa, rajola), toponímia (Benidorm, Alcanar, Almacelles). El català té menys arabismes que el castellà, però més que l'occità.
L'adstrat occità va ser decisiu en l'Edat Mitjana: la proximitat lingüística i cultural, els vincles polítics (comtats catalans vassalls del regne franc) i la influència dels trobadors van propiciar una interrelació intensa. El lèxic cortesà i literari medieval català presenta nombrosos occitanismes. L'adstrat castellà, intensificat a partir del segle XVI, ha aportat hispanismes a tots els nivells lingüístics, especialment en èpoques de minorització. L'adstrat francès ha influït sobretot des del segle XVIII, amb gal·licismes en àmbits diversos.