Llengües minoritzades del Pirineu en l’era digital – Mercè Feliu i Cuberes

Imatge seminari Sobirania digital-tecnològica, pobles i llengües minoritzades celebrat a la Universitat de LleidaEls dies 9 i 17 d’octubre passats se celebrà a la Universitat de Lleida el seminari Sobirania digital-tecnològica, pobles i llengües minoritzades, organitzat pel Centre Internacional Escarré per a les Minories Ètniques i les Nacions (CIEMEN) –en el marc del projecte Som Part–, per la Fundació pels Drets Col·lectius dels Pobles, i pel Departament de Filologia i Comunicació de la Universitat de Lleida. Aquest seminari és la continuació del que se celebrà a l’abril a la Universitat de Barcelona (en podeu llegir la crònica en aquest mateix blog). Mitjançant la participació de quatre experts vinculats a les ciències del llenguatge i de la comunicació, s’hi exposà el paper de la tecnologia en la conservació de les llengües minoritzades i, més concretament, de quatre llengües del Pirineu –el català, la llengua de signes catalana (LSC), l’occità (i la seua varietat aranesa) i l’aragonès.

La inauguració i la presentació dels ponents anà a càrrec d’Helena Torres Purroy, professora del Departament de Filologia i Comunicació de la Universitat de Lleida i membre del Grup de recerca en transformacions en els mitjans audiovisuals i les seves implicacions en el desenvolupament polític, cultural i social (TRAMA). El seminari comptà amb quatre comunicacions distribuïdes en dues jornades. Les dues ponències del 17 d’octubre foren interpretades en LSC de la mà de l’associació Deixa’ns Signar.

L’aranès i l’aragonès, per Ryan Furness

La jornada de dijous 9 d’octubre s’inicià amb la ponència de Ryan Furness titulada “Claus del desenvolupament d’eines digitals per a dues llengües minoritzades: l’aranès i l’aragonès“. Furness és lingüista, autor del Diccionari occitan (aranés)-anglès (2006) i creador de l’avantprojecte d’eines digitals per a l’aranès i l’aragonès. La seua intervenció començà amb un toc d’humor: passà de parlar un castellà macarrònic a un català estàndard en la modalitat central.

Furness, primerament, exposà algunes iniciatives pròpies, com és el cas del diccionari bilingüe d’aranès i anglès a què ens hem referit anteriorment, o el conjugador de verbs en aranès (que passarà de 3.000 a 6.000 verbs el 2026). Explicà que durant l’elaboració d’aquestes eines, topà amb una dificultat afegida: li havia costat trobar el lèxic en textos aranesos i en el diccionari que hi havia fins aleshores de Frederic Vergés, de 7.000 mots. La seua obra bilingüe assolí 12.000 paraules. La reacció de la població aranesa fou de sorpresa: hi havia mots que no havien vist mai escrits. Furness contribuí a establir la codificació de la llengua.

   Es reflexionà sobre quins materials, recursos i eines digitals poden necessitar els parlants i aprenents d’una llengua.

Seguidament, i a partir de la participació del públic, es reflexionà sobre quins materials, recursos i eines digitals poden necessitar els parlants i aprenents d’una llengua. L’auditori tingué en compte l’accés a activitats i a obres normatives. A continuació, el ponent explicà que els diccionaris d’aprenentatge poden ser monolingües o bilingües, estan fets per a grups específics d’aprenents i poden contenir exemples d’ús, notes de gramàtica, etc. L’obra publicada per aquest autor el 2006 tingué en compte aquestes consideracions, atès que està pensada per als aranesos i hi ha notes i exemples d’ús de l’anglès i l’aranès.

En el cas de l’aragonès, Furness s’encarregà de la versió anglesa de l’obra digital DicAra. Es tracta d’un diccionari multilingüe de 94.000 lemes, en aragonès, català, castellà i anglès, que proporciona la traducció, exemples d’ús i paraules semblants.

Un diccionari en línia, insistí Furness, no s’hauria de limitar a reproduir un diccionari imprès en format PDF. Hauria de tenir un valor afegit: l’accés a cerques avançades, a usos contextualitzats i a imatges i àudios. Els assistents assenyalaren que el diccionari digital ideal potser també hauria d’incloure sinònims, variants dialectals i informació sobre la zona on s’usa cada terme.

Furness clogué la ponència parlant de la intel·ligència artificial (IA): una revolució, una oportunitat i una amenaça. La tecnologia del model de llenguatge gran (large language model, LLM) adquireix un idioma mitjançant la lectura de bilions de textos publicats a internet i n’aprèn els patrons. Amb més dades té més bon rendiment. Per això, la IA té dificultat a respondre en una llengua minoritzada. Per demostrar-ho, feu una pregunta en aranès a aquesta plataforma i n’avaluà la qualitat de les respostes generades.

En el torn de preguntes es parlà del finançament, la coordinació d’esforços i l’autoria darrere els diccionaris digitals de les dues llengües tractades en la comunicació: l’aranès i l’aragonès.

L’occità, per Benoît Dazéas

Després de la pausa, la jornada continuà amb la ponència de Benoît Dazéas titulada “La vitalitat de l’occitan e las tecnologies de la lenga. Fuèlha de rota digitala 2024-2028”, que fou pronunciada en gascó. Dazéas és historiador, responsable del projecte APORLÒC (Associacion Prefigurativa de l’Organisme de Regulacion de Lenga d’Òc) i director de Lo Congrès permanent de la lenga occitana.

   Només el 7 % dels habitants de la població del territori de parla occitana parla la llengua d’oc.

Dazéas adverà que només el 7 % dels habitants de la població del territori de parla occitana parla la llengua d’oc –partint de les dades de 2020 de l’Ofici Public de la Lenga Occitana (OPLO). No contribueix a la normalització lingüística d’aquesta llengua el fet que l’occità es compon de sis varietats i que no hi ha un estàndard difós i acceptat. Amb la finalitat d’incidir en l’agermanament de les seues varietats, es creà Lo Congrès permanent de la lenga occitana –i el seu avantprojecte APORLÒC.

Lo Congrès és l’organisme interregional i transfronterer encarregat de la regulació lingüística de l’occità, de la codificació de la llengua, de la recerca aplicada i de la producció digital dels recursos i eines que ajuden a connectar l’idioma amb la societat actual. Algunes de les seues iniciatives, seguint Dazéas, són les que exposem a continuació.

El Dicodòc, multidiccionari occitan (2012) aglutina diferents obres de consulta: fins a vint diccionaris monolingües i bilingües (d’occità i francès); un diccionari de sinònims; un conjugador verbal; un apartat d’expressions i refranys; una base de dades terminològica; topònims; un corpus amb literatura clàssica i contemporània, i un “laboratori” lèxic. Tanmateix, assenyalà, no s’hi recullen obres d’estudi de la llengua. Hi ha previst d’incorporar-hi més dades per al públic francòfon i, a poc a poc, per a l’aranès i el català.

La Huella de rota entau desvolopament numeric de l’occitan (2014) és un document marc que avalua l’estat dels recursos accessibles en línia. Conté un inventari d’eines i n’assenyala les mancances –com la traducció instantània o els teclats predictius. Aquesta iniciativa sorgí com a resposta a l’estudi dut a terme per META-NET, una xarxa de recerca que analitzà la situació tecnològica de trenta llengües i advertí d’una fractura creixent entre llengües. L’estudi concloïa que si no es disposava del desenvolupament tecnològic necessari, algunes llengües acabarien destinades a l’extinció digital.

Una altra eina, Revirada, és un traductor automàtic en línia gratuït. I finalment, la Farga numerica és un portal dedicat als recursos i tecnologies lingüístiques de què disposa l’occità. El 2026 està previst d’introduir-hi el reconeixement de la parla, pensat, especialment, per subtitular vídeos.

En el torn obert de paraula, es demanà en quin estàndard de l’occità solien traduir i subtitular els textos. Dezéas explicà que com que no hi ha un estàndard unificat, les eines digitals són homogènies i opten per una única varietat no representativa, que obvia les varietats de l’occità. La solució proposada per Lo Congrès és precisament oferir aquestes eines digitals en diverses varietats, com el gascó, el llemosí, el llenguadocià, el vivaroalpí i el provençal. I en el marc del projecte europeu Linguatec-IA, estan treballant amb la Universitat de Lleida per desenvolupar aquestes eines també en la varietat aranesa.

El català, per Gerard Vélez

La jornada de divendres 17 començà amb la ponència de Gerard Vélez titulada “El repte de viure plenament en català en l’àmbit digital”. Vélez és estadístic, transformador digital i director de projectes d’Accent Obert.

L’objectiu d’Accent Obert, hereva de Fundació.cat, és vetllar perquè els catalanoparlants puguem viure en català en l’entorn digital. Es creà com un patronat format per entitats culturals, tecnològiques i lingüístiques dels territoris de llengua catalana: Òmnium, Amical Wikimedia, Corporació Catalana de Mitjans Audiovisuals, Associació de Mitjans d’Informació i Comunicació, FemCat, Acció Cultural del País Valencià, Cercle Tecnològic, Coordinadora de Centres d’Estudis de Parla Catalana, FC Barcelona, Institut d’Estudis Catalans, Internet Society Capítol Català, Obra Cultural Balear i Xarxa Vives.

   Accent Obert gestiona infraestructures digitals, defensa drets –en concret, la privacitat, la neutralitat i la pluralitat digitals–, promou la creació de projectes en català i facilita eines per operar en línia en català.

Accent Obert gestiona infraestructures digitals, defensa drets –en concret, la privacitat, la neutralitat i la pluralitat digitals–, promou la creació de projectes en català i facilita eines per operar en línia en català. Segons Vélez, els projectes de l’entitat s’orienten a actuacions diverses: han desenvolupat el domini .cat, que compta amb 113.600 dominis registrats i una taxa de renovació del 86,62 %; actuen per millorar la visibilitat del català als cercadors de Google, mitjançant l’anàlisi d’algoritmes; col·laboren en iniciatives que aposten per una digitalització democràtica en català; realitzen cursos i xarrades amb la finalitat de sensibilitzar la ciutadania; aposten per la creació de continguts en català –a través de la plataforma Llista, els Premis Crit i la recentment inaugurada Casa de Creació Digital en Català, i també han desenvolupat –en col·laboració amb Softcatalà– un catàleg d’eines que faciliten l’ús del català a la xarxa, Galàxia. En la data de la ponència hi havia 306 eines catalogades. Finalment, Accent Obert està estudiant l’impacte de la IA sobre la llengua, gràcies a una beca de la ICANN. De moment –i amb el suport de tres empreses més–, està treballant per incorporar el català a una eina d’interacció tàctil per a la gent gran (Bleta) i un suport a la conducció (Gandolapp).

Manllevant els mots de Vélez, és possible un “futur amb veu pròpia, amb el nostre accent”. El ponent conclogué afirmant que viure en català és també una tasca de tots: cada clic, cada cerca, cada eina emprada suma en aquest camí.

La llengua de signes catalana (LSC), per Aida Villaécija

Tancà la jornada i el seminari Aida Villaécija amb la ponència titulada “El dret a signar en l’àmbit digital: eines, recursos i diccionaris de la llengua de signes catalana (LSC)”. Villaécija és lingüista i traductora, especialista en llengua de signes, membre del grup de Recerca TransMedia Catalonia de la Universitat Autònoma de Barcelona i col·laboradora de l’Institut d’Estudis Catalans en la creació del primer corpus de la llengua de signes catalana. La ponent es presentà amb descripció per a persones cegues i signà el seu nom per als assistents amb problemes d’audició.

Villaécija subratllà que la LSC és una llengua natural amb estructures pròpies, diferents plans d’articulació –com el pla frontal, el pla mitjà sagital i el pla horitzontal– i una gramàtica: la Gramàtica bàsica, que recull les dades en llengua oral i en llengua de signes. És, també, una llengua independent del català, i s’empra a Catalunya i a Menorca. A la resta de zones de parla catalana s’usa la llengua de signes castellana. Tanmateix, no és un idioma oficial. És una llengua minoritària i minoritzada, legalment reconeguda a Catalunya a partir de la Llei 17/2010, del 3 de juny, de la llengua de signes catalana.

   Actualment, es disposa d’un corpus de la LSC amb variació generacional, territorial, de gènere i tipus de discurs. Aquesta font té aplicacions en lexicografia, normativa, ensenyament, estudis socioculturals, recerca lingüística i processament automàtic.

La tecnologia ha permès documentar-la millor. Originalment, en paper, era molt complicat de fer, atès que les llengües de signes no compten amb un sistema d’escriptura propi d’ús generalitzat. Alguns autors n’havien publicat obres en sistemes de transcripció –com ara imatges, dibuixos (sign writting), símbols (stokoe) o representacions (HamNoSys). Actualment, es disposa d’un corpus de la LSC amb variació generacional, territorial, de gènere i tipus de discurs. Aquesta font té aplicacions en lexicografia, normativa, ensenyament, estudis socioculturals, recerca lingüística i processament automàtic.

Seguidament, Villaécija presentà algunes de les eines amb què compten els signants en LSC. Visual signals in language technologies és un projecte que està desenvolupant avatars generats per IA que interpreten en llengua de signes. En l’àmbit digital educatiu i administratiu es disposa de Signem (guia bàsica per a la comunicació signada en LSC per a persones de llengua oral), Crea-LSC (recurs per practicar l’oralitat i la prosòdia), Introducció a la LSC i la comunitat sorda (per al sector públic de l’administració), Vocabulari bàsic de la llengua de signes catalana, Signapp (aplicació que conté glossaris específics en LSC), i MicroNanoQuantum #LSC (canal de YouTube de difusió de les STEM en LSC). En l’àmbit audiovisual i lúdic es disposa de les eines següents: Aimada LSC (canal de YouTube amb vídeos de caràcter social i cultural), interpretació de contes en llengua de signes catalana, Antologia de poesia catalana en LSC (canal de YouTube) i vídeos explicatius en museus –és el cas del Museu d’Història de Catalunya. En la recerca, hi ha classes interpretades i resums en LSC –un exemple el trobareu en la seua tesi doctoral.

En el torn de paraules es demanà pels components bucals. Villaécija explicà que apareixen en la gesticulació de la boca i permeten que l’expressió estigui ben signada. Es preguntà, també, si hi havia dialectes, i la ponent respongué que en tenen hipòtesis, però no evidències científiques.

Així doncs, el seminari Sobirania digital-tecnològica, pobles i llengües minoritzades tractà diferents estratègies que creen i difonen eines i materials lingüístics en línia. Aquests projectes requereixen suport institucional i compromís ciutadà. Si ambdós pols treballen plegats, les llengües minoritzades poden bastir un futur tecnològic amb veu pròpia. Podeu consultar a YouTube les quatre ponències enregistrades.

Mercè Feliu i Cuberes
Universitat Autònoma de Barcelona, Grup de Recerca en Història de la Llengua Catalana de l’Època Contemporània (GRHILCEC)

Deixa un comentari