:+: Projecte LINGUATEC-IA: Xarxa transfronterera de cooperació tecnològica en intel·ligència artificial aplicada al llenguatge per a la construcció d'una infraestructura lingüística transpirinenca (2024-2026). Finançat per: Comunitat de Treball dels Pirineus. Interreg VI A. Entitat cap de projecte: Elhuyar Fundazioa. Nota de Premsa (aranès, occità ref, català).
Aquest projecte europeu transpirinenc i transfronterer estableix les bases per desenvolupar coneixement en intel·ligència artificial aplicable a les llengües amb pocs recursos dels dos costats dels Pirineus, i té l'objectiu d'aplicar nous models de llenguatge generatius en aquestes llengües
El processament del llenguatge és una poderosa eina per a les comunitats lingüístiques amb escassos recursos, que ajuda a revitalitzar la llengua i a promoure'n efectivament l'ús. És de vital importància per a aquestes llengües pujar a l'onada de la intel·ligència artificial, per no quedar-se enrere. La qualitat aconseguida en el processament del llenguatge natural no és a l'abast de totes les llengües, i la col·laboració és fonamental per desenvolupar nous recursos i eines lingüístiques. Cal incrementar l'esforç en innovació, apostant per la investigació en intel·ligència artificial aplicada al processament del llenguatge natural.
L'objectiu del projecte europeu LINGUATEC IA (Intel·ligència Artificial), cofinançat pel Fons Europeu de Desenvolupament Regional a través de la convocatòria Interreg POCTEFA (codi EFA 104/01), és desenvolupar coneixement en intel·ligència artificial sobre nous models de llenguatge generatius aplicables a llengües amb pocs recursos i la seva utilització per avançar en la digitalització de l'aragonès, català, basc i occità (llengües del territori POCTEFA) i en la construcció d'una infraestructura lingüística i intel·ligent transfronterera que faciliti la comunicació entre els parlants de les diferents llengües i l'accés multilingüe a la informació.
El consorci d'aquest projecte transfronterer —liderat per Elhuyar (a través del seu centre d’intel·ligència artificial Orai) i constituït per Lo Congrès Permanent de la Lenga Occitana, HITZ zentroa (UPV/EHU), Universitat Jean Jaures de Tolosa, Universitat de Perpinyà, IKER-CNRS de Baiona, Govern d'Aragó i la Universitat de Lleida— ha establert les bases de treball en la seua reunió inicial celebrada el 15 de gener a Usurbil. El consorci està format per “entitats d'alt nivell que componen una comunitat científica al voltant de les sis llengües dels Pirineus, amb l'objectiu de recuperar-les i revitalitzar-les”, afirma Josu Aztiria, coordinador del projecte LINGUATEC. Aquest projecte “contribueix a l'articulació social i cultural del territori transfronterer, reforçant un element clau de la cultura local, les llengües”, afegeix.
En aquest sentit, les entitats participants en el projecte treballen ja en diferents àmbits relacionats amb el processament del llenguatge, com és el desenvolupament de nous algorismes i arquitectures neuronals adaptats a situacions de còmput i recursos lingüístics limitats. Així mateix, “volem millorar els sistemes de transcripció, traducció automàtica neuronal i síntesi de veu del basc, català, occità, aragonès i les seves variants dialectals, que combinin amb el francès i l'espanyol –assenyala Aztiria–, i també desenvolupar una plataforma lingüística multilingüe de subtitulació i doblatge automàtic”. A més, “hem previst crear una plataforma o repositori en línia amb tots els recursos, tecnologies i aplicacions que desenvolupem per a les llengües dels Pirineus”, afegeix.
Les entitats que componen aquest projecte creuen que el seu treball serà de gran ajuda “tant per a la comunitat investigadora i professional que treballa en l'àmbit de les llengües i la seua digitalització, com per a les entitats públiques i privades que podran millorar els seus serveis i fer-los accessibles a diferents idiomes”, i s'enorgulleixen de “proporcionar a la ciutadania recursos i eines vàlides que ajudin a comunicar-se més fàcilment en un entorn multilingüe”.
El projecte LINGUATEC IA no és pas un projecte que neix ara. Es tracta d'un projecte que recull el testimoni de LINGUATEC, projecte previ cofinançat amb fons POCTEFA, ja finalitzat, en què després de tres anys de camí, i l'alt nivell de desenvolupament assolit. les entitats sòcies van fer un pas de caràcter estratègic i van consolidar una xarxa d’excel·lència en intel·ligència artificial per a la construcció d'una infraestructura lingüística transfronterera.
:+: Projecte AMRELSE: Alta minortizació i reproducció lingüística al sud-oest europeu (2022-2026). Finançat per: Ministeri de Ciència i Educació.
El punt de partida del projecte és l'anàlisi del procés de reproducció (Nelde, Strubell, i Williams 1996) en el nucli familiar de les llengües històricament minoritzades. Amb les seues orientacions lingüístiques globals i amb les seves microdecisions quotidianes, les famílies estableixen en bona part quines llengües (no) es parlen, se senten, i fins i tot en molts casos es llegeixen i escriuen en una multitud d'ocasions de la vida privada, i són les famílies les qui determinen en bona part els processos d'aprenentatge lingüístic i les vinculacions emocionals amb les llengües dels seus membres (Boix-Fuster, Bastardes-Boada, i Torrens 2019; Curdt-Christiansen i Huang 2020; Llança i Lomeu Gomes 2020). No debades el terme llengua materna és sovint equiparat, en la vida quotidiana, no només a llengua inicial, sinó també a llengua dominant, preferida o d'identificació (Rampton 1990). La família, responsable de la socialització primària, constitueix per tant una institució crucial per als processos de reproducció de les llengües històricament minoritzades, fins al punt que les diferents escales que mesuren el grau d'amenaça per a la supervivència d'aquestes llengües estipulen que la transmissió intergeneracional en família és un dels indicadors bàsics per a distingir entre llengües segures i llengües en perill (Fishman 1991, 2001; Lewis i Simons 2010; UNESCO Ad hoc Expert Group on Endangered Languages 2003). Entendre les dinàmiques lingüístiques familiars constitueix, doncs, un element crucial per a comprendre les perspectives de (no) reproducció de totes les llengües, però molt especialment de les llengües autòctones històricament minoritzades, ja que si alguna cosa caracteritza la minorització lingüística és precisament el fet que les llengües que l'experimenten són per definiciós llengües parcials, és a dir, llengües privades del suport de cert nombre d'institucions socials rellevants en la producció i reproducció lingüística (Lamuela 1994; 2004). És per això que aquest projecte centra la seua atenció en les dinàmiques lingüístiques que es desenvolupen en les unitats lingüístiques familiars, concebent aquestes com un element central de la capacitat de reproducció de les llengües analitzades, que són (indiquem en parèntesi els indrets on fem observació):
Català (Catalunya Nord, Andorra, Àrea de Barcelona, Franja, Castelló de la Plana, València, Alacant), occità (Aran, estat francès, valls occitanes d'Itàlia), aragonès (Saragossa, Echo), Gallec (àrea urbana, àrea semiurbana), Basc (Vitòria, Bilbao).
:+: Projecte InSitu Memòria del paisatge (2023). Finançat per: Xarxa Vives d’Universitats-Institut Ramon Muntaner.
L’esperit del Projecte InSitu és recollir allò que els indrets diuen (o allò que ens en diuen). Portar-ho a la cartografia, preservar-ho com a coneixement col·lectiu que és. Aquest projecte naix de l’etnolingüística però obre finestres a un ventall molt ampli de disciplines. En essència, vol ajudar a preservar la memòria dels llocs com a adob del territori.
:+: Assessorament ath Conselh Generau Participacion en Conselh Consultatiu der Aranés, organ d’assessorament tara planificacion lingüistica der occitan aranés.