Informe europeo advirte do perigo para o galego na era dixital

Actualmente “hai unha cantidade bastante reducida de produtos, tecnoloxías e recursos deseñados para o galego” no ámbito das tecnoloxías lingüísticas. Esta é unha das conclusións de Carmen García Mateo e Montserrat Arza Rodríguez, investigadoras da Universidad de Vigo, no informe ‘O idioma galego na era dixital’ (‘The Galician Language in the Digital Age’), un estudo publicado en galego e inglés sobre o presente e futuro do noso idioma a través das tecnoloxías da información e da comunicación.

A publicación forma parte da Serie de Libros Brancos (White Paper Series) que a Rede de Excelencia da Comisión META-NET adica a 31 linguas europeas. Editada por Georg Rehm e Hans Uszkoreit, esta serie de textos foi financiada polo Sétimo Programa Marco e o Programa de apoio ás TIC (ICT Policy support programme) da Comisión Europea, e ten como obxectivo fomentar o coñecemento sobre a tecnoloxía lingüística e o seu potencial entre xornalistas, políticos, comunidades lingüísticas, profesores de idiomas e público en xeral.

‘O idioma galego na era dixital’ é unha análise das tecnoloxías da lingua, aplicacións e solucións para a nosa lingua. O informe advirte da necesidade de ter dispoñible unha tecnoloxía lingüística para todas as linguas europeas, que sexa economicamente alcanzable e que se atope perfectamente integrada dentro duns ámbitos informáticos máis amplos para acadar unha experiencia interactiva, multimedia e plurilingüe dos usuarios.

Ante o perigo de que a globalización se converta nun “mecanismo que promova o abandono do noso rico patrimonio lingüístico e cultural (…) a favor dunha lingua franca”, as autoras propoñen traballar na procura de “formas de comunicarnos co mundo ao mesmo tempo que preservamos a nosa propia lingua e, con iso, a nosa identidade cultural”.

A clave para as investigadoras da Universidade de Vigo está no desenvolvemento de “tecnoloxías facilitadoras” da lingua e fala, mais consideran que as dispoñibles actualmente no mercado non satisfacen as necesidades dos usuarios que se comunican en galego.

“Optimismo cauto”

Segundo as autoras, “o galego é unha das linguas da Unión Europea que necesita aínda máis investigación para que as solucións das tecnoloxías da linguaxe cheguen a ser verdadeiramente eficaces e poidan ser empregadas para un uso diario”.

Neste volume, García Mateo e Arza Rodríguez abordan os riscos aos que se enfronta o galego na era dixital, os retos para a tecnoloxía lingüística aplicada ao noso idioma, a situación da lingua galega na sociedade europea da información e o apoio que recibe a tecnoloxía lingüística para o galego.

As autoras falan dun “optimismo cauto” cando se refiren á situación do galego no que se refire ao apoio das tecnoloxías lingüísticas. E advirten de que “é preciso centrar máis esforzos na creación de recursos para o galego, así como na investigación, innovación e desenvolvemento”.

Para a súa diagnose elaboraron a seguinte táboa que proporciona unha visión xeral da situación actual do apoio das tecnoloxías lingüísticas para o idioma galego. A valoración dos recursos e ferramentas existentes está baseada en estudos estimados levados a cabo por expertos, que empregaron os seguintes criterios (comprendidos entre 0 e 6).

Para o galego, os principais resultados que atoparon as autoras en relación ás tecnoloxías e recursos son os seguintes:

  • O procesamento da fala actualmente parece estar máis desenvolvido có procesamento do texto escrito. As tecnoloxías de acceso á información avanzada aínda se atopan nos seus comezos e, para o caso do galego en particular, apenas existen.
  • Canto máis coñecemento lingüístico e semántico inclúe unha ferramenta, máis carencias aparecen (véxase, por exemplo, a recuperación de información contra a semántica textual) e son necesarios máis esforzos para dar apoio ao procesamento lingüístico exhaustivo.
  • A investigación tivo éxito á hora de deseñar software de alta calidade, pero moitos dos recursos carecen de estandarización, é dicir, mesmo se existen, non sempre teñen a sostibilidade necesaria; precísanse iniciativas e programas concertados para estandarizar os datos e os formatos de intercambio.
  • Para o galego existe un amplo corpus textual de referencia (cunha mestura equilibrada de diversos xéneros), así como outros corpus especializados, mais estes non son facilmente accesibles nin baratos.
  • Aínda que existen algúns corpus específicos de alta calidade, non se dispón dun corpus extenso anotado sintacticamente.
  • Existen moi poucos corpus anotados con información sintáctica, semántica ou discursiva e, polo tanto, a situación empeora cando se precisa información lingüística e semántica máis profunda.
  • O procesamento da fala está actualmente máis desenvolvida ca o PLN para os textos escritos.
  • Existen corpus paralelos entre o galego e o español, e estes foron empregados para o desenvolvemento de sistemas de tradución automática. Non obstante, hai unha ausencia de corpus paralelos entre o galego e outras linguas.
  • Os datos multimedia constitúen tamén unha enorme carencia.

O galego na sociedade da información

A situación do galego na chamada sociedade de información non semella ser a máis idónea para a súa superviviencia. Sobre a presenza do galego na Internet, se ben as autoras consideran que “é bastante limitada”, salientan a existencia dalgunhas iniciativas que “intentan aumentar a presenza do galego na web”, como por exemplo a Galipedia (a Wikipedia en galego), que “con máis de 75.000 artigos está ao mesmo nivel que algúns idiomas oficiais da UE como o grego ou o letón”, explican.

Outro exemplo é a iniciativa PuntoGal, que “intenta obter un dominio na Internet para o idioma e a cultura galegos”, indican as investigadoras da Universidade de Vigo, que consideran que “a través deste dominio, a sociedade galega pasaría a ter máis visibilidade na rede e en todo o mundo”.

Tamén lembran que “Google ou Facebook, entre outros, ofrecen unha versión en galego para as súas interfaces de navegación”. Mais de Twitter, que vén amosando o seu desprezo ao galego ao ignoralo, non se fan mencións.

García Mateo e Arza Rodríguez tamén fan referencia ao labor do goberno autonómico, que “levou a cabo algunhas iniciativas para dar apoio á creación de páxinas web en galego”, din as autoras, que salientan proxectos como Mancomún, que “ofrece unha serie de ferramentas informáticas gratuítas en galego creadas coa axuda da Xunta de Galicia” e que puxo en marcha proxectos como Galinux, “unha distribución GNU/Linux en galego deseñada para finalidades educativas”, destacan as investigadoras.

No sector da edición de libros en galego, observan que este “incrementou de forma moi notable” as publicacións, “pasando de 187 títulos editados en galego en 1980 a 1.826 no 2005”, indican. Con todo, “hai que sinalar algúns problemas, como a abraiante presenza da edición institucional, a excesiva atomización das empresas editoras galegas e a perigosa dependencia do mercado escolar”, advirten.

Ben distinta é a saúde da nosa lingua nos xornais. As investigadoras falan da escasa presenza nos diarios tradicionais e da inexistencia de medios escritos integramente en galego: “Actualmente non hai ningún xornal integramente escrito en galego. En algúns o idioma non está totalmente ausente, aínda que si arrecunchado na información cultural e nas columnas de colaboradores”, explican as autoras.

Paradoxalmente, este estudo sobre a situación do galego na era dixital apenas lle dedica unhas exiguas palabras aos diarios electrónicos e non afonda neste sector estratéxico para a supervivencia do galego na sociedade rede. Nin mencións a ningún diario electrónico nin valoración dos seus proxectos. Só unhas breves e insubstanciais palabras: “A web tamén ofrece cada vez un maior número de xornais dixitais en galego (ou xornais españois que contan cunha ferramenta de tradución ao galego), así como algúns cursos en liña para a aprendizaxe do idioma”, describen con levidade.

Conclusións

O informe conclúe que se ben en Galicia existe unha comunidade investigadora en tecnoloxías da lingua que conta co apoio de programas de investigación que deron froitos en forma de recursos e tecnoloxías de última xeración para o galego, “o alcance destes recursos e a variedade de ferramentas son aínda moi limitados en comparación cos recursos e ferramentas dispoñibles no caso da lingua española (e obviamente para o idioma inglés), e simplemente non son suficientes en calidade e cantidade para desenvolver o tipo de tecnoloxías necesarias que permiten apoiar unha sociedade do coñecemento verdadeira mente plurilingüe”, argúen as autoras.

De feito, o estudo alerta de que “a industria galega das tecnoloxías da linguaxe dedicada a transformar a investigación en produtos é actualmente moi pequena” xa que “a maioría de empresas grandes pararon a súa actividade ou ben reduciron drasticamente os seus esforzos en tecnoloxías da lingua”.

META-NET

META-NET é unha Rede de Excelencia financiada parcialmente pola Unión Europea. Foi lanzada o 1 de febreiro de 2010 e ten tres liñas de acción: META-VISION, META-SHARE e METARESEARCH.

Actualmente está formada por 60 centros de investigación que representan a 34 países europeos. Un dos seus proxectos é META, a Alianza Tecnolóxica Plurilingüe de Europa, unha crecente comunidade de organizacións e profesionais das tecnoloxías lingüísticas en Europa. META-NET dedícase a fomentar os fundamentos tecnolóxicos para establecer e manter unha verdadeira sociedade plurilingüe.

Esta rede traballa en colaboración con compañías de software, provedores de tecnoloxía e usuarios, axencias gobernamentais, organismos de investigación, organizacións non gobernamentais, asociacións e universidades europeas. Xuntamente con elas, META-NET está a crear unha visión da tecnoloxía común e unha axenda de investigación estratéxica para a Europa multilingüe do 2020.

Descarga o informe aquí.

Fonte: Galicia Confidencial