Este servizo contén varios demostradores que exemplifican algunhas das posibilidades de uso dos modelos vectoriais para o galego (ortografía ILG/RAG). Inclúe modelos contextualizados, que xeran representacións diferentes para cada palabra en función do contexto, e modelos estáticos, que representan os diferentes sentidos dunha palabra nun mesmo vector. Os demostradores son os seguintes:

Todos os modelos foron adestrados de maneira non supervisada usando grandes corpus, polo que poden conter formas non estándar, erros ortográficos, etc. O demostrador dos modelos contextualizados está implementado coa libraría transformers da HuggingFace https://github.com/huggingface/transformers, e os dos modelos estáticos con gensim https://radimrehurek.com/gensim/ (Radim & Sojka, 2010).

Os modelos BERT poden descargarse aquí: pequeno https://zenodo.org/record/4481575 e estándar https://zenodo.org/record/4481591. O modelo fastText pode descargarse aquí https://zenodo.org/record/4481614.

Se usas este servizo ou algún dos modelos para o galego podes citar este traballo:


Referencias