
Juventud Técnica
June 2, 2025 at 07:37 PM
#jt60años | 📲🪇 Cecilia es una familia de modelos lingüísticos preentrenados continuamente con texto escrito cubano, que capturan las particularidades lingüísticas, culturales y sociales del español cubano.
🤝 Este modelo cubano es desarrollado por el Grupo de Investigación en Inteligencia Artificial (GIA-UH) de la Universidad de La Habana, con la colaboración del Grupo de Procesamiento del Lenguaje y Sistemas de Información (GPLSI) de la Universidad de Alicante y el apoyo de Syalia SRL y Epistemial.
📳 Cecilia Tiny se preentrenó continuamente durante dos épocas completas con un corpus privado de aproximadamente 1000 millones de tokens de texto escrito cubano, que incluye:
- 10 años de los periódicos cubanos más relevantes.
- La Enciclopedia Cubana (ecured.cu).
- La colección completa de leyes cubanas.
- Más de 400 obras literarias cubanas importantes.
- Varias enciclopedias locales que documentan cubanismos y elementos culturales.
- Cientos de letras de canciones de cantantes cubanos populares.
Próximamente daremos más detalles 😉

❤️
3