Ucrania está desarrollando su propio modelo lingüístico extenso (LLM) con tecnología de Google. Este modelo se entrenará para comprender adecuadamente el contexto, los dialectos y las lenguas minoritarias del Ucrania.
El entrenamiento se realizará primero con la infraestructura de Google antes de pasar a los servidores locales. Los funcionarios prevén ciberataques tras el lanzamiento y están preparando defensas contra amenazas como la inyección inmediata.
Ucrania está desarrollando un gran modelo lingüístico utilizando el framework Gemma de código abierto de Google. El país aspira a crear un sistema de inteligencia artificial totalmentedent para uso militar y civil.
El Ministerio de Tecnología Digital de Ucrania y el operador móvil Kyivstar anunciaron el proyecto el lunes. Este utilizará la infraestructura informática de Google para el entrenamiento inicial antes de migrar completamente a la infraestructura local, garantizando así que Ucrania mantenga el control total sobre los sistemas de IA a los que sus 23 millones de ciudadanos pueden acceder diariamente.
Tras una exhaustiva evaluación, se seleccionó a Google para el proyecto. Los modelos Llama de Meta y Mistral AI de Francia también se consideraron entre las opciones, según fuentes familiarizadas con la decisión, según un informe de Reuters.
Los modelos en idioma chino, incluidos DeepSeek y Qwen, también fueron rechazados para el proyecto.
El ejército ucraniano ya utiliza herramientas de IA para reconocimiento aéreo y satelital, operaciones con drones y análisis del campo de batalla.
Oleksandr Bornyakov, viceministro de transformación digital de Ucrania, explicó que evitar la dependencia de sistemas como ChatGPT de OpenAI fue intencional, ya que las fuerzas armadas de Ucrania planean integrar IA en los sistemas de gestión del campo de batalla para la coordinación de tropas y el monitoreo del enemigo.
El proyecto surge en parte de las deficiencias de comunicación que afectan a los sistemas de IA actuales. Bornyakov observó cómo los sistemas de IA existentes tienen dificultades para procesar el dialecto de los habitantes de su ciudad natal, Bolhrad, en la provincia de Odesa, donde se utiliza una mezcla de ucraniano, ruso y búlgaro.
Misha Nestor, director de producto de Kyivstar y quien supervisa el proyecto, destacó problemas como traducciones erróneas en documentos legales y errores generados por la IA. Cuatro comités asesores se encargarán de los aspectos técnicos, legales, culturales, históricos y lingüísticos del nuevo modelo, garantizando su compatibilidad con el ucraniano y lenguas minoritarias como el tártaro de Crimea, además del ruso.
Se están recopilando datos de más de 90 instituciones gubernamentales, incluyendo registros judiciales, editoriales educativas, archivos regionales y registros de las acciones rusas durante la guerra en curso. Este completo conjunto de datos permitirá a la IA comprender el contexto y la terminología ucranianos mucho mejor que los modelos globales de propósito general.
Los expertos del Ministerio de Transformación Digital afirman que Gemma es uno de los modelos abiertos más eficientes en cuanto a tamaño y calidad, ofreciendo un equilibrio estable entre rendimiento y uso de recursos. El modelo ya cuenta con compatibilidad multilingüe, incluyendo el ucraniano, y su tokenizador ampliado admite hasta 128.000 tokens con procesamiento multimodal de texto e imágenes.
La capacitación se realizará en unidades de procesamiento gráfico seguras fuera de Ucrania, proporcionadas por Google , antes de que los modelos terminados se implementen en centros de datos locales. Esta es la solución del país ante la amenaza constante de ataques rusos a la infraestructura ucraniana.
Bornyakov declaró que los funcionarios esperan que el sistema sea atacado inmediatamente después de su lanzamiento. El equipo está desarrollando protecciones contra diversas ciberamenazas, incluyendo ataques de inyección rápida, donde se integran instrucciones maliciosas en las tareas asignadas a la IA.
Kyivstar ha instalado más de 3500 generadores de emergencia para estabilizar sus operaciones mientras Rusia continúa atacando la infraestructura energética de Ucrania. La compañía de telecomunicaciones atendía a más de 22,5 millones de clientes de telefonía móvil y a más de 1,2 millones de clientes de internet fijo hasta septiembre.
Obtén $50 gratis para operar con criptomonedas al registrarte en Bybit ahora