O modelo fundamental de inteligência artificial (IA) coreano, K-Exaone, desenvolvido pela LG AI Research, entrou no top 10 global, ocupando a sétima posição. Essa conquista significa que o modelo é a única representação coreana em um ranking dominado por modelos desenvolvidos por empresas dos Estados Unidos e da China.
Em comunicado, a LG mencionou que seu modelo de IA mais recente apresentou o tron desempenho entre cinco equipes em uma competição governamental de modelos fundamentais de IA. O modelo alcançou feitos notáveis, liderando 10 dos 13 testes de referência com uma pontuação média de 72. Internacionalmente, o modelo de IA ficou em sétimo lugar no Índice de Inteligência compilado pela Artificial Analysis, sendo o único modelo coreano a figurar entre os 10 primeiros. A China liderou com seis modelos , enquanto os EUA contaram com três. O GLM-4.7 da Z.AI conquistou a primeira posição.
A LG lançou seu modelo fundamental como um modelo de código aberto no Hugging Face e o viu subir para o segundo lugar no ranking global de tendências de modelos da plataforma. Isso sugere um tron interesse de líderes internacionais. A LG mencionou que está pronta para disponibilizar acesso gratuito à API do K-Exaone até 28 de janeiro. Isso permitirá que desenvolvedores e empresas usem o modelo sem custo algum durante o período inicial de lançamento.
A Epoch AI, uma organização sem fins lucrativos sediada nos EUA, também elogiou o modelo. A plataforma adicionou o modelo à sua lista de modelos de IA notáveis. A LG AI Research agora possui cinco modelos na lista, tornando-se a empresa coreana com o maior número. "Estabelecemos o plano de desenvolvimento de acordo com o tempo e a infraestrutura que nos foram dados e desenvolvemos a primeira fase do K-Exaone usando cerca de metade dos dados que tínhamos", disse Lee Jin-sik, chefe do Laboratório Exaone da LG AI Research.
Segundo a LG, o modelo é fruto de cinco anos de pesquisa interna e sinaliza a entrada da Coreia na corrida global por sistemas de IA de ponta. A divisão da LG mencionou que, em vez de se basear apenas na escalabilidade, redesenhou a arquitetura para impulsionar o desempenho e, ao mesmo tempo, reduzir os custos de treinamento e operação. O K-Exaone utiliza uma arquitetura de mistura de especialistas (MoE) com 236 bilhões de parâmetros, sendo cerca de 23 bilhões de parâmetros ativados por inferência.
O modelo utiliza sua tecnologia principal, atenção híbrida, para aprimorar sua capacidade de focar em informações importantes durante o processamento de dados, reduzindo os requisitos e a carga computacional em 70% em comparação com os modelos anteriores. O tokenizador também foi aprimorado, expandindo seu vocabulário de treinamento para 150.000 palavras. Além disso, ele otimiza frequentemente combinações de palavras usadas, melhorando a capacidade de processamento de documentos em 1,3 vezes.
Além disso, a adoção da predição multi-token aumentou a velocidade de inferência em 150%, melhorando a eficiência geral. O K-Exaone foi projetado para maximizar a eficiência e reduzir custos, permitindo sua execução em GPUs da classe A100 em vez de exigir a infraestrutura mais cara”, disse um representante da LG AI Research. “Isso torna a IA de ponta mais acessível a empresas com recursos computacionais limitados e ajuda a expandir o ecossistema de IA da Coreia.”
Além da memorização, o K-Exaone é treinado para aprimorar seu raciocínio e suas capacidades de resolução de problemas. A LG explicou que, durante a fase de pré-treinamento, o modelo foi exposto a dados de trajetória de pensamento que mostram como os problemas são resolvidos, e não apenas a resposta final. Segurança e conformidade também foram prioridades para o modelo. A LG mencionou que realizou revisões de conformidade de dados em todos os conjuntos de dados de treinamento, removendo materiais com potenciais problemas de direitos autorais.
A empresa mantém um comitê interno de ética em IA que realiza avaliações de risco em quatro categorias: segurança social, considerações específicas da Coreia, riscos futuros e valores humanos universais. No KGC-Safety, o benchmark desenvolvido pela LG AI Research para segurança na Coreia, o K-Exaone obteve uma pontuação média de 97,38 nas quatro categorias. Seu desempenho foi superior ao do modelo GPT-OSS-120B da OpenAI
Quer que seu projeto seja apresentado às mentes mais brilhantes do mundo das criptomoedas? Apresente-o em nosso próximo relatório do setor, onde dados encontram impacto.