A Meituan afirma ter treinado seu modelo de 1,6 trilhão de parâmetros em hardware chinês, evitando completamente o uso de GPUs da Nvidia. A empresa é a maior plataforma da China para serviços locais e entrega de comida.
O lançamento ocorre em um momento em que os controles de exportação dos EUA continuam a remodelar a forma como as empresas chinesas desenvolvem IA em larga escala. A Meituan treinou o LongCat-2.0 em superpods ASIC nacionais. A empresa apresenta o modelo como prova de que as empresas chinesas podem atingir escala de ponta sem os chips baseados em CUDA da Nvidia.
O LongCat-2.0 utiliza uma arquitetura esparsa de mistura de especialistas. O DeepSeek e o Mixtral da Mistral usam essa mesma abordagem abrangente. Em vez de disparar simultaneamente todos os 1,6 trilhão de parâmetros, um roteador interno seleciona um subconjunto de submodelos especializados para cada token. Comparado a um modelo denso do mesmo tamanho, esse design mantém os custos de inferência baixos.
O modelo é fornecido com uma janela de contexto de um milhão de tokens. Tanto o DeepSeek-R1-0528 quanto o GPT-OSS da OpenAI têm um valor máximo de token de 128.000. Nos benchmarks publicados, a Meituan comparou o LongCat-2.0 com modelos proprietários do Google, da OpenAI e da Anthropic. Até o momento, essas afirmações não foram validadas por avaliações imparciais de terceiros.
A Meituan desenvolveu o LongCat-2.0 para servir como o principal mecanismo de raciocínio para agentes de IA e ferramentas de codificação. A empresa apontou a compreensão de código, edições em todo o repositório e execução automatizada de tarefas como casos de uso principais.
Uma estimativa da empresa de pesquisa de ações Bernstein para 2025 colocou a participação da Nvidia no mercado chinês de chips de inteligência artificial em cerca de 40%. A Huawei tem uma porcentagem semelhante. A Bernstein previu que a Huawei ganharia terreno este ano, fazendo com que a participação da Nvidia caísse 8 pontos percentuais.
Quanto aos clusters ASIC domésticos, a Meituan afirma ter treinado e otimizado o LongCat-2.0. Isso significa que o modelo não precisa do conjunto de software da Nvidia e pode, em vez disso, ser executado em hardware já existente na China. Em vez de configurações fragmentadas de terceiros, os "superpods" implicam em hardware de nível empresarial totalmente integrado.
Nem os dispositivos de consumo nem a maioria dos sistemas locais serão capazes de lidar com os 1,6 trilhão de parâmetros do LongCat-2.0. Ele reside em data centers, distribuídos em clusters de inferência de alta densidade que utilizam paralelismo de modelos.
A entrega de refeições é o carro-chefe da Meituan, não o desenvolvimento de inteligência artificial de ponta. Ao adquirir a startup de IA Light Year Beyond por US$ 281 milhões em 2023, a empresa de Pequim entrou no setor de IA. Segundo o SiliconANGLE, seus planos para o desenvolvimento de modelos internos só foram anunciados publicamente em 2025.
A MiniMax, outra startup chinesa de IA, recebeu apoio da Alibaba e da miHoYo. De acordo com reportagens da Cryptopolitan, esses investidores se comprometeram a não vender ações antes do término do período de bloqueio, em 9 de julho.
De acordo com Cai Lian She, citado pela Cryptopolitan, a MiniMax lançou seu próprio modelo de contexto de um milhão de tokens, o M3, no início de junho de 2026. A MiniMax introduziu preços significativamente mais baixos do que os dos líderes de mercado nos Estados Unidos.
Testesdent determinarão o quão seriamente os desenvolvedores fora da China levarão o LongCat-2.0. A otimização para chips nacionais pode limitar o desempenho em hardware da Nvidia, que ainda domina os data centers em todo o mundo. A arquitetura de raciocínio principal, segundo o Meituan, permanece portátil.
Não se limite a ler notícias sobre criptomoedas. Compreenda-as. Assine nossa newsletter. É grátis.