Uma empresa chinesa de inteligência artificial adicionou reconhecimento de imagem e vídeo ao seu chatbot principal.
Ao mesmo tempo, os fabricantes locais de chips mostraram que agora conseguem igualar o suporte de lançamento rápido que costumava ser um ponto forte dos Estados Unidos.
A DeepSeek, empresa sediada em Hangzhou, adicionou discretamente um novo recurso chamado "modo de reconhecimento de imagem" à sua plataforma de bate-papo. Este novo modo se junta a outros dois lançados pela empresa no início deste mês: "especialista" e "flash"
O novo recurso permite que o chatbot entenda fotos e vídeos, e não apenas texto.
Isso o alinha a outros chatbots de IA importantes que oferecem funcionalidades semelhantes há algum tempo.
Chen Xiaokang, que lidera a equipe multimodal da DeepSeek, disse que a ferramenta foi testada inicialmente com um pequeno grupo de usuários, tanto no site quanto no aplicativo móvel.
Chen Deli, pesquisador sênior da empresa, comemorou o lançamento com uma breve publicação que fazia referência ao logotipo da empresa: "A pequena baleia agora consegue enxergar".
O recurso de imagem e vídeo foi lançado poucos dias depois de a DeepSeek divulgar uma prévia de seu mais novo modelo principal, o DeepSeek-V4, e disponibilizar os pesos do modelo para download e uso por qualquer pessoa.
O V4 não é um modelo único, mas sim dois. O primeiro, DeepSeek-V4-Pro, possui 1,6 trilhão de parâmetros e foi projetado para tarefas complexas que exigem raciocínio sofisticado e fluxos de trabalho automatizados com várias etapas.
O segundo modelo, DeepSeek-V4-Flash, foi desenvolvido para lidar com um grande número de solicitações a um custo menor. Ambos os modelos suportam uma janela de contexto de um milhão de tokens.
Eles também utilizam um design de atenção híbrido que, segundo a empresa, reduz a capacidade de processamento e a memória necessárias durante a inferência.
O que chamou a atenção de muitos observadores do setor não foi apenas o modelo em si, mas o que aconteceu no dia do seu lançamento.
Quatro empresas chinesas de chips, Huawei Ascend, Cambricon, Hygon Information e Moore Threads, confirmaram que seus hardwares funcionaram perfeitamente com a versão 4 desde o primeiro dia de seu lançamento.
Esse tipo de suporte no mesmo dia, em que um novo modelo funciona perfeitamente em chips que não são da NVIDIA logo no lançamento, em vez de semanas ou meses depois, era praticamente impossível fora do próprio ecossistema da Nvidia.
Os chips Ascend da Huawei, incluindo o A2, A3 e 950, são compatíveis com V4-Pro e V4-Flash.
A empresa afirmou que seu chip Ascend 950 utiliza processos de computação combinada e fluxos de processamento paralelo para tornar a inferência mais rápida.
A Cambricon concluiu sua adaptação usando a estrutura de inferência de código aberto vLLM e compartilhou seu código no GitHub.
A Hygon afirmou ter realizado uma otimização profunda do modelo em sua plataforma DCU para criar um caminho tranquilo desde o lançamento do modelo até o uso real.
A Moore Threads colaborou com a Academia de Inteligência Artificial de Pequim para executar a versão 4 em sua placa MTT S5000 usando o pacote de software FlagOS.
Observadores do setor afirmam que esse lançamento coordenado representa uma mudança real.
Durante anos, os chips fabricados fora do ecossistema da Nvidia levavam meses para serem compatíveis com um novo modelo importante. Conseguir que oito chipsets nacionais diferentes funcionassem no primeiro dia é um marco significativo.
Observadores acreditam que o significado mais importante deste lançamento é que a DeepSeek demonstrou ser capaz de fornecer IA de alto nível sem depender de hardware ocidental.
Ao fazer com que seus modelos funcionem nativamente em vários chips chineses simultaneamente, a empresa reduz o risco decorrente das restrições de exportação que impediram as empresas chinesas de acessar os processadores americanos mais poderosos.
O custo também é importante. A DeepSeek se esforçou para manter o preço de execução de seus modelos baixo. Isso facilita para as empresas a criação de sistemas automatizados sem que precisem arcar com custos computacionais muito elevados.
Dessa forma, as atualizações e o lançamento do Deepseek não se resumem a um único avanço técnico. Trata-se, sobretudo, da convergência de toda uma cadeia de suprimentos.
A partir deste lançamento, a questão de quem lidera em IA parece estar deixando de ser quem constrói o modelo mais inteligente e passando a ser quem consegue manter todo o sistema funcionando de forma barata edenta longo prazo.
Não se limite a ler notícias sobre criptomoedas. Compreenda-as. Assine nossa newsletter. É grátis.