A plataforma de mídia social chinesa rednote, também conhecida internamente como Xiaohongshu, lançou seu primeiro modelo de idioma de grande código aberto (LLM) na última sexta-feira. O novo modelo, apelidado de "Dots.llm1", contém 142 bilhões de parâmetros no total, mas apenas 14 bilhões são supostamente ativados para cada resposta.
De acordo com o The Asian News Outlet, South China Morning Post, essa arquitetura pode ajudar o do Balanço com eficiência de custo para rivalizar com concorrentes como o OpenAi do ChatGPT , reduzindo a despesa de treinamento e inferência.
O Laboratório Interno de Inteligência Humane da Rednote desenvolveu o LLM, ou "HI Lab", que evoluiu da equipe de inteligência artificial anterior da empresa. O Rednote disse que seu modelo supera outros sistemas de código aberto no entendimento da língua chinesa, superando a instrução QWEN2.5-72B do Alibaba e o Deepseek-V3.
O Rednote emitiu uma declaração para explicar os padrões por trás do treinamento de seu LLM. Ao contrário de outros modelos do mercado, a empresa afirmou que nenhum dado sintético foi usado durante o pré -treinamento.
Os desenvolvedores insistiram que os pontos.
A empresa também começou a testar um assistente de pesquisa de IA chamado Diandian em sua plataforma. Diandian, lançado através de uma caixa de diálogo dentro do aplicativo, apresenta uma função de "pesquisa profunda" e é alimentada por um dos modelos internos do Rednote. Ainda assim, a empresa ainda não confirmou se esse assistente é baseado em pontos.llm1.
O anúncio de IA de código aberto do Rednote ocorreu apenas um dia antes da abertura da empresa de um novo escritório em Hong Kong, o primeiro fora da China continental. O novo local está situado na Times Square, uma área comercial em Causeway Bay.
" A presença do Rednote melhorará as interações entre criadores de conteúdo local, marcas e organizações e promoverá trocas culturais do leste-West Cultural e o desenvolvimento de marketing de conteúdo entre Hong Kong, o continente e os mercados globais", disse o diretor-geral da Investhk, da Promoção de Investimentos, Alpha Lau, disse a repórteres durante uma conferência de imprensa no último sábado.
O rednote, com sede em Xangai, é uma das plataformas de mídia social mais usadas da China, com 300 milhões de usuários ativos mensais. De acordo com os funcionários da empresa, a expansão faz parte dos planos de aumentar o alcance no exterior do Rednote, em preparação para uma possível de Tiktok nos Estados Unidos.
O Rednote se junta à lista de empresas chinesas que passaram a tornar seus grandes modelos de idiomas mais de código aberto IA. Mais empresas estão tentando refletir o sucesso de modelos de baixo custo e de alto desempenho, como os lançados pela startup Deepseek.
No início deste ano, a DeepSeek lançou seu modelo R1 de código aberto, que liderou os downloads em várias lojas de aplicativos para fornecer tron G por uma fração do custo associado à Western LLMS.
Os gigantes da tecnologia Alibaba, Tencent e Bytedance fizeram investimentos significativos na infraestrutura de IA. O Alibaba, por exemplo, lançou vários novos LLMs como parte de sua série QWEN, incluindo os mais recentes do QWEN3 . Eles suportam mais de 100 idiomas capazes de recuperar o código e o idioma.
Alibaba disse que os modelos QWEN3 têm melhorado a eficiência e o desempenho nos sistemas de incorporação e reranger. Falando no início deste ano, Wang Jian, fundador da Alibaba Cloud, afirmou que o progresso de grandes modelos de idiomas está excedendo as expectativas e continuará a fazê -lo.
Wang mencionou startups como o DeepSeek como exemplos de como os jovens inovadores resolvem problemas com abordagens criativas.
Segundo Wang, o Zerosearch do Alibaba demonstra como a inovação pode reduzir significativamente os custos de desenvolvimento. O Zerosearch, exibido em maio, foi projetado para simular o comportamento do mecanismo de pesquisa durante o treinamento sem fazer chamadas de API reais. A empresa afirma que isso pode reduzir os custos de treinamento em até 90%.
Academia Cryptopolitan: Quer aumentar seu dinheiro em 2025? Aprenda a fazê -lo com DeFi em nossa próxima webclass. Salve seu lugar