A Cerebras Systems anunciou que está executando o Kimi K2.6 em testes com clientes, marcando a primeira vez que a empresa de chips opera um modelo open-weight com um trilhão de parâmetros, atingindo velocidades próximas a 1.000 tokens por segundo.
A empresa sediada em Sunnyvale, Califórnia, abriu seu capital na última quinta-feira, na maior oferta pública inicial de ações (IPO) do setor de tecnologia dos EUA até o momento neste ano. As ações foram precificadas em US$ 185 cada, bem acima da faixa de US$ 115 a US$ 125 inicialmente planejada.
Quando as negociações começaram em 14 de maio, as ações saltaram para US$ 350 antes de se estabilizarem em US$ 311,07 no final do dia, um aumento de 68% em relação ao preço da oferta.
Os pedidos foram mais de 20 vezes superiores ao número de ações disponíveis, conforme relatado anteriormente pela Cryptopolitan , conferindo à Cerebras um valor de mercado de aproximadamente 64 bilhões de dólares.
Após a alta inicial, as ações caíram 10,1% na sexta-feira, fechando a US$ 279,72. Os papéis se recuperaram na segunda-feira, com alta de 6,1%, chegando a US$ 296,65, e subiram mais 2,4% na terça-feira, encerrando o pregão a US$ 303,63.
A alta de terça-feira ocorreu depois que a S&P Dow Jones Indices aprovou a inclusão antecipada da Cerebras em seus índices devido à grande capitalização de mercado da empresa.
A ARK Investment Management, liderada por Cathie Wood, adquiriu 149.176 ações no valor aproximado de US$ 46,4 milhões por meio de seus fundos ARK Innovation e ARK Next Generation Internet, de acordo com registros de negociação divulgados na sexta-feira.
A empresa havia feito uma compra menor no dia anterior.
A empresa de testes Artificial Analysis registrou o Cerebras executando o K2.6 a 981 tokens de saída por segundo, 6,7 vezes mais rápido que o concorrente em nuvem baseado em GPU mais próximo e 23 vezes mais rápido que o provedor típico.
Para uma solicitação envolvendo 10.000 tokens de entrada, incluindo processamento imediato, raciocínio e produção de 500 tokens de saída, o Cerebras concluiu a resposta completa em 5,6 segundos, em comparação com 163,7 segundos no sistema oficial Kimi, uma melhoria de 29 vezes.
O K2.6 ocupa o primeiro lugar no SWE-Bench Pro com uma pontuação de 58,6, apresentando desempenho superior ao do Claude Opus 4.6 e equivalente ao do GPT-5.4. O modelo também se destaca em tarefas que envolvem agentes, incluindo os benchmarks Humanity's Last Exam e DeepSearchQA.
A Cerebras baseia sua tecnologia no Wafer-Scale Engine, que difere dos designs de chips típicos. O sistema de terceira geração utiliza um wafer de silício inteiro em vez de cortá-lo em chips individuais menores, tornando-o cerca de 57 vezes maior que a maior unidade de processamento gráfico disponível atualmente.
O wafer contém 4 trilhões de transistores, 900.000 núcleos e 44 gigabytes de memória integrada.
A Cerebras afirma que essa configuração pode tornar as tarefas mais de 15 vezes mais rápidas do que os sistemas com GPUs convencionais.
Segundo documentos apresentados para a oferta pública inicial, a receita subiu 76% em 2025, atingindo US$ 510 milhões, em comparação com US$ 290 milhões em 2024.
A Cerebras também passou a dar lucro, registrando um lucro líquido de US$ 238 milhões em 2025, após ter perdido quase US$ 482 milhões no ano anterior.
Grandes clientes aderiram recentemente. Em janeiro, a Cerebras firmou um acordo plurianual com a OpenAI no valor de mais de US$ 20 bilhões. Segundo o acordo, a OpenAI utilizará 750 megawatts da capacidade computacional da Cerebras até 2028. A OpenAI também concedeu um empréstimo de capital de giro de US$ 1 bilhão para ajudar a financiar a expansão da infraestrutura.
Em março, a Amazon assinou um acordo vinculativo que torna a Amazon Web Services a primeira grande provedora de nuvem a instalar sistemas Cerebras em seus data centers, com o serviço disponível por meio da Bedrock.
“A OpenAI e a Cerebras concordaram em desenvolver em conjunto modelos futuros para o hardware da Cerebras”, escreveu o CEO Andrew Feldman em uma carta incluída nos documentos da oferta.
Não se limite a ler notícias sobre criptomoedas. Compreenda-as. Assine nossa newsletter. É grátis.