Mistral anunciou o lançamento de um novo modelo de áudio AI chamado Voxtral. A empresa francesa de IA afirmou que o modelo é voltado para empresas e é considerado a primeira família de grandes modelos de idiomas (LLMS) focada na IA da AID.
De acordo com a empresa francesa de IA, a Voxtral foi projetada para fornecer inteligência prática em fonoans em aplicativos do mundo real. O modelo de áudio da AI supera o Whisper Large-V3, que é um dos modelos de transcrição de áudio de código aberto.
O Voxtral é alimentado pelo Modelo de Linguagem Grande (LLM) Mistral Small 3.1. O modelo de AIA de áudio pode entender vários idiomas, como inglês, francês, espanhol, português, italiano, alemão, holandês, hindi e muito mais.
O modelo de áudio é capaz de transcrever até 30 minutos de áudio. Além disso, o Voxtral pode entender até 40 minutos de áudio, o que facilita a conversão dos usuários e a fazer perguntas relevantes. Os usuários também podem solicitar para gerar resumos de texto do arquivo de áudio ou fornecer análises e informações detalhadas. Eles também podem executar outras ações, como executar funções através de uma chamada de API.
Mistral oferece os "modelos de entendimento da fala" de Voxtral em duas variações chamadas mini voxtral pequeno e voxtral. Ambos os modelos são capazes de interagir com prompts baseados em fala ou uma combinação de prompts baseados em áudio e texto.
Os mais poderosos dos dois modelos, Voxtral Small, possuem parâmetros de 24b-ideais para implantações em escala de produção. Mistral escreveu que "o voxtral pequeno é competitivo com o GPT-4o-Mini e o Gemini 2.5 Flash em todas as tarefas".
O Voxtral Mini é uma opção mais leve com parâmetros 3B, tornandotrono como uma escolha para implantações locais e de borda. Sua versão da API, o Voxtral Mini Transcrib, não é apenas econômica, mas também supera o sussurro do OpenAI-a menos da metade do preço.
Tanto o Voxtral Small (24b) quanto o Voxtral Mini (3b) estão disponíveis para download e hospedagem local no Hugging Face. Os desenvolvedores também podem integrar os modelos de áudio por meio de uma única chamada de API em qualquer aplicativo. O preço começa em US $ 0,001 por minuto, tornando a transcrição escalável. Mistral afirmou que o Voxtral estará disponível no LE Chat no aplicativo da Web ou no aplicativo móvel nas próximas duas semanas.
Mistral é uma das principais empresas de inteligência artificial da Europa. Segundo relatos, a empresa, fundada em 2023, arrecadou mais de 1 bilhão de euros (cerca de US $ 1,2 bilhão) de empresas conhecidas como Andreessen Horowitz, Nvidia, Samsung e Salesforce.
O fio de diferença -chave ajuda as marcas de criptografia a romper e dominar as manchetes rapidamente