Notebookcheck Logo

O Whisper-Medusa é o novo modelo de IA de reconhecimento de fala de código aberto da aiOla, que afirma ser 50% mais rápido do que o Whisper da OpenAI

a aiOla é uma empresa sediada em Israel que usa soluções orientadas por IA para digitalizar fluxos de trabalho baseados em papel. (Fonte da imagem: aiOla)
a aiOla é uma empresa sediada em Israel que usa soluções orientadas por IA para digitalizar fluxos de trabalho baseados em papel. (Fonte da imagem: aiOla)
a aiOla lançou o Whisper-Medusa, um modelo de IA de código aberto projetado para aprimorar o reconhecimento automático de fala. Combinando o Whisper da OpenAI com a tecnologia da aiOla, o Whisper-Medusa afirma operar 50% mais rápido do que o próprio Whisper. Esse modelo é compatível com mais de 100 idiomas e transforma dados de fala não estruturados em percepções acionáveis, mostrando uma promessa futura em setores como aviação, logística e saúde.

aiOla é uma empresa com sede em Israel, fundada em 2019, especializada em soluções orientadas por IA para digitalizar fluxos de trabalho baseados em papel. A empresa apresentou recentemente o Whisper-Medusa, um modelo de IA de código aberto que é uma combinação do Whisper da OpenAI da OpenAI e da tecnologia da aiOla. Ele afirma operar mais de 50% mais rápido, mantendo alta precisão. Essa velocidade é obtida por meio de um método exclusivo de previsão de tokens, prevendo dez tokens por vez em vez de um, como visto no OpenAIda OpenAI.

A Whisper-Medusa foi desenvolvida usando supervisão fraca. Esse processo envolve o uso do Whisper para transcrever conjuntos de dados de áudio, que então servem como rótulos para treinar os módulos de previsão de tokens da Medusa.

O Whisper-Medusa pode vir a ser um grande recurso para empresas que ainda dependem de fluxos de trabalho baseados em papel na operação diária. A tecnologia da aiOla, por meio de seu sistema de back-end 'aiOla Jargonic', pode ajudar os trabalhadores da linha de frente em vários setores. Por exemplo, no setor de fabricação de alimentos, a aiOla simplificou o controle de qualidade transformando listas de verificação manuais em fluxos de trabalho digitais. A empresa afirma que todo o processo é "tão fácil quanto carregar uma foto ou um arquivo de seus processos existentes".

Com suporte a mais de 100 idiomas e vários sotaques, o Whisper-Medusa também pode ser útil em setores como aviação, fabricação de alimentos, logística e saúde. Ao converter dados de fala não estruturados em percepções acionáveis, as empresas podem reduzir seus custos e melhorar a alocação de recursos.

Os interessados podem encontrar os arquivos de código aberto em Hugging Face e GitHub.

o Whisper-Medusa da aiOla afirma ser 50% mais rápido do que o Whisper da OpenAI. (Fonte da imagem: aiOla)
o Whisper-Medusa da aiOla afirma ser 50% mais rápido do que o Whisper da OpenAI. (Fonte da imagem: aiOla)

Fonte(s)

Please share our article, every link counts!
> Análises e revisões de portáteis e celulares > Arquivo de notícias 2024 08 > O Whisper-Medusa é o novo modelo de IA de reconhecimento de fala de código aberto da aiOla, que afirma ser 50% mais rápido do que o Whisper da OpenAI
Anubhav Sharma, 2024-08- 4 (Update: 2024-08- 4)