Notebookcheck Logo

O Whisperfile da equipe do Mozilla Ocho oferece ASR local e fácil

projeto llamafile (Fonte da imagem: Mozilla)
projeto llamafile (Fonte da imagem: Mozilla)
A equipe da Mozilla, conhecida pela inovação e pelos experimentos, integrou o sistema de reconhecimento automático de voz Whisper da OpenAI ao seu projeto llamafile. O projeto tem como objetivo fornecer modelos de linguagem grandes e compatíveis com hardware local em um único arquivo executável. A capacidade de executar localmente um software de transcrição pode beneficiar usuários preocupados com a privacidade que desejam transcrever áudio sensível.

Para aqueles que não estão familiarizados com o projeto llamafile a equipe do Mozilla Ocho está trabalhando para remover a complexidade que envolve a instalação de LLMs, combinando llama.cpp e Cosmopolitan Libc, que utilizam a linguagem de programação C/C++. O Llamafile usa a inferência do LLaMA do Meta do Meta fornecida pelo llama.cpp e a combina com a transformação build-once run-anywhere do C pela Cosmopolitan Libc. A Cosmopolitan Libc também elimina a necessidade de um intérprete ou máquina virtual para executar C em máquinas Linux, Mac e Windows.

A mais recente adição ao projeto llamafile, Whisperfilefoi detalhado no perfil Hugging Face da Mozilla. De acordo com sua página, "Whisperfile é uma implementação de alto desempenho do OpenAI's Whisper da OpenAI criada pela Mozilla Ocho como parte do projeto llamafile, baseada no software whisper.cpp escrito por Georgi Gerganov, et al." Para o projeto, a equipe empacotou todos os pesos necessários para o modelo em "whisperfiles" que mantêm os recursos encontrados na Cosmopolitan Libc, permitindo que o modelo seja executado na maioria dos sistemas.

A documentação "Getting Started with Whisperfile" no perfil da equipe no GitHub detalha um processo de instalação simples que consiste em apenas três etapas. Depois que o usuário faz o download do modelo, constrói o software e executa o programa, ele pode escolher entre três modelos diferentes para começar a transcrever o áudio. Os modelos variam de pequenos a grandes, com a velocidade sendo trocada pela precisão no processo de transcrição. Além disso, o Whisperfile pode traduzir diferentes idiomas para o inglês usando o modelo multilíngue e o sinalizador "--translate".

Para obter informações sobre o llamafile, o Whisperfile e detalhes adicionais sobre o processo de instalação, por favor, visite os recursos abaixo.

Please share our article, every link counts!
> Análises e revisões de portáteis e celulares > Arquivo de notícias 2024 08 > O Whisperfile da equipe do Mozilla Ocho oferece ASR local e fácil
Stephen Pereyra, 2024-08-23 (Update: 2024-08-23)