Notebookcheck Logo

O Open NotebookLM adota uma abordagem de código aberto para converter PDFs em podcasts.

Open NotebookLM (Fonte da imagem: gabrielchua on Hugging face)
Open NotebookLM (Fonte da imagem: gabrielchua on Hugging face)
O desenvolvedor Gabriel Chua lançou sua resposta ao cada vez mais popular conversor de PDF para podcast do Google, o notebookLM. O Open NotebookLM replica os recursos do Google combinando vários modelos de código aberto.

Para aqueles que não estão familiarizados com o experimento de IA do Google, o NotebookLM é uma plataforma de assistente de pesquisa que recebe documentos carregados pelo usuário e usa o Gemini 1.5 pro para oferecer uma abordagem de anotação para interagir com as informações encontradas no documento. O NotebookLM gera um resumo de todos os documentos carregados no notebook do usuário e permite que os usuários façam perguntas sobre o material. Depois que as informações são processadas, o NotebookLM responde com as citações apropriadas dos documentos carregados. No entanto, o recurso mais impressionante é a capacidade de gerar podcasts com base nos documentos carregados. O podcast gerado pelo Gemini utiliza as informações selecionadas pela IA nos documentos. Ele cria um arquivo de áudio de uma discussão entre dois palestrantes sobre assuntos encontrados no material, com clipes de áudio que variam de cinco a trinta minutos. No entanto, alguns usuários podem hesitar em fazer upload de material para um LLM proprietário, e é aí que o Open NotebookLM se diferencia.

Com uma interface de usuário simples e direta, o Open NotebookLM foi criado usando vários modelos de código aberto e de conversão de texto em fala para transformar PDFs em podcasts. Para processar o PDF, o Open NotebookLM usa o Llama 3.1 com um limite de 100 mil caracteres. Embora não seja tão capaz quanto o Gemini, o MeloTTS oferece um sólido desempenho de conversão de texto em fala para o projeto, e os usuários podem ajustar o tom da IA entre "divertido" e "formal" Além disso, o Open NotebookLM suporta pouco mais de dez idiomas, com espanhol, francês e alemão entre as opções. Atualmente, os usuários podem experimentar o projeto na página Hugging face de Chua ou criá-lo localmente com os recursos disponíveis no repositório GitHub do projeto.

Fonte(s)

Gabriel Chua em Hugging face e em Github

Please share our article, every link counts!
Mail Logo
> Análises e revisões de portáteis e celulares > Arquivo de notícias 2024 10 > O Open NotebookLM adota uma abordagem de código aberto para converter PDFs em podcasts.
Stephen Pereyra, 2024-10- 2 (Update: 2024-10- 2)