IBM lança modelos de IA de código aberto Granite 3.0 para empresas

Modelos de IA de código aberto do IBM Granite 3.0 para empresas já estão disponíveis (Fonte da imagem: IBM)

Coberta pelos termos da licença Apache 2.0, a família IBM Granite 3.0 de modelos de IA é voltada para clientes corporativos e oferece desempenho superior juntamente com (supostamente) o conjunto mais abrangente de recursos de detecção de riscos e danos do mercado. Os interessados podem baixar os modelos da Hugging Face.

Codrut Nistor (traduzido por Ninh Duy), Publicado 10/22/2024 🇺🇸 🇫🇷 ...

Hoje cedo, a IBM revelou sua família mais avançada de modelos de IA até o momento, elevando o número da versão do Granite para 3.0. Em setembro de 2023, a IBM apresentou os modelos de fundação do Granitee agora está mudando a família para um modelo de código aberto e, ao mesmo tempo, aprimorando todos os outros aspectos. Todos os modelos do Granite 3.0 (que serão mencionados posteriormente) estão cobertos pelos termos da licença Apache 2.0, o que permite que tanto os clientes corporativos quanto a comunidade em geral tirem proveito deles.

Os três ramos do Granite 3.0 e os membros de cada um são os seguintes:

Finalidade geral/linguagem: Granite 3.0 8B Instruct, Granite 3.0 2B Instruct, Granite 3.0 8B Base, Granite 3.0 2B Base
Grades de proteção e segurança: Granite Guardian 3.0 8B, Granite Guardian 3.0 2B
Mistura de especialistas: Granito 3.0 3B-A800M Instruct, Granito 3.0 1B-A400M Instruct, Granito 3.0 3B-A800M Base, Granito 3.0 1B-A400M Base

Ao contrário de seus concorrentes, que são treinados em dados públicos, os modelos Granite da IBM usam dados corporativos e podem ser facilmente integrados em vários fluxos de trabalho e ambientes de negócios, reduzindo os custos em até 23 vezes em comparação com os modelos de grande porte. De acordo com a IBM, o treinamento desses novos modelos envolveu mais de 12 trilhões de tokens em dados extraídos de 12 linguagens naturais diferentes e 116 linguagens de programação diferentes.

Um dos destaques da família é o Guardian 3.0, que vem com a detecção de riscos e danos líder de mercado, levando em conta o embasamento, a relevância do contexto e a relevância da resposta, além dos atributos já comuns, como preconceito social, ódio, toxicidade, profanação, violência, desbloqueio de prisão e assim por diante.

Aqueles que quiserem começar a usar o Granite 3.0 da IBM (ou passar para as novas partes do código) podem ir até a Hugging Face e obtê-los. Embora uma seleção de modelos chegue aos microsserviços NIM da Nvidia e às integrações do Google Cloud Vertex AI Model Garden com a Hugging Face, as variantes de instrução dos novos modelos de linguagem Granite 3.0 8B e 2B e os modelos Granite Guardian 3.0 8B e 2B estão disponíveis para uso comercial por meio da plataforma IBM watsonx plataforma.

No final de agosto, Clifford A. Pickover publicou Artificial Intelligence: An Illustrated History: From Medieval Robots to Neural Networks, um livro que já está disponível por US$ 8,99 no formato Kindle e por US$ 17,26 na versão em brochura.

Fonte(s)

Sala de Imprensa da IBM

▶ ▼ Comunicado à imprensa

A IBM apresenta o Granite 3.0: Modelos de IA de alto desempenho criados para os negócios

- Os novos modelos Granite 3.0 8B e 2B, lançados sob a licença permissiva Apache 2.0, mostram um forte desempenho em muitos benchmarks acadêmicos e empresariais, capazes de superar ou igualar modelos de tamanho semelhante

- Os novos modelos Granite Guardian 3.0 oferecem os recursos de proteção mais abrangentes da IBM para promover uma IA segura e confiável

- Os novos modelos Granite 3.0 Mixture-of-Experts permitem inferência extremamente eficiente e baixa latência, adequados para implementações baseadas em CPU e computação de borda

- O novo modelo Granite Time Series alcançou um desempenho de ponta na previsão de zero/few-shot, superando modelos 10 vezes maiores

- A IBM revela a próxima geração do watsonx Code Assistant com tecnologia Granite para codificação de uso geral; lança novas ferramentas no watsonx.ai para criar e implementar aplicativos e agentes de IA

- Anuncia que o Granite se tornará o modelo padrão do Consulting Advantage, uma plataforma de entrega alimentada por IA usada pelos 160.000 consultores da IBM para trazer novas soluções aos clientes mais rapidamente

ARMONK, N.Y., 21 de outubro de 2024 /PRNewswire/ -- Hoje, na reunião da IBM (NYSE: IBM), a empresa anunciou o lançamento de sua família mais avançada de modelos de IA até o momento, Granite 3.0. Os principais modelos de linguagem Granite de terceira geração da IBM podem superar ou igualar modelos de tamanho semelhante dos principais fornecedores de modelos em muitos benchmarks acadêmicos e do setor, demonstrando forte desempenho, transparência e segurança.

Em consonância com o compromisso da empresa com a IA de código aberto, os modelos Granite são lançados sob a licença permissiva Apache 2.0, o que os torna únicos na combinação de desempenho, flexibilidade e autonomia que oferecem aos clientes corporativos e à comunidade em geral.

A família Granite 3.0 da IBM inclui:

Linguagem/uso geral: Granite 3.0 8B Instruct, Granite 3.0 2B Instruct, Granite 3.0 8B Base, Granite 3.0 2B Base
Grades de proteção e segurança: Granite Guardian 3.0 8B, Granite Guardian 3.0 2B
Mistura de especialistas: Granito 3.0 3B-A800M Instruct, Granito 3.0 1B-A400M Instruct, Granito 3.0 3B-A800M Base, Granito 3.0 1B-A400M Base

Os novos modelos de linguagem Granite 3.0 8B e 2B foram projetados como modelos "cavalos de batalha" para IA corporativa, oferecendo um desempenho sólido para tarefas como Retrieval Augmented Geneneration (RAG), classificação, sumarização, extração de entidades e uso de ferramentas. Esses modelos compactos e versáteis foram projetados para serem ajustados com dados corporativos e perfeitamente integrados em diversos ambientes de negócios ou fluxos de trabalho.

Embora muitos modelos de linguagem grandes (LLMs) sejam treinados em dados disponíveis publicamente, a grande maioria dos dados corporativos permanece inexplorada. Ao combinar um pequeno modelo Granite com dados corporativos, especialmente usando a revolucionária técnica de alinhamento InstructLab - introduzida pela IBM e pela RedHat em maio - a IBM acredita que as empresas podem obter um desempenho específico de tarefas que rivaliza com modelos maiores por uma fração do custo (com base em uma faixa observada de custo 3x-23x menor do que os modelos de fronteira grandes em várias provas de ^conceito iniciais1).

O lançamento do Granite 3.0 reafirma o compromisso da IBM de criar transparência, segurança e confiança nos produtos de IA. O Relatório técnico do Granite 3.0 e o guia de uso responsável fornecem uma descrição dos conjuntos de dados usados para treinar esses modelos, detalhes das etapas de filtragem, limpeza e curadoria aplicadas, além de resultados abrangentes do desempenho do modelo nos principais benchmarks acadêmicos e empresariais.

De forma crítica, a IBM fornece uma indenização de IP para todos os modelos Granite no watsonx.ai, para que os clientes corporativos possam ter mais confiança na fusão de seus dados com os modelos.

Elevando o nível: Benchmarks do Granite 3.0

Os modelos de linguagem do Granite 3.0 também demonstram resultados promissores em termos de desempenho bruto.

Nos benchmarks acadêmicos padrão definidos pelo OpenLLM Leaderboard da Hugging Face, o desempenho geral do modelo Granite 3.0 8B Instruct lidera, em média, o desempenho de ponta dos modelos de código aberto de tamanho semelhante da Meta e da Mistral. No benchmark de segurança AttaQ de última geração da IBM, o modelo Granite 3.0 8B Instruct lidera em todas as dimensões de segurança medidas em comparação com os modelos da Meta e da Mistral^.2

Nas principais tarefas empresariais de RAG, uso de ferramentas e tarefas no domínio de segurança cibernética, o modelo Granite 3.0 8B Instruct apresenta desempenho líder em média, em comparação com modelos de código aberto de tamanho semelhante da Mistral e da Meta^.3

Os modelos do Granite 3.0 foram treinados em mais de 12 trilhões de tokens em dados extraídos de 12 linguagens naturais diferentes e 116 linguagens de programação diferentes, usando um novo método de treinamento em dois estágios, aproveitando os resultados de vários milhares de experimentos projetados para otimizar a qualidade dos dados, a seleção de dados e os parâmetros de treinamento. Até o final do ano, espera-se que os modelos de linguagem 3.0 8B e 2B incluam suporte para uma janela de contexto estendida de 128K e recursos de compreensão de documentos multimodais.

Demonstrando um excelente equilíbrio entre desempenho e custo de inferência, a IBM oferece seus modelos de arquitetura Granite Mixture of Experts (MoE), Granite 3.0 1B-A400M e Granite 3.0 3B-A800M, como modelos menores e leves que podem ser implantados em aplicativos de baixa latência, bem como em implantações baseadas em CPU.

A IBM também está anunciando uma versão atualizada de seus modelos Granite Time Series pré-treinados, cujas primeiras versões foram lançadas no início deste ano. Esses novos modelos são treinados com três vezes mais dados e oferecem um desempenho sólido em todos os três principais benchmarks de séries temporais, superando os modelos 10 vezes maiores do Google, Alibaba e outros. Os modelos atualizados também oferecem maior flexibilidade de modelagem com suporte para variáveis externas e previsões contínuas^.4

Apresentando o Granite Guardian 3.0: inaugurando a próxima era da IA responsável

Como parte desse lançamento, a IBM também está introduzindo uma nova família de modelos do Granite Guardian que permite que os desenvolvedores de aplicativos implementem proteções de segurança, verificando as solicitações do usuário e as respostas do LLM para uma variedade de riscos. Os modelos 8B e 2B do Granite Guardian 3.0 oferecem o conjunto mais abrangente de recursos de detecção de riscos e danos disponíveis no mercado atualmente.

Além das dimensões de danos, como preconceito social, ódio, toxicidade, profanação, violência, jailbreaking e muito mais, esses modelos também oferecem uma série de verificações exclusivas específicas do RAG, como fundamentação, relevância do contexto e relevância da resposta. Em testes extensivos realizados em 19 benchmarks de segurança e RAG, o modelo Granite Guardian 3.0 8B tem maior precisão geral na detecção de danos, em média, do que todas as três gerações de modelos Llama Guard da Meta. Ele também apresentou desempenho geral equivalente na detecção de alucinações, em média, aos modelos especializados de detecção de alucinações WeCheck e MiniCheck^.5

Embora os modelos Granite Guardian sejam derivados dos modelos de linguagem Granite correspondentes, eles podem ser usados para implementar guardrails juntamente com qualquer modelo de IA aberto ou proprietário.

Disponibilidade dos modelos do Granite 3.0

Todo o conjunto de modelos do Granite 3.0 e os modelos de séries temporais atualizados estão disponíveis para download no HuggingFace sob a licença permissiva Apache 2.0. As variantes de instrução dos novos modelos de linguagem Granite 3.0 8B e 2B e os modelos Granite Guardian 3.0 8B e 2B estão disponíveis hoje para uso comercial na plataforma Watsonx da IBM. Uma seleção dos modelos do Granite 3.0 também estará disponível como microsserviços NVIDIA NIM e por meio das integrações do Vertex AI Model Garden do Google Cloud com o HuggingFace.

Para ajudar a oferecer ao desenvolvedor opções e facilidade de uso e dar suporte a implementações locais e de borda, um conjunto selecionado de modelos do Granite 3.0 também está disponível no Ollama e no Replicate.

A última geração de modelos Granite expande o robusto catálogo de código aberto da IBM de LLMs poderosos. A IBM colaborou com parceiros do ecossistema como AWS, Docker, Domo, Qualcomm Technologies, Inc. por meio de seu Qualcomm® AI Hubsalesforce, SAPe outros para integrar uma variedade de modelos do Granite às ofertas desses parceiros ou disponibilizar modelos do Granite em suas plataformas, oferecendo mais opções para empresas em todo o mundo.

De assistentes a agentes: percebendo o futuro da IA empresarial

A IBM está avançando na IA empresarial por meio de um espectro de tecnologias - desde modelos e assistentes até as ferramentas necessárias para ajustar e implementar a IA especificamente para os dados e casos de uso exclusivos das empresas. A IBM também está preparando o caminho para futuros agentes de IA que podem se autodirigir, refletir e executar tarefas complexas em ambientes de negócios dinâmicos.

A IBM continua a desenvolver seu portfólio de tecnologias de assistente de IA - desde o watsonx Orchestrate para ajudar as empresas a criar seus próprios assistentes por meio de ferramentas e automação de baixo código, até um amplo conjunto de assistentes pré-construídos para tarefas e domínios específicos, como atendimento ao cliente, recursos humanos, vendas e marketing. Organizações de todo o mundo usaram o Watsonx Assistant para ajudá-las a criar assistentes de IA para tarefas como responder a perguntas rotineiras de clientes ou funcionários, modernizar seus mainframes e aplicativos de TI legados, ajudar os alunos a explorar possíveis caminhos de carreira ou fornecer suporte digital a hipotecas para compradores de imóveis.

Hoje, a IBM também revelou o próximo lançamento da próxima geração do watsonx Code Assistantcom base nos modelos de código do Granite, para oferecer assistência de codificação de uso geral em linguagens como C, C++, Go, Java e Python, com recursos avançados de modernização de aplicativos para Enterprise Java Applications^.6 Os recursos de código do Granite agora também podem ser acessados por meio de uma extensão do Visual Studio Code, IBM Granite.Code.

A IBM também planeja lançar novas ferramentas para ajudar os desenvolvedores a a construir, personalizar e implantar IA de forma mais eficiente via watsonx.ai - incluindo estruturas agênticas, integrações com ambientes existentes e automações de baixo código para casos de uso comuns, como RAG e agentes^.7

A IBM está focada no desenvolvimento de tecnologias de agentes de IA que sejam capazes de maior autonomia, raciocínio sofisticado e solução de problemas em várias etapas. A versão inicial do modelo Granite 3.0 8B oferece suporte aos principais recursos agênticos, como raciocínio avançado e um modelo de bate-papo altamente estruturado e um estilo de solicitação para implementar fluxos de trabalho de uso de ferramentas. A IBM também planeja introduzir um novo recurso de bate-papo com agente de IA no IBM watsonx Orchestrate, que usa recursos agênticos para orquestrar Assistentes de IA, habilidades e automações que ajudam os usuários a aumentar a produtividade em suas equipes^.8 A IBM planeja continuar a desenvolver recursos de agente em todo o seu portfólio em 2025, incluindo agentes pré-construídos para domínios e casos de uso específicos.

Plataforma de entrega ampliada e alimentada por IA para sobrecarregar os consultores da IBM com IA

A IBM também está anunciando uma grande expansão de sua plataforma de entrega alimentada por IA, IBM Consulting Advantage. A plataforma multimodelo contém agentes, aplicativos e métodos de IA, como estruturas repetíveis, que podem capacitar 160.000 consultores da IBM a fornecer valor melhor e mais rápido ao cliente a um custo menor.

Como parte da expansão, os modelos de linguagem do Granite 3.0 se tornarão o modelo padrão no Consulting Advantage. Aproveitando o desempenho e a eficiência do Granite, a IBM Consulting poderá ajudar a maximizar o retorno sobre o investimento para os projetos de IA generativa dos clientes da IBM.

Outra parte importante da expansão é a introdução do IBM Consulting Advantage for Cloud Transformation and Management e do IBM Consulting Advantage for Business Operations. Cada um deles inclui agentes, aplicativos e métodos de IA específicos do domínio, infundidos com as melhores práticas da IBM, para que os consultores da IBM possam ajudar a acelerar as transformações de nuvem e IA do cliente em tarefas, como modernização de código e engenharia de qualidade, ou transformar e executar operações em domínios, como finanças, RH e compras.

Para saber mais sobre o Granite e a estratégia de IA para negócios da IBM, acesse www.ibm.com/granite.

¹ Os cálculos de custo são baseados no custo da API por milhão de tokens do IBM watsonx para modelos abertos e openAI para modelos GPT4 (supondo uma combinação de 80% de entrada e 20% de saída) para provas de conceito do cliente.
2 Documento técnico da IBM Research: Modelos de linguagem do Granite 3.0
³ Documento técnico da IBM Research: Modelos de linguagem do Granite 3.0
⁴ O Tiny Time Mixer: Modelos rápidos pré-treinados para previsão aprimorada de zero/pequenos disparos em séries temporais multivariadas
⁵ Resultados da avaliação publicados no Granite Guardian GitHub Repo
⁶ Disponibilidade planejada para o quarto trimestre de 2024
7 Disponibilidade planejada para o quarto trimestre de 2024
8 Disponibilidade planejada para o primeiro trimestre de 2025

Fonte(s)

A IBM apresenta o Granite 3.0: Modelos de IA de alto desempenho criados para os negócios

Artigos Relacionados