Geração de Dados Sintéticos (SDG)

Acelere o desenvolvimento de workflows de IA física e baseada em agentes.

Cargas de Trabalho

Simulação/Modelagem/Design
Robótica
IA Generativa

Setores

Todos os Setores

Objetivo de Negócio

Inovação

Produtos

NVIDIA Omniverse Enterprise
IA da NVIDIA
NVIDIA Isaac

Visão Geral

Por Que Usar Dados Sintéticos?

O treinamento de modelos de IA requer conjuntos de dados diversificados, cuidadosamente rotulados e de alta qualidade para alcançar a precisão e o desempenho desejados. Em muitos casos, os dados são limitados, restritos ou indisponíveis. A coleta e a rotulagem de dados do mundo real são processos demorados e podem ser extremamente caros, atrasando o desenvolvimento de vários tipos de modelos, como linguagem de visão e grandes modelos de linguagem (LLMs).

Os dados sintéticos, gerados por simulação computacional, modelos de IA generativa ou pela combinação de ambos, podem contribuir para resolver esse desafio. Os dados sintéticos podem conter texto, vídeos e imagens 2D ou 3D em espectros visuais e não visuais, que podem ser usados em conjunto com dados reais para treinar modelos de IA física multimodal. Isso pode economizar muito tempo de treinamento e reduzir bastante os custos.

Os dados sintéticos, gerados por meio de simulações ou IA, resolvem o desafio da escassez de dados fornecendo texto, vídeos e imagens 2D/3D que podem ser combinados com dados reais para treinar modelos de IA física multimodal, economizando tempo e reduzindo custos.

Rapidez no Treinamento de Modelos de IA

Supere a lacuna de dados e acelere o desenvolvimento de modelos de IA, reduzindo o custo geral de aquisição e rotulagem de dados necessários para o treinamento de modelos.

Privacidade e Segurança

Resolva problemas de privacidade e reduza o viés gerando diversos conjuntos de dados sintéticos para representar o mundo real.

Precisão

Crie modelos de IA generalizados e altamente precisos, treinando com dados diversificados que incluem casos extremos raros, porém cruciais, que de outra forma são impossíveis de coletar.

Escalonável

Gere dados processualmente com pipelines automatizados que se adaptam ao seu caso de uso em manufatura, automotivo, robótica e muito mais.

Dados Sintéticos para o Desenvolvimento de IA Física

Os modelos de IA física permitem que os sistemas autônomos percebam, entendam, interajam e percorram o mundo físico. Os dados sintéticos são fundamentais para o treinamento e o teste de modelos de IA física.

Treinamento de Modelos Base

Os world foundation models (WFMs) utilizam diversos dados de entrada, incluindo texto, imagens, vídeos e informações de movimento, para gerar e simular mundos virtuais com grande precisão.   

Os WFMs se destacam por seus recursos de generalização excepcionais, precisando de pouquíssimo ajuste fino para várias aplicações. Eles servem como mecanismos cognitivos para robôs e veículos autônomos, utilizando seu entendimento profundo da dinâmica real. Para alcançar esse nível de sofisticação, os WFMs contam com grandes quantidades de dados de treinamento. 


O desenvolvimento do WFM se beneficia consideravelmente da geração de dados sintéticos infinitos por meio de simulações fisicamente precisas. Essa abordagem não apenas acelera o processo de treinamento de modelos, mas também melhora a capacidade dos modelos de generalizar em diversos cenários. As técnicas de randomização de domínio ampliam ainda mais esse processo, permitindo a manipulação de inúmeros parâmetros, como iluminação, fundo, cor, localização e ambiente, variações que seriam quase impossíveis de capturar de forma abrangente apenas com dados reais. 

Treinamento de Política Robótica

O aprendizado robótico é um conjunto de algoritmos e metodologias que permitem que um robô adquira novas habilidades, como manipulação, locomoção e classificação, em um ambiente simulado ou real. Aprendizado por reforço, aprendizado por imitação e política de difusão são as principais metodologias aplicadas para treinar robôs.  

Uma habilidade importante para robôs é a manipulação: pegar coisas, organizá-las e colocá-las juntas, como se vê em fábricas. As demonstrações humanas do mundo real são geralmente usadas como dados de entrada para o treinamento. No entanto, coletar um conjunto grande de dados diversificados chega a ser muito caro. Com algumas demonstrações humanas, os desenvolvedores conseguem gerar movimentos sintéticos em ambientes simulados, acelerando o processo de treinamento do robô.

Para conseguir isso, os usuários podem primeiro usar o GR00T-Teleop para coletar um pequeno conjunto de demonstrações humanas com o Apple Vision Pro (AVP). As demonstrações gravadas são usadas para gerar um grande conjunto de movimentos sintéticos usando o GR00T-Mimic. Em seguida, eles usam o GR00T-Gen, baseado no NVIDIA Omniverse™ e no NVIDIA Cosmos™, para a randomização de domínio e o aumento do 3D para o real, gerando um conjunto exponencialmente grande e diversificado de dados de treinamento para aprendizado por imitação. 

Teste e Validação

O Software-in-loop (SIL) é uma fase de teste crucial para robôs e veículos autônomos com tecnologia de IA, em que o software de controle é testado em um ambiente simulado, em vez de em hardware real.

Os dados sintéticos gerados pela simulação garantem a modelagem precisa da física do mundo real, incluindo entradas de sensores, dinâmica de atuadores e interações ambientais. Isso também oferece uma forma de capturar cenários raros que seriam perigosos para coletar no mundo real. Isso garante que o stack de software do robô na simulação se comporte como se fosse no robô físico, permitindo fazer testes e validação minuciosos sem a necessidade de hardware físico.

O Mega é um Omniverse Blueprint para o desenvolvimento, o teste e a otimização de frotas de IA física e robôs em escala em um gêmeo digital antes da implantação em instalações do mundo real.

Esses robôs simulados podem realizar tarefas analisando e raciocinando sobre a situação em ambientes. Eles são capazes de calcular os próximos movimentos e depois realizar ações que são simuladas no gêmeo digital. Os dados sintéticos dessas simulações são enviados de volta para os cérebros do robô. Os cérebros do robô analisam os resultados e decidem qual ação devem tomar, repetindo esse ciclo, enquanto o Mega rastreia com precisão o estado e a posição de todos os ativos no gêmeo digital.

Dados Sintéticos para o Desenvolvimento de LLM e IA Baseada em Agentes

Os modelos generativos podem ser usados para incializar e expandir os processos de geração de dados sintéticos. Os modelos de texto para 3D permitem a criação de ativos 3D para preencher uma cena de simulação 3D. Os modelos de IA generativa de texto para imagem também podem ser usados para modificar e aumentar imagens existentes, geradas por simulações ou coletadas no mundo real, aplicando técnicas como inpainting (preenchimento de imagem) ou outpainting (expansão de imagem).

Os modelos de IA generativa de texto para texto, como o Evian 2 405B e o Nemotron-4 340B, podem ser usados para gerar dados sintéticos e desenvolver LLMs avançados para setores, como área da saúde, finanças, cibersegurança, varejo e telecomunicações. 

O Evian 2 405B e o Nemotron-4 340B fornecem uma licença aberta, concedendo aos desenvolvedores os direitos de possuir e utilizar os dados gerados em suas aplicações acadêmicas e comerciais.

Como Criar um Pipeline de SDG Habilitado por IA Generativa

A IA generativa pode acelerar muito o processo de geração de dados sintéticos fisicamente precisos em grande escala. Os desenvolvedores podem começar a usar a IA generativa para SDG com um workflow de referência passo a passo.


Implementação Técnica

Geração de Dados Sintéticos

Para IA Física

  • Criação de Cena: Uma cena 3D detalhada serve como base, incorporando ativos essenciais, como prateleiras, caixas e paletes para armazéns, ou árvores, estradas e edifícios para ambientes externos. Os ambientes podem ser aprimorados dinamicamente usando os microsserviços NVIDIA NIM™ para o Universal Scene Description (OpenUSD), permitindo a adição perfeita de diversos objetos e a integração de fundos HDRI em 360°.
  • Randomização de Domínio: Os desenvolvedores podem utilizar o USD Code NIM, um LLM de última geração especializado em OpenUSD, para realizar a randomização de domínios. Além de responder a perguntas relacionadas ao OpenUSD, essa ferramenta avançada também gera código USD Python para fazer alterações na cena, simplificando o processo de ajustes programados de vários parâmetros da cena no NVIDIA Omniverse.
  • Geração de Dados: A terceira etapa envolve a exportação do conjunto inicial de imagens anotadas. O Omniverse oferece diversos anotadores integrados, incluindo caixas delimitadoras 2D, segmentação semântica, mapas de profundidade, normais de superfície, entre outros. A escolha do formato de saída, como caixas delimitadoras ou animações, depende dos requisitos específicos do modelo ou do caso de uso.
  • Aumento de Dados: Na etapa final, os desenvolvedores podem usar os NVIDIA Cosmos WFMs para aumentar ainda mais a imagem, convertendo-a de 3D para uma versão realista. Isso traz o fotorrealismo necessário às imagens geradas por meio de prompts simples do usuário.

Para LLMs e IA Baseada em Agentes

  • Acesse os Modelos: Faça o download da família de modelos de código aberto Nemotron-4 340B no catálogo do NVIDIA NGC™ ou do Hugging Face. Você também pode acessá-los por meio do build.nvidia.com como um microsserviço NVIDIA NIM.
  • Geração de Dados Específicos de Domínio: Solicite que o modelo Nemotron-4-340B-Instruct de código aberto gere seu conjunto de dados sintéticos personalizados baseados em texto com domínios diversificados, simulando características do mundo real.
  • Avalie e Filtre: Aplique o modelo Nemotron-4 340B-Reward para classificar as respostas geradas com base em utilidade, correção, coerência, complexidade e verbosidade.
  • Utilize os Conjuntos de Dados Sintéticos Relevantes e de Alta Qualidade: Refine os dados sintéticos melhorando-os de forma iterativa com base no feedback do modelo de recompensa, garantindo a precisão e a relevância. 

Ecossistema de Parceiros

Ecossistema de Parceiros de Dados Sintéticos

Confira como nossos parceiros do ecossistema estão desenvolvendo suas próprias aplicações e serviços de dados sintéticos com base nas tecnologias NVIDIA.

Empresas de Dados Sintéticos

Parceiros de Prestação de Serviços

Comece Agora

Crie seu próprio pipeline de geração de dados sintéticos para simulações de robótica, inspeção industrial e outros casos de uso de IA física com o NVIDIA Isaac Sim.

Servidor RTX PRO: a Melhor Plataforma para IA Industrial e Física

O Servidor NVIDIA RTX PRO acelera todas as cargas de trabalho de digitalização industrial, simulação de robôs e geração de dados sintéticos.

Casos de Uso Relacionados