Skip to main content
Home

Visão geral

OpenZero permite criar conteúdo visual de alta qualidade a partir de descrições de texto simples (prompts) ou imagens de referência. Gere imagens ou vídeos dinâmicos em qualquer estilo, depois refine-os iterativamente com prompts adicionais, aumente a resolução para saída em alta definição e até adicione sincronização labial com áudio. Exporte os recursos finalizados como arquivos independentes ou importe-os diretamente para edição.
A plataforma está sendo sempre atualizada, com os melhores modelos e recursos adicionados quase a cada semana.

Guia

Siga estes passos para criar seu primeiro asset visual:

1 Selecione seu workflow

Use os atalhos na ‘Home’ para escolher entre geração de Imagem ou Vídeo.

2 Forneça um prompt ou referência

Descreva o resultado desejado usando linguagem natural na caixa de prompt, de preferência em inglês para conseguir os melhores resultados. Para mais controle, arraste imagens ou vídeos existentes nas abas Explorar ou Histórico para os espaços de referência/imagens, ou faça upload de suas próprias imagens de referência em diversos formatos de arquivo: JPG, PNG ou WEBP.

3 Escolha um modelo e configurações

Selecione o modelo de IA generativa ideal para seu objetivo (ex: OpenAI Sora 2 Pro, Kling 2.6 pro, Flux 2 Pro, Seedream 4.5 etc). Consulte a seção Modelos para informações detalhadas sobre cada modelo. Ajuste configurações como proporção de tela, resolução, duração (para vídeo) e o número de variações a serem geradas. Note que os fluxos de criação de imagem e vídeo têm interfaces diferentes, mas visualmente coesas, a fim de oferecerem o melhor em termos de uso para cada modelo.

4 Gere seu asset

Clique no botão Gerar. Seus assets de imagem serão criados e exibidos na aba Histórico para revisão, com os detalhes da imagem criada. Em Explorar, você poderá clicar para visualizar a imagem em tamanho maior. Já para vídeos, os assets criados são exibidos numa mesma visualização. Em ambos os workflows, ao clicar nos prompts em Criar vídeo ou no Histórico (para imagens), os textos são carregados automaticamente na seção de prompts.

5 Aprimore e refine

Use o modelo de aprimoramento da Topaz para aperfeiçoar sua mídia. Faça upscale da resolução para imagens e vídeos e deixe seus assets prontos para uso. Se quiser, envie sua imagem para a seção de vídeo e aplique sincronização labial realista com áudio. Na seção “Criar vídeos”, clique em Estender vídeo para gerar uma continuação da história a partir do último frame do vídeo.

6 Salve sua criação

Baixe o asset como arquivo independente.

Fluxo de trabalho

O processo de criação conduz você da inspiração ao asset finalizado em três etapas:

Gerar

Use a caixa de prompt para descrever o que você quer criar, selecione um modelo, ajuste suas configurações e dê vida à sua ideia.

Histórico

Revise suas gerações na aba Histórico (imagens) ou na própria seção Criar vídeos para iterar e aprimorar. Recrie variações, reutilize prompts e aplique aprimoramentos como upscaling e sincronização labial.

Salvar

Baixe assets finalizados em vários formatos.

Gerar imagens e vídeos

Gerar Imagem Gerar Video A caixa de prompt está fixada na parte inferior da página em Criar imagem e ao lado esquerdo em Criar vídeo; junto, ela fornece todos os controles para criar conteúdo visual.

Defina o prompt

Escreva seu prompt: No campo principal, descreva o que você quer gerar usando linguagem natural, preferencialmente em inglês. Seja claro e descritivo para obter melhores resultados.

Escolha modelos e configurações

Modelos Modelos Videos Selecione o modelo: Abra o menu de modelos para navegar pelas opções disponíveis como OpenAI Sora 2 Pro, Kling 2.6 Pro, Seedancwe 1.5 Pro, Flux 2 Pro, GPT Image 1.5 etc. Cada modelo possui pontos fortes e capacidades únicas listadas para fácil comparação. Consulte a seção Modelos para informações detalhadas. Ajuste as configurações: Refine sua geração com configurações que aparecem abaixo do prompt. Estas variam por modelo, mas geralmente incluem:
  • Proporção de Tela: Controle as dimensões da sua saída
  • Resolução: Defina o nível de qualidade
  • Duração: Especifique a duração do vídeo (para modo vídeo)
  • Número de Gerações: Crie até 4 variações de uma vez (por enquanto, apenas para imagens).
Use os controles: Em modelos compatíveis, ative Áudio, adicione um Prompt Negativo para excluir elementos indesejados ou ajuste o Controle de Som.

Adicione referências

Refs Para maior controle sobre a saída, adicione referências visuais para guiar a geração. A disponibilidade depende do modelo selecionado. Oferecemos suporte a uma ampla variedade de formatos de arquivo de imagem, incluindo JPG, PNG e WEBP. Em quase todos os modelos de imagem e em todos os modelos de vídeo é possível gerar assets a partir dessas imagens de referência. Modelos de vídeo como Kling O1 e Kling O1 Edit permitem inclusive a criação de Elementos, que podem ser armazenados no OpenZero e usados para a criação de personagens consistentes nos vídeos. Quadro Inicial (Vídeo): Define a imagem de abertura do seu vídeo. Quadro Final (Vídeo): Define a imagem final, influenciando a transição. Já para modelos de imagem, a quantidade de imagens de referência aceitas para upload varia: Nano Banana Pro e Seedream 4.5: 11 imagens (1 imagem base + 10 refs) Flux 2 Pro: 9 imagens (1 imagem base + 8 refs) Nano Banana: 9 imagens (1 imagem base + 8 refs) Refs de Imagem (Imagem): Forneça uma ou mais imagens de estilo/estrutura para guiar o estilo e a aparência final da primeira imagem (base) ou para editar uma nova imagem.
Arraste e solte itens diretamente das abas Explorar ou _Histórico _(Criar imagem) nos slots de referência para um fluxo de trabalho mais rápido. Em Criar vídeo, arrasta imagens nos slots de imagens.

Gere o asset

Antes de gerar, um indicador de custo por créditos mostra o valor total correspondente ao número de recursos que você escolheu criar e modelo escolhido. Quando estiver pronto, clique em Gerar. Suas novas criações aparecerão na aba Histórico em Criar imagem e na própria seção em Criar vídeo.

Criações

Imagens

Historico A aba _Histórico _fornece um registro cronológico de tudo o que você gerou e funciona como um espaço de trabalho para aprimorar trabalhos anteriores. Fornece detalhes como modelo e proporção da imagem, entre outros. Explorar A aba _Explorar _mostra tudo o que foi criado e permite clicar para expandir a visualização e os detalhes da imagem gerada. Também oferece algumas opções de continuidade no fluxo criativo: Usar como referência: envia a imagem para os slots de imagens de referência para criação de novas imagens a partir da que foi gerada. Aumentar resolução da imagem: envia a imagem para a seção Aprimorar, onde o arquivo pode ter a resolução aumentada (upscaling). Criar vídeo: envia a imagem para a seção Criar vídeo para ser usada como frame inicial na criação de vídeo.

Vídeos

Gerar Video Os vídeos gerados são mostrados automaticamente na própria seção. Aumentar resolução do vídeo: envia o vídeo para a seção Aprimorar, onde o arquivo pode ter a resolução aumentada (upscaling) com o Topaz Upscale. Estender vídeo: gera uma continuação da história a partir do último frame do vídeo, que é enviado automaticamente para o slot de “Frame inicial”.

Formatos de download suportados

📹 Vídeo:
  • MP4: Codecs H.264, H.265. Qualidade até 4K (com upscaling)
🖼️ Imagem:
  • PNG ou JPG (varia com o modelo): Saída em alta resolução de até 4K, sem perdas

Modelos

OpenZero oferece acesso a modelos especializados otimizados para diferentes casos de uso. Cada modelo apresenta capacidades únicas, desde iteração rápida até qualidade pronta para produção. Modelos de pós-processamento exigem um resultado já gerado, embora você também possa enviar seu próprio arquivo de imagem ou vídeo./

Imagem

Modelo do Google com alta resolução de até 4K para geração e edição de alta qualidade de imagens a partir de prompts de texto.Recursos:
  • Suporta até 11 referências de imagem para orientar a geração
  • Gera até 4 imagens por vez
Opções de saída:
  • Proporções: 21:9, 16:9, 5:4, 4:3, 3:2, 1:1, 2:3, 3:4, 4:5, 9:16
Ideal para:
  • Criação e iteração de imagens com alta qualidade e prontas para uso
Um modelo versátil da OpenAI para criação e edição de imagens com alto nível de precisão, usando linguagem natural como principal forma de controle.Foi desenhado para quem precisa direcionar o visual com clareza.Recursos principais
  • Aceita até 9 imagens de referência para guiar estilo, composição e detalhes
  • Gera até 4 variações por execução, facilitando comparação e escolha
  • Mantém boa fidelidade ao prompt mesmo em edições e ajustes finos
Opções de saída
  • Proporções: 3:2, 1:1, 2:3
  • Qualidade: low, medium, high, equilibrando custo e definição conforme o uso
Indicado para
  • Criação de imagens orientadas por texto com controle real
  • Edição visual (ajustes, variações, iterações) sem precisar refazer tudo do zero
  • Workflows de design, marketing, produto e prototipagem visual
Um modelo de imagem especializado para gerar sequências de múltiplos quadros ou cenas com grande movimento e ação.Recursos:
  • Excelente na criação de imagens com física estável e transições coerentes
  • Aceita até 11 referências de imagem para orientar a geração
  • Gera até 4 imagens por vez
Opções de saída:
  • Proporções: automático, 16:9, 4:3, 1:1, 3:4, 9:16
Ideal para:
  • Cenas de ação e composições dinâmicas
Primeira versão do modelo do Google com alta velocidade para geração e edição rápida e de qualidade de imagens a partir de prompts de texto.Recursos:
  • Suporta múltiplas referências de imagem para orientar a geração
  • Gera até 4 imagens por vez
Opções de saída:
  • Proporções: 21:9, 16:9, 5:4, 4:3, 3:2, 1:1, 2:3, 3:4, 4:5, 9:16
Ideal para:
  • Criação e iteração rápida de imagens
Um modelo profissional para geração e edição avançada de imagens, oferecendo forte coerência de cena e controle de estilo.Recursos:
  • Controle de estilo baseado em imagem, exigindo uma imagem de referência para orientar a estética visual
  • Aceita até 9 imagens de referência
  • Gera até 4 imagens por vez
Opções de saída:
  • Proporções: 21:9, 16:9, 4:3, 3:2, 1:1, 2:3, 3:4, 4:5, 9:16, 9:21
Ideal para:
  • Conteúdo profissional com requisitos precisos de estilo
Modelo de geração de imagens do Google focado em qualidade visual, realismo e coerência estética a partir de descrições em linguagem natural.Recursos principais
  • Geração de imagens com alto nível de realismo e iluminação natural
  • Forte consistência de estilo dentro de uma mesma execução
  • Boa interpretação de cenas, ambientes e composição
Opções de saída
  • Proporções variadas (dependendo da integração) de até 2K
  • Qualidade otimizada automaticamente para fidelidade visual
Indicado para
  • Criar imagens finais para campanhas, social, concept art e mockups
  • Cenas, personagens e ambientes com estética bem resolvida
  • Quando você quer algo que “já parece pronto” sem muito retrabalho
Um modelo leve, mas poderoso, da OpenAI para geração de imagens rápidas a partir de texto, focado em velocidade, custo baixo e iteração ágil.É feito para testar ideias visualmente ou projetos que não requerem alta resolução.Recursos principais
  • Geração rápida com baixo custo computacional
  • Ideal para criar rascunhos visuais, variações e conceitos iniciais
  • Boa interpretação de prompts simples e estilos amplos
Opções de saída
  • Proporções básicas (dependendo da integração)
  • Qualidade otimizada para preview e exploração, não para entrega final
Indicado para
  • Brainstorming visual
  • Moodboards, wireframes visuais, thumbnails
  • Prototipagem de ideias antes de passar para modelos mais pesados

Vídeo

O modelo de vídeo da OpenAI mais avançado e de alta fidelidade para resultados cinematográficos à sua disposição.Entradas de geração:
  • Texto para Vídeo
  • Quadro inicial
Recursos:
  • Saída de altíssima fidelidade, nível profissional, com áudio sincronizado
  • Controle preciso de múltiplos quadros
  • Excelente em movimentos complexos e aderência ao prompt
  • Durações fixas: 4s, 8s e 12s
  • Criação em lote com até 4 gerações por vez
Opções de saída:
  • Resoluções: 720p, 1080p
  • Proporções: 16:9, 9:16
Ideal para:
  • Conteúdo de vídeo cinematográfico em nível profissional
O frame final não é atualmente suportado. Não é possível fornecer referências de imagem com pessoas reais. O som está habilitado por padrão.
A versão padrão e de alta velocidade do modelo avançado de vídeo da OpenAI, ajustada para criação de conteúdo do dia a dia.Entradas de geração:
  • Texto para Vídeo
  • Quadro inicial
Recursos:
  • Vídeos realistas, com consciência física e áudio sincronizado
  • Controle refinado de cena
  • Durações fixas: 4s, 8s e 12s
  • Criação em lote com até 4 gerações por vez
  • Forte consistência narrativa e de personagens
Opções de saída:
  • Resoluções: 720p, 1080p
  • Proporções: 16:9, 9:16
Ideal para:
  • Criação de conteúdo cotidiano com física realista
O frame final não é atualmente suportado. Não é possível fornecer referências de imagem com pessoas reais. O som está habilitado por padrão.
Modelo avançado de geração de vídeo por IA focado em controle de movimento, consistência visual e direção de cena a partir de prompts e referências.Ele é menos sobre “surpresa criativa” e mais sobre executar exatamente o que você dirige.Recursos principais
  • Frame inicial e final
  • Controle preciso de movimento de câmera, corpo e objetos
  • Suporte a imagens de referência para manter personagens e cenários consistentes
  • Ótima coerência temporal entre frames (menos “derretimento” visual)
  • Ideal para cenas com ação, coreografia e tracking de câmera
Opções de saída
  • Resoluções até 1080p
  • Duração variável por clipe (dependendo da integração)
  • Estilos cinematográficos, realistas ou estilizados
Indicado para
  • Reels, trailers, cenas de filme e comerciais em vídeo
  • Conteúdo com movimento coreografado
  • Quando você precisa que a IA “obedeça o diretor”, não apenas improvise
Modelo de geração de vídeo por IA projetado para produção consistente, previsível e escalável de clipes a partir de texto e referências visuais.É orientado a workflows de produção, não a experimentação artística aleatória.Recursos principais
  • Frame inicial e final
  • Geração de vídeo com alta estabilidade temporal
  • Suporte a imagens de referência para personagens, cenários e estilo
  • Boa preservação de identidade visual entre frames
  • Adequado para pipelines de conteúdo e automação
Opções de saída
  • Resoluções até 1080p
  • Durações configuráveis por clipe
  • Perfis de qualidade balanceados entre custo e fidelidade visual
Indicado para
  • Criação de vídeos para marketing, social media e produto
  • Produção de múltiplas variações de uma mesma cena
  • Plataformas que exigem previsibilidade, não apenas criatividade
Motor multimodal de vídeo por IA que combina texto, imagens e vídeo como entrada para gerar, editar e continuar cenas com coerência visual e controle direcional avançado.Recursos principais
  • Multimodalidade nativa: aceita prompt de texto, imagens de referência (elementos/objetos/personagens) e vídeo de entrada para geração orientada por contexto.
  • Geração e edição de vídeo: text-to-video, image-to-video e edição por linguagem natural — sem necessidade de mascaramento tradicional, tracking ou keyframing.
  • Consistência de cena e personagens: mantém rostos, roupas, objetos e cenários estáveis em múltiplos cortes e ângulos quando referenciados.
  • Controle criativo unificado: combina tarefas como adição de sujeito + mudança de fundo + restyling em uma única chamada de API.
  • Continuidade e sequência: suporte a frames inicial/final e referência de vídeo para conectar tomadas com linguagem cinematográfica coerente.
Opções de saída
  • Vídeo em formato MP4 com controle de duração e proporção conforme parâmetro da integração.
  • Saídas coerentes de movimento e linguagem visual entre frames e cenas subsequentes.
Indicado para
  • Produção de vídeo profissional com narrativa contínua ou cenas sequenciais.
  • Edição baseada em texto — alterar elementos de cena, mudar iluminação ou restilar personagens diretamente por prompt.
  • Pipelines de conteúdo escaláveis que exigem saída previsível, reutilização de ativos e consistência visual.
Tecnologia de transferência de movimento por IA incorporada ao Kling Video 2.6, projetada para capturar e aplicar movimento real extraído de vídeos de referência a imagens estáticas, gerando vídeos com controle preciso de ação, postura e expressões.Recursos principais
  • Transferência de movimento baseada em referência: importa movimentos de um vídeo de 3 a 30 segundos e aplica diretamente a uma imagem de personagem.
  • Captura de corpo completo e detalhes finos: preserva postura, gestos de mãos e expressões faciais com alta fidelidade temporal — inclusive em ações rápidas e coreografias.
  • Orientação de personagem flexível: permite ajustar o enquadramento da ação usando modos que mantêm o personagem alinhado ao vídeo de referência ou à composição da imagem original.
  • Refinamento de cena via prompt: além do movimento, prompts de texto podem ajustar cenário, iluminação, atmosfera e estilo visual sem afetar a transferência de movimento.
  • Controle opcional de áudio: possibilidade de manter o áudio original da referência ou gerar saída silenciosa para pós-produção sonora.
Opções de saída
  • Geração de vídeo de 3 a 30 segundos em 720p ou 1080p, com movimento contínuo e coerente.
  • Suporte a múltiplos formatos de referência (imagem e vídeo)
Indicado para
  • Animação de personagens com movimento realista diretamente a partir de vídeos de referência.
  • Produção de conteúdo visual com ações específicas (dança, esporte, gestos) sem rigging ou pipelines tradicionais de mocap.
  • Criação de vídeos para social media, marketing e storytelling que dependem de transferência de movimento previsível e estável.
Versão avançada do LTX, orientada a qualidade visual, consistência e controle de cena.Equilibra velocidade com fidelidade estética.Recursos principais
  • Melhor coerência temporal que o LTX Fast
  • Maior estabilidade de personagens e objetos
  • Interpretação mais precisa de prompts
Opções de saída
  • Resoluções e durações superiores ao Fast
  • Perfis de qualidade configuráveis
Indicado para
  • Conteúdo comercial e institucional
  • Vídeos de produto e marketing
  • Produção recorrente com padrão visual definido
Modelo de vídeo otimizado para velocidade máxima e custo reduzido, com foco em geração em massa.Não é um modelo cinematográfico — é um motor de testes e gerações para redes sociais.Recursos principais
  • Renderização acelerada
  • Baixo custo por clipe
  • Boa estabilidade para cenas simples e loops
Opções de saída
  • Durações curtas
  • Qualidade voltada para preview e distribuição rápida
Indicado para
  • Conteúdo em escala (feeds, ads, variações de criativos)
  • Testes A/B visuais
  • Automação de vídeos
Modelo avançado de sincronização labial realista voltado à criação de humanos e personagens digitais dinâmicos e cinematográficos a partir de imagem e áudio.Projetado para workflows profissionais, ele vai além de avatares estáticos: personagens podem se mover, reagir e interagir de forma realista.Recursos principais
  • Geração de atores digitais com movimento corporal completo, gestos naturais e expressões faciais fluidas
  • Controle de cena e de personagem por texto e áudio, incluindo orientações de câmera e timing
  • Suporte a cenários com múltiplos personagens interagindo de forma coerente
  • Interpretação semântica de áudio que alinha ação e expressão ao conteúdo falado
Opções de saída
  • Vídeos com qualidade cinematográfica, com composição de cena, movimentos planejados e depth
  • Controle de ângulos de câmera, zoom e enquadramento via prompt
  • Saídas ajustáveis conforme necessidade de produção
Indicado para
  • Produção de conteúdo audiovisual profissional: marketing, institucional, treinamentos
  • Criação de personagens digitais realistas para vídeos narrativos
  • Integração em pipelines de vídeo com atores virtuais em escala
  • Aplicações educacionais, corporativas e comerciais que exigem performance digital realista