A próxima geração do gerador de vídeo da OpenAI chegou. Sora 2, o mais recente modelo de geração de vídeo e áudio da empresa, anuncia capacidades de vídeo fotorrealistas aprimoradas, e um novo aplicativo Sora está sendo apresentado como uma plataforma social para os usuários compartilharem, remixarem e descobrirem vídeos gerados por IA. Apresentado em uma transmissão ao vivo na tarde dessa terça-feira (30), Sora 2 representa o mais recente em uma onda de ferramentas de IA generativa multimídia que permitem aos usuários criar imagens, vídeos e áudios cada vez mais realistas.
Baseado na tecnologia anterior de geração de imagens por IA, Sora 2 permite que os usuários criem “participações especiais”, ou aparições como convidados, de si mesmos e de outros em vídeos. O recurso exige que os usuários façam uma gravação única de vídeo e áudio de si mesmos para verificar sua identidade.
Como muitas plataformas de mídia social existentes, o aplicativo Sora contará com um feed algorítmico exibindo vídeos adaptados aos interesses dos usuários com base em quem eles interagem e nos tópicos com os quais podem se envolver. O feed incluirá um sistema de “classificação direcionável” para que os usuários personalizem ainda mais o que desejam ver, de acordo com detalhes publicados pela OpenAI.
Sora 2 baseia-se no modelo Sora original lançado em fevereiro de 2024. Enquanto a versão inicial do Sora às vezes tinha dificuldade em representar movimentos realistas, como uma bola de basquete quicando na tabela, a OpenAI disse na terça-feira que Sora 2 “é melhor em obedecer às leis da física”.
Leia também
Shutdown: Governo dos EUA entra em paralisação após fracasso na aprovação do orçamento
Demonstrações apresentadas no site da OpenAI exibiram cenas de ação fotorrealistas de acrobacias como tombos ginásticos e truques de skate, embora um clipe de um artista marcial se apresentando em um lago de carpas apresentasse um bastão que não conseguia manter sua forma.
Sora 2 também parece ser capaz de gerar fala, algo que a versão anterior do Sora não conseguia fazer sozinha. “O modelo está longe de ser perfeito e comete muitos erros, mas é uma validação de que escalar ainda mais redes neurais em dados de vídeo nos aproximará da simulação da realidade”, escreveu a OpenAI em seu anúncio.
Na terça-feira, o cientista de pesquisa da OpenAI, Gabriel Petersson, exibiu as capacidades de participação especial do modelo postando um vídeo no X que apresentava sua própria imagem montando um dragão, mergulhando de um navio de carga e correndo pelo escritório da OpenAI com a imagem do CEO Sam Altman.
O aplicativo Sora, alimentado por Sora 2, agora está disponível para download em sistemas iOS, mas o acesso ao serviço permanece apenas por convite. Os usuários podem solicitar acesso através do aplicativo.
A OpenAI sinalizou que pode lançar o acesso lentamente nos Estados Unidos e no Canadá, inicialmente dando aos usuários “limites generosos” na criação de vídeos. Sistemas de IA como Sora 2 exigem poder de computação intenso, então as empresas frequentemente precisam limitar o acesso dos usuários para garantir que os serviços permaneçam acessíveis para os outros.
“Transparente, nosso único plano atual é eventualmente dar aos usuários a opção de pagar algum valor para gerar um vídeo extra se houver muita demanda em relação à computação disponível”, escreveu a OpenAI em seu anúncio de lançamento, referindo-se ao poder de computação finito.
A OpenAI também reconheceu preocupações sobre os riscos potenciais do aplicativo, publicando um post separado no blog sobre segurança em conjunto com o anúncio maior.
Todos os vídeos gerados pelo Sora incluirão uma marca d’água, bem como metadados padrão da indústria, para deixar claro que foram feitos com IA, escreveu a empresa. Ela acrescentou que as imagens dos usuários podem ser transformadas em participações especiais apenas com seu consentimento, que pode ser revogado a qualquer momento.
Contas de adolescentes no Sora também estarão sujeitas a controles parentais e limites de tempo no uso do aplicativo.
“Na criação, barreiras de segurança buscam bloquear conteúdo inseguro antes que seja feito — incluindo material sexual, propaganda terrorista e promoção de automutilação — verificando tanto prompts quanto saídas em múltiplos quadros de vídeo e transcrições de áudio”, escreveu a OpenAI no post.
Para se proteger contra riscos potenciais, a OpenAI disse que também está expandindo sua equipe de moderadores humanos para revisar conteúdo em busca de bullying.
A OpenAI enquadrou Sora 2 como um passo importante em direção a sistemas de IA mais poderosos. “Modelos de vídeo estão ficando muito bons, muito rapidamente”, disse a OpenAI em seu comunicado de lançamento. “Simuladores de mundo de propósito geral e agentes robóticos vão reformular fundamentalmente a sociedade e acelerar o arco do progresso humano.”
Reportagem do portal NBC News.