OpenAI lança modelo de inteligência artificial que transforma texto em vídeo
Empresa responsável pelo ChatGPT criou Sora, que pode fazer vídeos realistas de até um minuto
A empresa de inteligência artificial OpenAI – responsável pelo ChatGPT – criou um novo modelo chamado Sora que poderá transformar texto em vídeos de até um minuto que são “realistas” e “criativos”. A novidade foi anunciada em uma publicação no blog da empresa na última quarta-feira (14).
Segundo a OpenAI, Sora é capaz de gerar os vídeos de até 60 segundos a partir de instruções em textos, com a habilidade de criar cenas com vários personagens, específicos tipos de movimento e cenários cheios de detalhes.
“O modelo entende não apenas o que o usuário pediu, mas também todas as coisas que existem nesse mundo físico”, informou na publicação.
OpenAI disse que pretende trainar os modelos de inteligência artificial para ajudar as pessoas a “resolverem problemas que demanda uma interação no mundo real”.
Esse é o novo esforço da empresa responsável pelo chatbot ChatGPT que viralizou nas redes sociais e continua a impulsionar o movimento de IA generativa.
Embora os “modelos multimodais” não sejam novos e já existam modelos que transforme textos em vídeos, o que diferencia esse novo modelo é a duração e a precisão que a OpenAI alega que Sora tem, de acordo com Reece Hayden, um analista sênior da empresa ABI Research, de pesquisa de mercado.
Hayden disse que esses tipos de inteligência artificial poderiam ter um impacto maior no mercado de entretenimento digital com conteúdo personalizado que pode ser disponibilizado em diferentes plataformas de streaming e canais de televisão.
“Um uso óbvio é o na TV; criando cenas pequenas para dar apoio para narrativas”, disse Hayden. “O modelo ainda é limitado, no entanto, mas mostra um direcionamento para o mercado.”
Ao mesmo tempo, OpenAI disse que Sora ainda é um trabalho em curso com uma “fraqueza” clara, particularmente quando se trata de detalhes de profundida e espaço, misturando direita e esquerda, causa e efeito. Um exemplo é como se criasse o vídeo de alguém dando uma mordida num cookie – mas a marca de mordida ficasse errada no vídeo.
Agora, a mensagem que fica da OpenAI é focada em segurança. A empresa disse que planeja trabalhar com um time de especialistas para testar o modelo recente e olhar atentamente para várias áreas, incluindo desinformação, conteúdo de ódio e preconceito. A empresa disse que também está construindo ferramentas para ajudar a detectar informações enganosas.
Sora será disponibilizada primeiro para professores de ciber segurança, chamados de “red teamers”, que poderão acessar e avaliar os riscos e danos do produto. O acesso também será concedido para alguns artistas visuais, designers e cineastas para coletar feedback sobre como os profissionais da economia criativa podem usar o modelo de IA.
A nova atualização ocorre enquanto a OpenAI continua a aprimorar o ChatGPT.
Mais cedo nesta semana, a empresa disse que está testando um novo recurso que permite que os usuários possam controlar a memória do ChatGPT. Essa nova habilidade permite que os usuários possam pedir para que o chatbot crie uma memória para que as futuras conversas sejam personalizadas – ou até pedir para que o ChatGPT esqueça algo que foi dito.