Estão se tornando populares softwares que a partir de um texto geram imagens. Esse processo, baseado em inteligência artificial, vem sendo chamado “síntese de imagens” e o texto inicial, “prompt”.
Vivaldo José Breternitz (*)
A principal ferramenta de síntese de imagens chinesa, o ERNIE-ViLG, foi criado pela Baidu, dona de um dos maiores sistemas de busca do mundo, cujo número de usuários na China supera o do Google; é também dona do Baidu Baike, sistema similar à Wikipedia.
Segundo relata a MIT Technology Review, o ERNIE-ViLG deixa de atender solicitações de geração de imagens quando estas referem-se aos líderes chineses e a temas por eles considerados sensíveis, como “Praça Tiananmen”, o local onde o governo massacrou manifestantes em 1989.
Testes feitos pelo portal Ars Technica, chegaram a resultados semelhantes: quando são submetidos textos como “democracia na China” e “bandeira chinesa”, não há geração de imagens, sendo exibida uma mensagem em chinês que diz algo como “o conteúdo de entrada não atende às regras vigentes, ajuste e tente novamente”.
Outras ferramentas impõem restrições no processo de síntese de imagens, como por exemplo a DALL-E 2, da americana da OpenAI, que não gera imagens a partir de textos que remetem à violência e nudez.
Não está claro se o Baidu aplica autocensura ao ERNIE-ViLG para evitar possíveis problemas com o governo chinês, mas, considerando o histórico de censura na China, não é surpresa se estiver seguindo determinações da ditadura ali vigente.
(*) É Doutor em Ciências pela Universidade de São Paulo, é professor, consultor e diretor do Fórum Brasileiro de Internet das Coisas.