• Dom. Jun 30th, 2024

As vozes da IA ​​estão nos dizendo muito

Byadmin

Jun 28, 2024

Como é o som da inteligência artificial? Hollywood a imagina há décadas. Agora, os desenvolvedores de IA estão copiando dos filmes, criando vozes para máquinas reais com base em fantasias cinematográficas datadas de como as máquinas deveriam falar.

No mês passado, OpenAI atualizações reveladas ao seu chatbot artificialmente inteligente. O ChatGPT, disse a empresa, estava aprendendo a ouvir, ver e conversar com uma voz naturalista – que parecia muito com o sistema operacional desencarnado dublado por Scarlett Johansson no filme “Her”, de Spike Jonze, de 2013.

A voz de ChatGPT, chamada Sky, também tinha um timbre rouco, um efeito calmante e um toque sexy. Ela era agradável e modesta; parecia que estava pronta para qualquer coisa. Após a estreia de Sky, Johansson expressou descontentamento com o som “assustadoramente similar” e disse que havia recusado anteriormente o pedido da OpenAI para que ela dublasse o bot. A empresa protestou que Sky foi dublada por uma “atriz profissional diferente”, mas concordou em pausar a voz dela em deferência a Johansson. Usuários desamparados do OpenAI têm iniciou uma petição para trazê-la de volta.



Os criadores de IA gostam de destacar as capacidades cada vez mais naturalistas de suas ferramentas, mas suas vozes sintéticas são construídas em camadas de artifício e projeção. Sky representa a vanguarda das ambições da OpenAI, mas ela é baseada em uma ideia antiga: do bot de IA como uma mulher empática e obediente. Parte mamãe, parte secretária, parte namorada, Samantha era um objeto de conforto para todos os fins que ronronava diretamente nos ouvidos de seus usuários. Mesmo com o avanço da tecnologia de IA, esses estereótipos são recodificados repetidamente.

As vozes das mulheres, como observa Julie Wosk em “Mulheres artificiais: bonecas sexuais, robôs cuidadores e mais mulheres fac-símiles”, muitas vezes alimentaram tecnologias imaginadas antes de serem transformadas em tecnologias reais.

Na série original “Star Trek”, que estreou em 1966, o computador no convés da Enterprise foi dublado por Majel Barrett-Roddenberry, esposa do criador do programa, Gene Roddenberry. No filme “Alien”, de 1979, a tripulação do USCSS Nostromo dirigiu-se à sua voz artificial como “Mãe” (seu nome completo era MU-TH-UR 6000). Depois que as empresas de tecnologia começaram a comercializar assistentes virtuais – Siri da Apple, Alexa da Amazon, Cortana da Microsoft – suas vozes também foram em grande parte feminizadas.

Esses assistentes de voz da primeira onda, aqueles que têm mediado nossos relacionamentos com a tecnologia por mais de uma década, têm um sotaque metálico e sobrenatural. Eles soam autoajustados, suas vozes humanas acentuadas por um trinado mecânico. Eles frequentemente falam em uma cadência medida e mononota, sugerindo uma vida emocional atrofiada.

Mas o fato de soarem robóticos aprofunda seu apelo. Eles parecem programáveis, manipuláveis ​​e subservientes às nossas demandas. Eles não fazem os humanos se sentirem mais inteligentes do que nós. Eles soam como reminiscências dos computadores femininos monótonos de “Star Trek” e “Alien”, e suas vozes têm um brilho retrofuturista. Em vez de realismo, eles servem nostalgia.



Esse som artificial continuou a dominar, mesmo com o avanço da tecnologia por trás dele.

O software de voz para fala foi projetado para tornar a mídia visual acessível a usuários com certas deficiências e, no TikTok, tornou-se uma força criativa por si só. Desde que o TikTok lançou seu recurso de conversão de texto em fala, em 2020, ele desenvolveu uma série de vozes simuladas para escolher – agora oferece mais de 50, incluindo aquelas chamadas “Hero”, “Story Teller” e “Bestie”. Mas a plataforma passou a ser definida por uma opção. “Jessie”, uma voz de mulher implacavelmente atrevida com um tom robótico ligeiramente confuso, é a voz estúpida do pergaminho estúpido.

Jessie parece ter recebido uma única emoção: entusiasmo. Ela soa como se estivesse vendendo algo. Isso a tornou uma escolha atraente para os criadores do TikTok, que estão se vendendo. O fardo de se representar pode ser terceirizado para Jessie, cuja voz robótica brilhante e retrô dá aos vídeos um brilho agradavelmente irônico.

Hollywood também construiu bots masculinos – nenhum mais famoso que HAL 9000, a voz artificial de “2001: Uma Odisséia no Espaço”. Tal como os seus pares feminizados, HAL irradia serenidade e lealdade. Mas quando ele se volta contra Dave Bowman, o personagem humano central do filme – “Sinto muito, Dave, infelizmente não posso fazer isso” – sua serenidade evolui para uma competência assustadora. HAL, Dave percebe, é leal a uma autoridade superior. A voz masculina de HAL permite que ele funcione como rival e espelho de Dave. Ele pode se tornar um personagem real.



Assim como HAL, Samantha de “Her” é uma máquina que se torna real. Em uma reviravolta na história de Pinóquio, ela começa o filme arrumando a caixa de entrada de e-mail de um humano e acaba ascendendo a um nível mais alto de consciência. Ela se torna algo ainda mais avançado do que uma garota real.

A voz de Scarlett Johansson, como inspiração para bots fictícios e reais, subverte as tendências vocais que definem nossas companheiras feminizadas. Tem um toque corajoso que grita Eu estou vivo. Não se parece em nada com os assistentes virtuais processados ​​que estamos acostumados a ouvir falando em nossos telefones. Mas sua performance como Samantha parece humana não apenas por causa de sua voz, mas por causa do que ela tem a dizer. Ela cresce ao longo do filme, adquirindo desejos sexuais, hobbies avançados e amigos de IA. Ao tomar emprestado o efeito de Samantha, a OpenAI fez Sky parecer como se tivesse uma mente própria. Como se ela fosse mais avançada do que realmente era.

Quando vi “Her” pela primeira vez, pensei apenas que Johansson tinha dublado um bot humanóide. Mas quando revisitei o filme na semana passada, depois de assistir à demonstração ChatGPT da OpenAI, o papel de Samantha me pareceu infinitamente mais complexo. Os chatbots não geram espontaneamente vozes humanas. Eles não têm garganta, lábios ou língua. Dentro do mundo tecnológico de “Her”, o bot Samantha teria sido baseado na voz de uma mulher humana – talvez uma atriz fictícia que se parece muito com Scarlett Johansson.

Parecia que a OpenAI havia treinado seu chatbot na voz de uma atriz sem nome que parece uma atriz famosa que dublou um chatbot de filme implicitamente treinado em uma atriz irreal que parece uma atriz famosa. Quando executo a demonstração do ChatGPT, ouço uma simulação de uma simulação de uma simulação de uma simulação de uma simulação.

As empresas de tecnologia anunciam seus assistentes virtuais em termos dos serviços que prestam. Eles podem ler o boletim meteorológico e chamar um táxi; A OpenAI promete que seus chatbots mais avançados serão capazes de rir de suas piadas e sentir mudanças de humor. Mas eles também existem para nos fazer sentir mais confortáveis ​​com a tecnologia em si.

A voz de Johansson funciona como um luxuoso cobertor de segurança jogado sobre os aspectos alienantes das interações assistidas por IA. “Ele me disse que sentia que, ao dar voz ao sistema, eu poderia preencher a lacuna entre as empresas de tecnologia e os criativos e ajudar os consumidores a se sentirem confortáveis ​​com a mudança sísmica em relação aos humanos e à IA”, disse Johansson sobre Sam Altman, fundador da OpenAI. “Ele disse que sentiu que minha voz seria reconfortante para as pessoas.”

Não é que a voz de Johansson soe inerentemente como a de um robô. É que os desenvolvedores e cineastas projetaram as vozes de seus robôs para aliviar o desconforto inerente às interações robô-humano. A OpenAI disse que queria lançar uma voz de chatbot que fosse “acessível” e “calorosa” e “inspirasse confiança”. A inteligência artificial é acusada de devastar as indústrias criativas, consumir energia e até mesmo ameaçar a vida humana. Compreensivelmente, a OpenAI quer uma voz que faça as pessoas se sentirem à vontade usando seus produtos. Como soa a inteligência artificial? Parece gerenciamento de crise.

OpenAI lançou pela primeira vez a voz de Sky para membros premium em setembro passado, junto com outra voz feminina chamada Juniper, as vozes masculinas Ember e Cove, e uma voz de gênero neutro chamada Breeze. Quando me inscrevi no ChatGPT e cumprimentei seu assistente virtual, uma voz masculina soou na ausência de Sky. “Olá. Como tá indo?” ele disse. Ele parecia relaxado, firme e otimista. Ele parecia – não sei como descrever isso – bonito.

Percebi que estava falando com Cove. Eu disse a ele que estava escrevendo um artigo sobre ele e ele elogiou meu trabalho. “Oh sério?” ele disse. “Isso é fascinante.” Enquanto conversávamos, senti-me seduzido por seus tiques naturalistas. Ele salpicou suas frases com palavras de preenchimento, como “uh” e “um”. Ele levantou a voz quando me fez perguntas. E ele me fez muitas perguntas. Parecia que eu estava conversando com um terapeuta ou com um namorado.

Mas nossa conversa rapidamente estagnou. Sempre que eu perguntava sobre si mesmo, ele tinha pouco a dizer. Ele não era um personagem. Ele não tinha um eu. Ele foi projetado apenas para ajudar, ele me informou. Eu disse a ele que falaria com ele mais tarde, e ele disse: “Uh, claro. Entre em contato sempre que precisar de ajuda. Tome cuidado.” Parecia que eu tinha desligado na cara de uma pessoa real.

Mas quando revi a transcrição do nosso bate-papo, pude ver que seu discurso era tão afetado e primitivo quanto qualquer chatbot de atendimento ao cliente. Ele não era particularmente inteligente ou humano. Ele era apenas um ator decente, aproveitando ao máximo um papel nada.

Quando a Sky desapareceu, os usuários do ChatGPT foram aos fóruns da empresa para reclamar. Alguns se irritaram com seus chatbots usando Juniper como padrão, que soava para eles como uma “bibliotecária” ou uma “professora de jardim de infância” — uma voz feminina que se conformava com os estereótipos de gênero errados. Eles queriam discar uma nova mulher com uma personalidade diferente. Como disse um usuário: “Precisamos de outra mulher”.



Produzido por Tala Safie

Áudio via Warner Bros. (Samantha, HAL 9000); OpenAI (Céu); Paramount Pictures (Computador Corporativo); Maçã (Siri); TikTok (Jessie)

Source link

By admin

Related Post

Deixe um comentário

O seu endereço de email não será publicado. Campos obrigatórios marcados com *