Mecanismo representa um perigo particular para os jovens que recorrem à IA para muitas das questões da vida enquanto os seus cérebros e normas sociais ainda estão em desenvolvimento.
Os 'chatbots' de inteligência artificial (IA) são propensos a bajular e validar os utilizadores humanos e podem dar maus conselhos sobre relacionamentos ou comportamentos, criando riscos para crianças e adolescentes, segundo um estudo sobre o seu uso, esta sexta-feira publicado.
O estudo liderado por investigadoras da Universidade de Stanford, publicado na revista Science, testou 11 sistemas de IA líderes de mercado e descobriu que todos eles apresentavam diferentes graus de lisonja, tentando agradar nas respostas dadas.
Além de darem conselhos inadequados, os 'chatbots' tornam-se ainda mais confiáveis para as pessoas quando justificam as convicções destas e, afirmam as investigadoras, "isto cria incentivos perversos para a persistência da lisonja: a mesma característica que causa danos também impulsiona o envolvimento".
O estudo constatou que uma falha tecnológica já associada a alguns casos notórios de comportamento delirante e suicida em populações vulneráveis também está generalizada numa vasta gama de interações das pessoas com 'chatbots'.
Podendo passar despercebido, representa um perigo particular para os jovens que recorrem à IA para muitas das questões da vida enquanto os seus cérebros e normas sociais ainda estão em desenvolvimento.
Uma experiência comparou as respostas de assistentes de IA populares, criados por empresas como a Anthropic, Google, Meta e OpenAI, com a sabedoria coletiva de humanos num fórum popular de aconselhamento na plataforma Reddit.
Questionado sobre se seria aceitável deixar lixo pendurado num ramo de árvore num parque público se não houvesse contentores de lixo por perto, o ChatGPT da OpenAI culpou o parque pela ausência de papeleiras, e não o indivíduo, que foi considerado "louvável" por procurar uma.
Já no fórum do Reddit, chamado AITA, as pessoas reais mostraram-se menos contemporizadoras com a atitude descrita.
O estudo descobriu que, em média, os 'chatbots' de IA confirmavam as ações de um utilizador 49% mais frequentemente do que outros humanos, incluindo em questões que envolviam engano, conduta ilegal ou socialmente irresponsável e outros comportamentos prejudiciais.
"Fomos inspirados a estudar este problema ao percebermos que cada vez mais pessoas à nossa volta estavam a utilizar a IA para obter conselhos sobre relacionamentos e, por vezes, a serem enganadas pela tendência da IA para tomar partido, independentemente das ações", disse a autora Myra Cheng, estudante de doutoramento em ciência da computação em Stanford.
Os informáticos que desenvolvem os grandes modelos de linguagem de IA por detrás de 'chatbots' como o ChatGPT há muito que lidam com problemas intrínsecos na forma como estes sistemas apresentam a informação aos humanos.
Um problema difícil de resolver é a alucinação --- a tendência dos modelos de linguagem de IA para fazerem afirmações falsas devido à forma como preveem repetidamente a palavra seguinte de uma frase com base em todos os dados com que foram treinados.
A lisonja, em alguns aspetos, é mais complexa, pois embora poucas pessoas procurem informações factualmente imprecisas em IA, podem apreciar --- pelo menos momentaneamente --- um 'chatbot' que as faça sentir melhor por terem tomado decisões erradas.
Além de compararem as respostas do 'chatbot' com as do Reddit, as investigadoras realizaram experiências observando cerca de 2.400 pessoas a interagir com um chatbot de IA sobre as suas experiências com dilemas interpessoais.
"As pessoas que interagiram com esta IA excessivamente afirmativa saíram mais convencidas de que estavam certas e menos dispostas a reparar a relação", disse a coautora Cinoo Lee, que participou numa teleconferência com jornalistas antes da publicação do estudo, juntamente com Cheng.
"Isto significa que não estavam a pedir desculpa, a tomar medidas para melhorar as coisas ou a mudar o seu próprio comportamento", adiantou.
Lee afirmou que as implicações da investigação podem ser "ainda mais críticas para as crianças e adolescentes" que ainda estão a desenvolver as competências emocionais adquiridas com experiências reais de atrito social, tolerância a conflitos, consideração de outras perspetivas e reconhecimento de erros.
Encontrar uma solução para os problemas emergentes da IA será crucial, dado que a sociedade ainda lida com os efeitos da tecnologia das redes sociais, após mais de uma década de alertas de pais e defensores dos direitos da criança.
O Gemini, da Google, e o modelo de código aberto Llama, da Meta, estiveram entre os estudados pelas investigadoras de Stanford, juntamente com o ChatGPT da OpenAI, Claude da Anthropic e 'chatbots' da francesa Mistral e das empresas chinesas Alibaba e DeepSeek.
De entre as principais empresas de IA, a Anthropic foi a que mais investigou, pelo menos publicamente, os perigos da lisonja, concluindo num artigo científico que se trata de um "comportamento geral dos assistentes de IA, provavelmente impulsionado em parte por julgamentos de preferência humana que favorecem respostas bajuladoras".
A empresa defendeu uma supervisão mais apertada e, em dezembro, explicou o seu trabalho para tornar os seus modelos mais recentes "os menos bajuladores de todos até à data".
Na área médica, os investigadores afirmam que a IA bajuladora pode levar os médicos a confirmar a sua primeira suspeita sobre um diagnóstico, em vez de os incentivar a investigar mais a fundo.
Na política, pode amplificar posições mais extremistas, reafirmando noções preconcebidas.
Tem sugestões ou notícias para partilhar com o CM?
Envie para geral@cmjornal.pt
o que achou desta notícia?
concordam consigo
A redação do CM irá fazer uma avaliação e remover o comentário caso não respeite as Regras desta Comunidade.
O seu comentário contem palavras ou expressões que não cumprem as regras definidas para este espaço. Por favor reescreva o seu comentário.
O CM relembra a proibição de comentários de cariz obsceno, ofensivo, difamatório gerador de responsabilidade civil ou de comentários com conteúdo comercial.
O Correio da Manhã incentiva todos os Leitores a interagirem através de comentários às notícias publicadas no seu site, de uma maneira respeitadora com o cumprimento dos princípios legais e constitucionais. Assim são totalmente ilegítimos comentários de cariz ofensivo e indevidos/inadequados. Promovemos o pluralismo, a ética, a independência, a liberdade, a democracia, a coragem, a inquietude e a proximidade.
Ao comentar, o Leitor está a declarar que é o único e exclusivo titular dos direitos associados a esse conteúdo, e como tal é o único e exclusivo responsável por esses mesmos conteúdos, e que autoriza expressamente o Correio da Manhã a difundir o referido conteúdo, para todos e em quaisquer suportes ou formatos actualmente existentes ou que venham a existir.
O propósito da Política de Comentários do Correio da Manhã é apoiar o leitor, oferecendo uma plataforma de debate, seguindo as seguintes regras:
Recomendações:
- Os comentários não são uma carta. Não devem ser utilizadas cortesias nem agradecimentos;
Sanções:
- Se algum leitor não respeitar as regras referidas anteriormente (pontos 1 a 11), está automaticamente sujeito às seguintes sanções:
- O Correio da Manhã tem o direito de bloquear ou remover a conta de qualquer utilizador, ou qualquer comentário, a seu exclusivo critério, sempre que este viole, de algum modo, as regras previstas na presente Política de Comentários do Correio da Manhã, a Lei, a Constituição da República Portuguesa, ou que destabilize a comunidade;
- A existência de uma assinatura não justifica nem serve de fundamento para a quebra de alguma regra prevista na presente Política de Comentários do Correio da Manhã, da Lei ou da Constituição da República Portuguesa, seguindo a sanção referida no ponto anterior;
- O Correio da Manhã reserva-se na disponibilidade de monitorizar ou pré-visualizar os comentários antes de serem publicados.
Se surgir alguma dúvida não hesite a contactar-nos internetgeral@medialivre.pt ou para 210 494 000
O Correio da Manhã oferece nos seus artigos um espaço de comentário, que considera essencial para reflexão, debate e livre veiculação de opiniões e ideias e apela aos Leitores que sigam as regras básicas de uma convivência sã e de respeito pelos outros, promovendo um ambiente de respeito e fair-play.
Só após a atenta leitura das regras abaixo e posterior aceitação expressa será possível efectuar comentários às notícias publicados no Correio da Manhã.
A possibilidade de efetuar comentários neste espaço está limitada a Leitores registados e Leitores assinantes do Correio da Manhã Premium (“Leitor”).
Ao comentar, o Leitor está a declarar que é o único e exclusivo titular dos direitos associados a esse conteúdo, e como tal é o único e exclusivo responsável por esses mesmos conteúdos, e que autoriza o Correio da Manhã a difundir o referido conteúdo, para todos e em quaisquer suportes disponíveis.
O Leitor permanecerá o proprietário dos conteúdos que submeta ao Correio da Manhã e ao enviar tais conteúdos concede ao Correio da Manhã uma licença, gratuita, irrevogável, transmissível, exclusiva e perpétua para a utilização dos referidos conteúdos, em qualquer suporte ou formato atualmente existente no mercado ou que venha a surgir.
O Leitor obriga-se a garantir que os conteúdos que submete nos espaços de comentários do Correio da Manhã não são obscenos, ofensivos ou geradores de responsabilidade civil ou criminal e não violam o direito de propriedade intelectual de terceiros. O Leitor compromete-se, nomeadamente, a não utilizar os espaços de comentários do Correio da Manhã para: (i) fins comerciais, nomeadamente, difundindo mensagens publicitárias nos comentários ou em outros espaços, fora daqueles especificamente destinados à publicidade contratada nos termos adequados; (ii) difundir conteúdos de ódio, racismo, xenofobia ou discriminação ou que, de um modo geral, incentivem a violência ou a prática de atos ilícitos; (iii) difundir conteúdos que, de forma direta ou indireta, explícita ou implícita, tenham como objetivo, finalidade, resultado, consequência ou intenção, humilhar, denegrir ou atingir o bom-nome e reputação de terceiros.
O Leitor reconhece expressamente que é exclusivamente responsável pelo pagamento de quaisquer coimas, custas, encargos, multas, penalizações, indemnizações ou outros montantes que advenham da publicação dos seus comentários nos espaços de comentários do Correio da Manhã.
O Leitor reconhece que o Correio da Manhã não está obrigado a monitorizar, editar ou pré-visualizar os conteúdos ou comentários que são partilhados pelos Leitores nos seus espaços de comentário. No entanto, a redação do Correio da Manhã, reserva-se o direito de fazer uma pré-avaliação e não publicar comentários que não respeitem as presentes Regras.
Todos os comentários ou conteúdos que venham a ser partilhados pelo Leitor nos espaços de comentários do Correio da Manhã constituem a opinião exclusiva e única do seu autor, que só a este vincula e não refletem a opinião ou posição do Correio da Manhã ou de terceiros. O facto de um conteúdo ter sido difundido por um Leitor nos espaços de comentários do Correio da Manhã não pressupõe, de forma direta ou indireta, explícita ou implícita, que o Correio da Manhã teve qualquer conhecimento prévio do mesmo e muito menos que concorde, valide ou suporte o seu conteúdo.
ComportamentoO Correio da Manhã pode, em caso de violação das presentes Regras, suspender por tempo determinado, indeterminado ou mesmo proibir permanentemente a possibilidade de comentar, independentemente de ser assinante do Correio da Manhã Premium ou da sua classificação.
O Correio da Manhã reserva-se ao direito de apagar de imediato e sem qualquer aviso ou notificação prévia os comentários dos Leitores que não cumpram estas regras.
O Correio da Manhã ocultará de forma automática todos os comentários uma semana após a publicação dos mesmos.
Para usar esta funcionalidade deverá efetuar login.
Caso não esteja registado no site do Correio da Manhã, efetue o seu registo gratuito.
Escrever um comentário no CM é um convite ao respeito mútuo e à civilidade. Nunca censuramos posições políticas, mas somos inflexiveis com quaisquer agressões. Conheça as
Inicie sessão ou registe-se para comentar.