Google muda postura em relação ao conteúdo gerado por IA em nova atualização

O Google está lançando sua terceira iteração da atualização de conteúdo útil , introduzida pela primeira vez em agosto de 2022. O objetivo principal da atualização é classificar o conteúdo como “escrito para mecanismos de pesquisa” ou “escrito para pessoas”. algoritmos proprietários de aprendizado de máquina.

O que é interessante aqui é que o Google fez um ajuste no texto da referência oficial do Conteúdo Útil (o link acima).

Em sua interação anterior , ele disse o seguinte:

O sistema de conteúdo útil da Pesquisa Google   gera um sinal usado pelos nossos sistemas automatizados de classificação para garantir melhor que as pessoas vejam conteúdo original e útil escrito por pessoas , para pessoas, nos resultados de pesquisa. Esta página explica mais sobre como o sistema funciona e o que você pode fazer para avaliar e melhorar seu conteúdo.

E agora, desde o início do lançamento da versão mais recente, este parágrafo foi reformulado para:

O sistema de conteúdo útil da Pesquisa Google   gera um sinal usado pelos nossos sistemas automatizados de classificação para garantir melhor que as pessoas vejam conteúdo original e útil criado para pessoas nos resultados da pesquisa. Esta página explica mais sobre como o sistema funciona e o que você pode fazer para avaliar e melhorar seu conteúdo.

Em outras palavras, o Google está percebendo que não pode policiar com precisão o conteúdo gerado por IA e, em vez disso, enfatiza que o conteúdo deve ser criado primeiro para as pessoas, independentemente dos meios usados ​​para criá-lo.

Detectar conteúdo de IA é difícil, provavelmente impossível

O contato de pesquisa do Google, Danny Sullivan ( @searchliaison ), passou muito tempo no X este ano respondendo às perguntas das pessoas sobre conteúdo gerado por IA. E a essência disso é que o Google aceita pessoas que usam conteúdo gerado por IA, desde que esse conteúdo tenha um toque humano.

No início deste ano, a OpenAI removeu seu classificador de IA (uma ferramenta usada para avaliar se o conteúdo é gerado por IA ou não) porque a ferramenta foi considerada de baixa precisão .

Na postagem do blog de lançamento que foi posteriormente editada, a OpenAI adicionou uma declaração dizendo:

A partir de 20 de julho de 2023, o classificador AI não estará mais disponível devido à sua baixa taxa de precisão. Estamos trabalhando para incorporar feedback e atualmente pesquisando técnicas de proveniência mais eficazes para texto, e assumimos o compromisso de desenvolver e implantar mecanismos que permitam aos usuários entender se o conteúdo de áudio ou visual é gerado por IA.

Na minha própria experiência, o problema com muitas dessas ferramentas de detecção de IA é que elas classificam o conteúdo com base no tom. Frases básicas que não foram otimizadas com prompts tendem a ser marcadas como “robóticas” e, portanto, classificadas como geradas por IA. Mas para contornar isso, você pode fazer truques de otimização imediatos, como “fazer parecer uma narrativa”, que de repente marca o conteúdo como “provavelmente escrito por um humano”.

A IA veio para ficar, e é isso

A mudança de postura do Google não é exatamente uma surpresa. Eles próprios agora investem pesadamente em IA, inclusive com seu chatbot Bard , mas também em novos recursos de pesquisa, como a Experiência Gerativa de Pesquisa , que está sendo ativamente testada em beta por meio de seus Laboratórios de Pesquisa.

Imagem: Google

Embora inicialmente, após o lançamento do ChatGPT, o consenso fosse que usar o conteúdo gerado pelo ChatGPT era um “grande não, não”, a maioria das marcas agora compartilha abertamente artigos e guias sobre como usar o ChatGPT e ferramentas semelhantes para “impulsionar sua estratégia de marketing ” ou “crie planos de conteúdo acionáveis ​​rapidamente”.

É sobre “como” você usa, não “se” você usa

Um dos principais problemas dos modelos de linguagem grande é que eles inventam muitas coisas (alucinam) e, sem a supervisão humana adequada, podem fazer coisas como chamar um jogador falecido da NBA de “inútil” . Quando examinei a reescrita gerada por IA que o MSN fez para publicar aquele artigo, ficou claro como o dia que:

  • O MSN usou um LLM de baixa qualidade baseado na frase e na estrutura do artigo.
  • O MSN não tinha um ser humano para verificar o artigo (mesmo que eles dissessem que sim).

Outra coisa que vale a pena ressaltar é que o ChatGPT tem um limite de conhecimento em 2021, o que significa que se você estiver usando o ChatGPT ou ferramentas semelhantes como principal meio de escrever conteúdo, você estará reescrevendo principalmente o que já foi dito.

John Mueller (Relações de Pesquisa do Google) fez um comentário muito bom sobre isso no Reddit algumas semanas atrás:

Você está começando de um lugar ruim, na minha opinião. Um ótimo conteúdo não terá uma boa classificação automaticamente, mas fazer com que um conteúdo péssimo tenha uma boa classificação é muito mais difícil. Começar com esse tipo de âncora puxando você para baixo, em uma área onde já existe muito conteúdo razoável, talvez até ótimo, é uma receita para o fracasso.

Se você deseja que as pessoas criem links para o seu site, você precisa torná-lo digno de links e de recomendações. Se você deseja que os mecanismos de pesquisa direcionem as pessoas para você, você precisa fornecer algo que não seja igual a outros sites (e, claro, fazer muito mais do que apenas ter esse conteúdo). Por definição (estou simplificando), se você estiver usando IA para escrever seu conteúdo, ele será reformulado em outros sites.

Nenhum dos detalhes técnicos importa quando um site não tem um propósito claro, uma proposta de valor focada no que os usuários estão perdendo e que entrega. Use detalhes técnicos e pontuações para melhorar seu trabalho. Criar sites tecnicamente excelentes não vai impedi-lo, mas primeiro você precisa dessa base de propósito.

E o que quero dizer quando digo é sobre como você usa IA para gerar conteúdo para seu blog ou artigos, se é que o faz.

Um dos problemas mais comuns que eu pessoalmente notei é que muitos sites agora usam essas ferramentas de IA para reescrever artigos (como Notícias), que não fornecem nenhum valor e normalmente são reescritos de uma forma que usa um muita linguagem incoesa e hipérbole. Mesmo assim, muitos desses sites são promovidos confortavelmente por redes de distribuição como o Google News.

Tente você mesmo. Escolha qualquer notícia de tendência e veja quem está escrevendo sobre ela no Google Notícias. Retire todos os editores com os quais você está familiarizado e o que resta são fazendas de conteúdo com spam, repletas de reescritas baratas que não contribuem em nada para a narrativa mais ampla.


A única maneira de ver o problema com o conteúdo gerado por IA sendo abordado de cabeça é se o Google e outros grandes mecanismos de pesquisa fizerem parceria com OpenAI, Meta e outros grandes pioneiros do LLM para marcar estritamente as respostas padrão, de modo que, a menos que sejam editadas – sempre será ser indicativo de que o conteúdo não foi criado por um ser humano.

Não tenho certeza se é viável que algo assim aconteça. O que sei é que o fluxo de conteúdo de IA na web aumentará drasticamente nos próximos meses e anos. Isso já está acontecendo em tantos campos e nichos diferentes, e começar com essa prática é tão absurdamente simples que você pode literalmente usar o ChatGPT para ajudá-lo a construir seu “império de fazenda de conteúdo automatizado”.

Hermann Santos de Almirante

Recent Posts

Serpro convoca parceiros para desenvolvimento de software antifraude

O Serpro, por meio de chamamento público, convida empresas interessadas no desenvolvimento conjunto de uma…

1 semana ago

Justiça reconhece à mãe direito a patrimônio digital de filha falecida

A 3ª Câmara de Direito Privado do Tribunal de Justiça de São Paulo reconheceu o…

3 semanas ago

ANPD: controladores têm três dias para comunicar incidentes de segurança

Já está valendo o regulamento sobre comunicação de incidentes de segurança da Autoridade Nacional de Proteção de…

3 semanas ago

Relatórios de transparência salarial preocupam empresas em violar LGPD

Com a imposição recente da obrigação de divulgar relatórios de transparência salarial em seus sites…

4 semanas ago

Reforma do Código Civil prevê a retirada o fim do artigo 19 do Marco Civil da Internet

A proposta de reforma do Código Civil, apresentada ao Senado Federal no dia 26 de fevereiro,…

2 meses ago

ANPD prorroga consultas sobre Anonimização e Direitos dos Titulares

A Autoridade Nacional de Proteção de Dados (ANPD) prorrogou a consulta à sociedade a respeito…

3 meses ago