O Tribunal do Conselho Administrativo de Defesa Econômica determinou a abertura de uma investigação para apurar a prática de coleta automatizada de conteúdo, técnica conhecida como scraping, realizada pelo Google. O órgão antitruste brasileiro também ordenou que a área técnica do conselho analise a utilização de notícias por empresas e mecanismos de inteligência artificial sem a devida autorização dos produtores de conteúdo.

A decisão é considerada um passo significativo na regulação do setor tecnológico no Brasil. Ela foca na relação entre as grandes plataformas de tecnologia e os veículos de comunicação, questionando a legalidade do uso de dados para alimentar modelos de linguagem e indexadores de busca.

Cade investiga coleta de dados do Google e uso de notícias por IA - Imagem complementar

O julgamento do caso foi concluído com a apresentação do voto da conselheira Camila Cabral Pires Alves. A iniciativa para levar a questão ao Tribunal do Cade partiu da própria conselheira ainda no ano de 2024, evidenciando a preocupação prolongada do órgão com a concorrência e a propriedade intelectual no ambiente digital.

PUBLICIDADE

No que diz respeito ao uso de inteligência artificial, a decisão do tribunal foi unânime. Todos os cinco membros votaram a favor da apuração sobre a coleta não autorizada de notícias por ferramentas de IA, que utilizam vastos volumes de dados da internet para treinamento de seus modelos.

Já a investigação sobre o scraping realizado pelo Google foi aprovada por maioria. O resultado do voto foi de quatro a um, confirmando que a empresa deve responder por suas práticas de cópia de conteúdo destinadas ao funcionamento de seus buscadores.

O scraping é um processo técnico onde scripts automatizados extraem dados de sites para serem usados em outras aplicações. No contexto do Google, a investigação busca entender se essa coleta prejudica a sustentabilidade financeira dos veículos de imprensa.

A inteligência artificial, por sua vez, depende de imensos conjuntos de dados para aprender a gerar textos e respostas. A controvérsia reside no fato de que muitas dessas ferramentas utilizam notícias recentes para fornecer respostas precisas sem pagar licenças aos produtores originais.

Essa movimentação do Cade coloca o Brasil em sintonia com discussões globais sobre a economia da atenção e a remuneração de conteúdo. A disputa envolve a capacidade de as Big Techs, como o Google, de controlar o fluxo de informação e a monetização desse tráfego.

O Google, empresa responsável pelo buscador mais utilizado do mundo, opera com sistemas que indexam a web para facilitar a busca de usuários. No entanto, a linha entre a indexação para referência e a extração de valor econômico do conteúdo é o ponto central da lide.

As ferramentas de inteligência artificial ampliam esse desafio. Ao sintetizar informações de notícias em resumos diretos, esses sistemas podem reduzir a necessidade de o usuário clicar no link original, impactando a receita publicitária dos portais de notícias.

O Conselho Administrativo de Defesa Econômica atua para garantir que a concorrência não seja prejudicada por práticas abusivas de empresas dominantes. A investigação agora deve entrar em fase técnica para coletar evidências e ouvir as partes envolvidas.

O desdobramento desse caso pode gerar precedentes importantes para a aplicação de multas ou a imposição de novos acordos de licenciamento entre as empresas de tecnologia e a imprensa brasileira.

O impacto final da decisão dependerá da capacidade do órgão em definir limites claros para o que é considerado uso legítimo de dados e o que configura apropriação indevida de propriedade intelectual.

O mercado de mídia aguarda os resultados dessa análise técnica para entender como a remuneração por conteúdos digitais será tratada legalmente no país.

As empresas de inteligência artificial também monitoram a decisão, pois a imposição de restrições ao treinamento de modelos com dados públicos pode alterar o custo de desenvolvimento de novas tecnologias no Brasil.