30 de janeiro de 2025

Opinião no Expresso

Com IA, os jornais podem finalmente ganhar dinheiro com os seus arquivos



Desculpe-me, mas não me estou a lembrar de uma metáfora menos frívola. As empresas que criam modelos de inteligência artificial (OpenAI, Anthropic, Google, Meta, DeepSeek) são um grupo de adolescentes esganados de fome que assaltaram um supermercado. Nos últimos anos, consumiram todo o tipo de conteúdos online – maioritariamente gratuitos e vastamente em língua inglesa – para poderem treinar os seus modelos de linguagem de grande escala (LLMs).

Os donos dos dados não gostaram do atrevimento e ergueram paywalls, alteraram os Termos de Serviço para limitar a utilização dos seus dados, bloquearam os rastreadores automatizados da internet (web crawlers) usados pelas empresas de LLMs ou recorreram aos tribunais. Surtiu algum efeito. Um estudo recente da Data Provenance Initiative concluiu que os dados gratuitos disponíveis estão a escassear de forma preocupante, o que prejudica o crescimento das empresas de IA americanas. As prateleiras estão a ficar vazias.

***

Sem comentários: