DolphinGemma: O modelo de IA do Google que tenta decifrar a linguagem dos golfinhos
O Google desenvolveu um modelo de inteligência artificial chamado DolphinGemma com o objetivo de entender a complexa forma de comunicação dos golfinhos — e, no futuro, talvez permitir uma comunicação direta entre espécies.
Cliques, assobios e pulsações emitidos por esses mamíferos marinhos sempre intrigaram os cientistas. Agora, em parceria com o Instituto de Tecnologia da Geórgia e com base em décadas de pesquisa de campo do Wild Dolphin Project (WDP), o Google revelou o DolphinGemma, uma ferramenta avançada para ajudar a decodificar essas vocalizações.
Lançado próximo ao Dia Nacional dos Golfinhos, o modelo foi desenvolvido para aprender a estrutura dos sons emitidos por esses animais e até gerar sequências inéditas semelhantes às naturais. Ele se apoia em dados extensos coletados desde 1985 pelo WDP, que documenta e analisa padrões de sons com significados contextuais específicos, como:
-
Assobios de assinatura: funcionam como nomes próprios, usados em interações sociais, como entre mães e filhotes.
-
Gritos pulsados: comuns em situações de tensão ou agressividade.
-
Cliques zumbidos: detectados durante o acasalamento ou quando perseguem presas.
O objetivo é identificar possíveis regras gramaticais nesses sons — como uma linguagem em construção.
Como funciona o DolphinGemma
Projetado para lidar com a complexidade e o volume de dados sonoros marinhos, o DolphinGemma utiliza o tokenizador SoundStream para representar os sons dos golfinhos de forma eficiente. Depois, esses dados são processados por um modelo de IA baseado na família Gemma (parente dos poderosos modelos Gemini, também do Google).
Assim como modelos de linguagem humana que preveem palavras, o DolphinGemma aprende a prever os próximos sons em uma sequência vocal de golfinhos. São cerca de 400 milhões de parâmetros, otimizados para rodar até mesmo em smartphones como o Google Pixel, que o WDP utiliza em campo para coletar dados.
A capacidade do modelo de reconhecer padrões automaticamente pode acelerar enormemente a pesquisa, revelando estruturas e significados antes acessíveis apenas após longas análises humanas.
Interação ativa com o sistema CHAT
Além de compreender os sons naturais, pesquisadores também trabalham no projeto CHAT (Cetacean Hearing Augmentation Telemetry), que busca uma forma de comunicação bidirecional com os golfinhos.
Em vez de traduzir a linguagem natural diretamente, o CHAT introduz apitos sintéticos associados a objetos específicos, como lenços ou algas. A ideia é que os golfinhos associem os sons aos itens e, eventualmente, os imitem para solicitá-los. Com o tempo, e à medida que os sons naturais forem melhor compreendidos por modelos como o DolphinGemma, esses também poderão ser integrados ao CHAT.
O papel dos smartphones na pesquisa oceânica
O Google Pixel não serve apenas como dispositivo de coleta de dados — ele é essencial na análise em tempo real. No sistema CHAT, o smartphone:
-
Detecta apitos mesmo em ambientes ruidosos;
-
Identifica os sons específicos emitidos;
-
Alerta os pesquisadores via fones subaquáticos sobre uma possível tentativa de comunicação.
A próxima geração do CHAT, prevista para o verão de 2025, usará o Pixel 9, que integrará microfones e alto-falantes, além de rodar modelos de aprendizado profundo diretamente no dispositivo — tudo isso com menor custo, menor consumo de energia e mais portabilidade do que equipamentos tradicionais.
Caminho aberto para a ciência
O Google planeja tornar o DolphinGemma um modelo aberto ainda este ano, permitindo que pesquisadores do mundo todo o adaptem para estudar diferentes espécies de cetáceos. Embora o foco inicial esteja nos golfinhos-pintados-do-atlântico, a arquitetura do modelo é flexível o suficiente para ser ajustada a outros repertórios vocais.
Mais do que ouvir, agora estamos começando a compreender. Com modelos como o DolphinGemma e sistemas como o CHAT, a fronteira entre humanos e golfinhos pode estar prestes a ficar um pouco mais tênue — e mais conversável.
Postar um comentário