Os modelos de inteligência artificial (IA) estão se mostrando surpreendentemente fluentes em polonês. Um novo estudo da Universidade de Maryland e da Microsoft revela que, dos 26 idiomas testados, o polaco emergiu como o mais eficaz para ativar sistemas de IA. Esta descoberta desafia o conhecimento convencional sobre a complexidade da linguagem e os dados de treinamento de IA.
Os pesquisadores testaram vários modelos de linguagem de IA líderes – incluindo OpenAI, Google Gemini, Qwen, Llama e DeepSeek. Esses modelos receberam tarefas idênticas em todos os 26 idiomas para ver qual produzia as respostas mais precisas. Os resultados foram surpreendentes: o polonês superou consistentemente os outros, alcançando uma precisão média de 88%.
Desempenho além do esperado
Este resultado inesperado é particularmente digno de nota porque o polaco tem sido historicamente considerado uma das línguas mais difíceis de aprender para os humanos. Sua gramática complexa e fonemas desconhecidos representam um obstáculo significativo para falantes nativos de inglês. No entanto, quando se trata de IA, a complexidade da linguagem não parece ser um fator definidor.
Curiosamente, o Inglês, muitas vezes visto como a língua global dominante em tecnologia, ficou apenas em sexto lugar. Isto sugere que o volume de dados brutos por si só não é o único determinante da proficiência linguística da IA. Além disso, Chinês, apesar de ter uma grande quantidade de dados de texto on-line disponíveis para treinamento, teve um desempenho decepcionante, ficando perto do último lugar.
As 10 linguagens mais eficazes para IA de conversação foram:
- Polonês (88%)
- Francês (87%)
- Italiano (86%)
- Espanhol (85%)
- Russo (84%)
- Inglês (83,9%)
- Ucraniano (83,5%)
- Português (82%)
- Alemão (81%)
- Holandês (80%)
O que isso significa para IA e linguagem
Este estudo destaca algumas conclusões importantes:
- O impacto da estrutura linguística: Talvez a estrutura da gramática polaca, ou características fonéticas únicas, se adaptem melhor a certos tipos de processamento de IA. Mais pesquisas são necessárias para identificar exatamente por que o polonês se destaca.
- Disponibilidade de dados não é tudo: embora dados de treinamento extensos sejam cruciais, eles não garantem o melhor desempenho. Outros factores como a complexidade linguística e a arquitectura do modelo desempenham um papel.
- Uma mudança nas prioridades linguísticas: O domínio do inglês na IA pode ser desafiado à medida que os investigadores exploram outras línguas com forte potencial de desempenho. Isto poderia levar a tecnologias de IA mais inclusivas e globalmente acessíveis.
Esta pesquisa abre caminhos interessantes para explorar a intersecção entre linguagem, cognição e inteligência artificial. À medida que a IA continua a evoluir, compreender quais as linguagens que considera mais intuitivas poderá moldar o seu desenvolvimento futuro e o impacto na comunicação em todo o mundo.

































