I modelli di intelligenza artificiale (AI) si stanno rivelando sorprendentemente fluenti in polacco. Un nuovo studio dell’Università del Maryland e di Microsoft rivela che, su 26 lingue testate, il polacco è emerso come il più efficace per attivare i sistemi di intelligenza artificiale. Questa scoperta sfida la saggezza convenzionale sulla complessità del linguaggio e sui dati di addestramento dell’intelligenza artificiale.
I ricercatori hanno messo alla prova diversi modelli leader del linguaggio AI, tra cui OpenAI, Google Gemini, Qwen, Llama e DeepSeek. A questi modelli sono stati assegnati compiti identici in tutte le 26 lingue per vedere quale produceva le risposte più accurate. I risultati sono stati sorprendenti: il polacco ha costantemente sovraperformato gli altri, raggiungendo una precisione media dell’88%.
Prestazioni superiori alle aspettative
Questo risultato inaspettato è particolarmente degno di nota perché il polacco è stato storicamente considerato una delle lingue più difficili da imparare per gli esseri umani. La sua grammatica complessa e i fonemi non familiari rappresentano un ostacolo significativo per i madrelingua inglesi. Tuttavia, quando si parla di intelligenza artificiale, la complessità del linguaggio non sembra essere un fattore determinante.
È interessante notare che l’inglese, spesso visto come la lingua globale dominante nella tecnologia, si è classificato solo al sesto posto. Ciò suggerisce che il volume dei dati grezzi da solo non è l’unico determinante della competenza linguistica dell’intelligenza artificiale. Inoltre, il cinese, pur avendo a disposizione una grande quantità di dati testuali online per la formazione, ha ottenuto risultati deludenti, classificandosi quasi in fondo.
I 10 linguaggi più efficaci per l’intelligenza artificiale conversazionale sono stati:
- Polacco (88%)
- Francese (87%)
- Italiana (86%)
- Spagnolo (85%)
- Russo (84%)
- Inglese (83,9%)
- Ucraino (83,5%)
- Portoghese (82%)
- Tedesco (81%)
- Olandese (80%)
Cosa significa per l’intelligenza artificiale e il linguaggio
Questo studio evidenzia alcuni punti chiave:
- L’impatto della struttura linguistica: Forse la struttura della grammatica polacca, o caratteristiche fonetiche uniche, si prestano meglio a certi tipi di elaborazione dell’intelligenza artificiale. Sono necessarie ulteriori ricerche per individuare esattamente il motivo per cui la Polonia eccelle.
- La disponibilità dei dati non è tutto: sebbene dati di addestramento estesi siano fondamentali, non garantiscono prestazioni ottimali. Altri fattori come la complessità linguistica e l’architettura del modello giocano un ruolo.
- Un cambiamento nelle priorità linguistiche: La predominanza dell’inglese nell’intelligenza artificiale potrebbe essere messa in discussione mentre i ricercatori esplorano altre lingue con un forte potenziale di performance. Ciò potrebbe portare a tecnologie di intelligenza artificiale più inclusive e accessibili a livello globale.
Questa ricerca apre strade entusiasmanti per esplorare l’intersezione tra linguaggio, cognizione e intelligenza artificiale. Mentre l’intelligenza artificiale continua ad evolversi, capire quali linguaggi ritiene più intuitivi potrebbe modellarne lo sviluppo futuro e l’impatto sulla comunicazione in tutto il mondo.
