Definitie van natuurlijke taalverwerking
Natuurlijke taalverwerking (NLP) is de tak van kunstmatige intelligentie (AI) die zich bezighoudt met het trainen van computers om taal te begrijpen, te verwerken en te genereren. Zoekmachines, automatische vertaaldiensten en stemassistenten worden allemaal aangedreven door de technologie.
Hoewel de term oorspronkelijk verwees naar het vermogen van een systeem om te lezen, is het sindsdien een spreektaal geworden voor alle computerlinguïstiek. Subcategorieën zijn onder meer natuurlijke taalgeneratie (NLG) – het vermogen van een computer om eigen communicatie te creëren – en natuurlijk taalbegrip (NLU) – het vermogen om jargon, verkeerde uitspraken, spelfouten en andere taalvarianten te begrijpen.
De introductie van transformatormodellen in de paper “Attention Is All You Need” uit 2017 door Google-onderzoekers bracht een revolutie teweeg in NLP, wat leidde tot de creatie van generatieve AI-modellen zoals Bidirectional Encoder Representations from Transformer (BERT) en daaropvolgende DistilBERT – een kleinere, snellere en efficiëntere BERT — Generative Pre-trained Transformer (GPT) en Google Bard.
Hoe natuurlijke taalverwerking werkt
NLP maakt gebruik van algoritmen voor machine learning (ML) die zijn getraind op ongestructureerde gegevens, meestal tekst, om te analyseren hoe elementen van menselijke taal samen worden gestructureerd om betekenis te geven. Zinnen, zinnen en soms hele boeken worden ingevoerd in ML-engines waar ze worden verwerkt met behulp van grammaticale regels, de echte taalgewoonten van mensen en dergelijke. Een NLP-algoritme gebruikt deze gegevens om patronen te vinden en te extrapoleren wat daarna komt. Een vertaalalgoritme dat bijvoorbeeld herkent dat ‘Ik ga naar het park’ in het Frans ‘Je vais au parc’ is, zal leren voorspellen dat ‘Ik ga naar de winkel’ ook begint met ‘Je vais au .” Het enige dat het algoritme dan nodig heeft, is het woord voor “opslaan” om de vertaaltaak te voltooien.
NLP-toepassingen
Machinevertaling is een krachtige NLP-toepassing, maar zoeken wordt het meest gebruikt. Elke keer dat je iets opzoekt in Google of Bing, help je het systeem te trainen. Wanneer u op een zoekresultaat klikt, interpreteert het systeem dit als een bevestiging dat de gevonden resultaten correct zijn en gebruikt het deze informatie om de zoekresultaten in de toekomst te verbeteren.
Chatbots werken op dezelfde manier. Ze kunnen worden geïntegreerd met Slack, Microsoft Messenger en andere chatprogramma’s, waar ze de taal lezen die u gebruikt en vervolgens worden ingeschakeld wanneer u een triggerzin typt. Spraakassistenten zoals Siri en Alexa schakelen ook in versnelling wanneer ze zinnen als “Hé, Alexa” horen. Daarom zeggen critici dat deze programma’s altijd luisteren; als ze dat niet waren, zouden ze nooit weten wanneer je ze nodig hebt. Tenzij u een app handmatig inschakelt, moeten NLP-programma’s op de achtergrond werken, wachtend op die zin.