The State of Enterprise NLP in 2020: vijf dingen om te weten

Klik voor meer informatie over auteur Ben Lorica.

Het is geen verrassing dat de technologie van Natural Language Processing (NLP) de afgelopen jaren op stoom is gekomen in de onderneming. Met de kracht om ziekten te voorspellen, door honderden cv’s bladeren om een ​​perfecte sollicitant te vinden, te helpen bij het identificeren en oplossen van klantenserviceproblemen, en zelfs helpen bij het automatiseren van alledaagse procesvoeringstaken voor advocaten, de industrieën en toepassingen waarin NLP nuttig kan zijn, zijn schijnbaar eindeloos .

Hoewel het leuk is om na te denken over de vooruitgang die is geboekt in deze subset van kunstmatige intelligentie, moet er nog veel worden geleerd en toegepast – vooral in de onderneming – om echt alle voordelen te plukken die NLP te bieden heeft. Om dit verder te onderzoeken, John Snow Labs gaf de eerste uit 2020 State of NLP Survey, wat een alomvattend beeld geeft van waar de onderneming zich momenteel bevindt met NLP-adoptie, en wat deze beloften en valkuilen betekenen voor de toekomst.

Hier zijn de vijf belangrijkste tips die IT- en technologieleiders in gedachten moeten houden wanneer ze NLP-implementatie of -uitbreiding benaderen.

1. NLP-uitgaven nemen toe, ondanks krimpende IT-budgetten

Misschien wel de meest veelbelovende bevinding uit de enquête is dat, ondanks de wereldwijde coronavirus-pandemie en krimpende IT-budgetten Als gevolg hiervan namen de uitgaven aan NLP niet af. In feite is het precies het tegenovergestelde: de respondenten gaven aan dat de uitgaven consistent en in veel gevallen aanzienlijk toenamen. 53% van de technische leiders gaf aan dat hun NLP-budget minstens 10% hoger was in vergelijking met 2019, en 31% gaf aan dat hun budget minstens 30% hoger was dan het voorgaande jaar. In een tijd waarin de totale IT-uitgaven laag zijn en veel bedrijven zich uitsluitend richten op ‘missiekritieke’ technologie, is het veilig om te zeggen dat NLP in deze categorie past.

2. Nauwkeurigheid is een belangrijk criterium, maar ook een belangrijke uitdaging

Nauwkeurigheid is van het grootste belang voor alle gebruikers van NLP-technologie, maar vooral in sterk gereguleerde bedrijfstakken, zoals de gezondheidszorg en financiële dienstverlening, waar compliance en veiligheid van het grootste belang zijn. Het is dus geen verrassing dat meer dan 40% van alle respondenten nauwkeurigheid noemde als het belangrijkste criterium dat ze gebruiken om NLP-bibliotheken te evalueren. Dat gezegd hebbende, nauwkeurigheid is ook de meest voorkomende uitdaging die wordt genoemd Allemaal respondenten. Dit geldt voor organisaties in alle stadia van adoptie, van degenen die NLP gebruiken (21%), tot degenen die het verkennen (31%). Bovendien noemde 51% van de respondenten nauwkeurigheid als een belangrijke uitdaging voor gebruikers van populaire NLP-clouddiensten, zoals Amazon en Google.

3. NLP Cloud Services zijn traag in het bedienen van marktbehoeften

Als we doorgaan met cloudservices, gaf 77% van alle respondenten van de enquête aan dat ze ten minste één van de vier NLP-cloudservices gebruiken die in de enquête worden vermeld (Google, AWS, Azure, IBM), waarbij de service van Google bovenaan de lijst staat. Google Cloud is vooral populair onder respondenten die zich nog in de beginfase van adoptie bevinden. Ondanks de populariteit van cloudservices noemden respondenten kosten als een andere belangrijke uitdaging, naast bezorgdheid over uitbreidbaarheid, aangezien zoveel NLP-applicaties afhankelijk zijn van domeinspecifiek taalgebruik en cloudproviders traag zijn geweest om aan deze marktbehoeften te voldoen.

4. Spark NLP en SpaCy als meest populair verkozen

Meer dan de helft van alle respondenten (53%) gebruikte ten minste één van de twee beste bibliotheken: Spark NLP en spaCy, en een derde van alle respondenten gaf aan Spark NLP te gebruiken, waardoor het de meest populaire bibliotheek in de enquête is. Dit verschilde enigszins in verschillende belangrijke industriesectoren: Gezondheidszorg (Spark NLP), Technologie (spaCy), Financiële dienstverlening (nltk). De voorkeuren van de branche zijn niet verrassend, aangezien John Snow Labs Spark NLP speciaal voor zorggebruikers heeft gemaakt. Wat is verrassend is dat een beginnende (3-jarige) bibliotheek meer dan de helft van de verticale gezondheidszorg domineert – een over het algemeen langzamer bewegende branche met gevestigde concurrenten.

5. Klassieke toepassingen van NLP worden nog steeds het meest gebruikt

Gezien de mix van respondenten uit de gezondheidszorg en de financiële wereld, was het voorspelbaar dat documentclassificatie, named entity recognition (NER) en sentimentanalyse bovenaan de lijst van use cases stonden die door alle respondenten werden aangehaald. NER-modellen proberen benoemde entiteiten – bedrijfsnaam, locatie, enz. – automatisch te extraheren uit ongestructureerde tekst. Meer dan een derde (39%) van alle technische leiders verklaarde dat ze ook NLP gebruiken voor het koppelen van entiteiten en kennisgrafieken. Gegevens uit bestanden en databases stonden bovenaan de lijst met gegevensbronnen die werden gebruikt om de bovengenoemde applicaties uit te voeren, waarbij 61% van de technische leiders beweerde dat ze bestanden, zoals pdf, txt, docx, enz., Gebruikten voor hun NLP-systemen.

Het is bemoedigend om te zien dat bedrijfsorganisaties de waarde van NLP begrijpen – een blijk van vertrouwen die duidelijk wordt gemaakt door meer financiële investeringen in de technologie. Maar ondanks NLP-uitgaven is het duidelijk dat er nog steeds hindernissen zijn als het gaat om nauwkeurigheid en schaalbaarheid, vooral met NLP-cloudservices. Deze onderwerpen en praktijkvoorbeelden zullen de komende tijd verder worden onderzocht NLP-top (6-16 oktober). Dit is het eerste toegepaste NLP-evenement en het is gratis voor geïnteresseerden.

In een jaar kan er veel veranderen, en het zal interessant zijn om de resultaten van de benchmarkonderzoeken, post-pandemie, verkiezingen en voortdurende vooruitgang in de evoluerende technische ruimte te zien. Verken tot die tijd uw opties, zorg ervoor dat het een haalbare en schaalbare optie is voor uw behoeften op het gebied van organisatorische en regelgevende naleving en blijf uw modellen verbeteren.