Natural Language Processing: de mogelijkheid om computers en de menselijke taal samen te brengen.

Waar computers een steeds grotere rol zijn gaan spelen binnen onze maatschappij, wordt de vraag of computers in staat zijn tot menselijk handelen ook steeds vaker gesteld. Natural Language Processing (NLP) is het vakgebied dat ervoor zorgt dat het antwoord op deze vraag steeds dichter bij een ‘Ja’ in de buurt komt. In dit artikel gaan wij aan de hand van een demo dieper in op de mogelijkheden en techniek van NLP.

Sentiment Analyse binnen de Eredivisie

Omdat we bij Datacation graag de theorie in de praktijk brengen, hebben wij een demo gemaakt die de mogelijkheden van NLP demonstreert. Naast een passie voor data hebben veel van onze Datacationers ook een passie voor voetbal. Door deze beide passies te combineren, zijn wij tot de volgende demo gekomen: een voetbal sentiment analyse tool.

Deze tool analyseert de sentimenten van alle wedstrijden van de meest recente speelronde in de Eredivisie, door het analyseren van tweets die tijdens deze bewuste wedstrijden zijn geplaatst. Op deze manier is het mogelijk om per gespeelde wedstrijd te kijken of de twitterende voetbalfan overwegend positief of juist negatief was. Daarnaast geeft deze tool inzicht in spelers en teams die het meest zijn opgevallen, zowel op positief als negatief vlak.

Ben je benieuwd naar het sentiment van jouw favoriete voetbalclub? Ontdek de tool via de volgende link en kom erachter of jij op één lijn zit met twitterend Nederland.

Twitter Sentiment App

De techniek achter de tool

Sentiment analyse is een vorm van Natural Language Processing (NLP) die tekstgegevens analyseert, om het sentiment van de tekst te bepalen. Om het sentiment van de tweets van onze demo te bepalen, is het ‘BERT multilingual base model’ gebruikt. Aan de basis van dit model staat het BERT framework, wat staat voor Bidirectional Encoder Representations from Transformers. BERT is een NLP techniek die ontworpen is om computers te helpen met het begrijpen van context. Het BERT model is onder andere getraind op de volledige Wikipedia Encyclopedie van meer dan 100 landen. In het totaal komt dit neer op meer dan 3.3 miljard woorden.

BERT maakt gebruik van de Transformer architectuur. De Transformer in NLP is een nieuwe architectuur die het doel heeft reeks-naar-reeks taken op te lossen en daarbij op een slimme manier rekening houdt met relaties tussen onderdelen van een reeks, zoals een woord in een zin die op (lange) afstand staat.

Het specifieke model dat gebruikt is voor deze tool is verfijnd door het trainen op reviews zodat er onderscheid gemaakt kon worden op positieve en negatieve berichten. Daarnaast is het model geschikt voor sentiment analyse in zes talen: Engels, Nederlands, Duits, Frans, Spaans en Italiaans. Naast het analyseren van wedstrijden binnen de Eredivisie, is het daarom een kleine stap om ook het sentiment binnen andere Europese competities te analyseren.

Mogelijke toepassingen

Naast het analyseren van voetbalwedstrijden zijn er natuurlijk ontzettend veel toepassingen waarbij NLP ingezet kan worden. Een afdeling die veel gebruik maakt van NLP is de klantenservice. Tegenwoordig is een groot deel van het contact bij de klantenservice verplaatst van de mens naar de computer. Een voorwaarde hiervoor is wel dat de computer moet kunnen communiceren op een menselijke manier en bijvoorbeeld moet kunnen inschatten of een klant juist positief of negatief is.

Een ander voorbeeld waar NLP goed tot zijn recht komt is bij het automatiseren van e-mail services. Als een computer in staat is waardevolle informatie op te nemen en automatisch te verwerken, kan veel handmatig werk worden voorkomen.

Heeft onze demo jou nieuwsgierig gemaakt naar de mogelijkheden van NLP? Stuur een mailtje naar r.zoetekouw@datacation.nl zodat wij samen kunnen ontdekken hoe NLP jouw organisatie kan helpen.