Updates voor Deep Learning: Machine Learning, Deep Reinforcement Learning en beperkingen

diep leren

In de afgelopen jaren zijn enkele verbazingwekkende technologische doorbraken op het gebied van kunstmatige intelligentie (AI) en het subveld deep learning begonnen om machines te trainen om zich als mensen te gedragen.

Aangezien machines in toenemende mate complexe cognitieve functies nabootsen, zoals deductief redeneren, gevolgtrekkingen en geïnformeerde besluitvorming, zijn robots die als mensen functioneren tegenwoordig in veel industriële praktijken een realiteit.

Machines lopen echter nog steeds achter bij het verwoorden van de redenen achter hun keuzes of acties. Met andere woorden, een machine-getuige kan nog steeds niet worden gebruikt in een rechtbank om een ​​zaak op te lossen, aangezien deze acties uit het verleden niet kan ‘rechtvaardigen’. De opmerkelijke prestaties in AI-toepassingen zijn onder meer de opname van neurale netwerken en diep leren (DL), die unieke trainingsmogelijkheden voor machines combineren om te leren van kennislagen en die kennis vervolgens toe te passen om bepaalde doelen te bereiken.

Neurale netwerken en diep leren doordringen de intens complexe gebieden van natuurkunde, wiskunde, statistiek, signaalverwerking, machine learning, neurowetenschappen en vele anderen.

Machine leren (ML), neurale netwerken en deep learning vormen samen een snel voortschrijdende kerngroep van technologieën binnen het grotere gebied van kunstmatige intelligentie. Tegenwoordig zijn machines in staat om veel complexe problemen onmiddellijk op te lossen met behulp van deze technieken, waar normaal gesproken een menselijk brein voor nodig zou zijn over een veel langere tijd.

De menselijke samenleving vertrouwt steeds meer op slimme machines om beslissingen te nemen en dagelijkse problemen op te lossen. Dit is mogelijk gemaakt door de aanwezigheid van neurale netwerken en Deep Learning in AI-toepassingen.

Triumph of Deep Reinforcement Learning: Deep Q-Network (DQN)

Diep Q-netwerk of DQN is het geesteskind van DeepMind op het gebied van Deep Reinforcement Learning. De eerste paper over DQN werd in 2015 gepubliceerd in Nature Magazine, waarna veel gereputeerde onderzoeksorganisaties zich in dit vakgebied begaven. De hele onderzoeksgemeenschap is van mening dat diepe neurale netwerken (DNN) kunnen verbeteren versterking van leren (RL) voor interactie met HD-beelden en andere vanwege de aanwezigheid van DQN-technieken. Van Google tot Facebook, vele andere marktleiders wachten geduldig op de resultaten van geavanceerd onderzoek met DQN.

Marktsucces van evolutiestrategieën in versterkingsleren

Evolutiestrategieën (ES) lijken een comeback te hebben gemaakt in reinforcement learning. De reden voor het schijnbare succes zijn de exploratieve algoritmen die niet afhankelijk zijn van gradiënten, schaalbaarheid van algoritmen en goedkope hardwarevereisten – er is geen dure GPU nodig voor snelle parallelle verwerking.

Kaders voor diep leren

2020 is zeker het Jaar van Deep Learning Frameworks. Hoewel beide Google’s Tensorflow en PyTorch van Facebook kreeg veel bijval onder de natuurlijke taalverwerking (NLP) onderzoeksgemeenschappen, is Tensorflow meer geschikt voor statische grafieken. Aan de andere kant is PyTorch ideaal voor dynamische constructies. Zowel Tensorflow als PyTorch hebben positieve gebruikersfeedback ontvangen in hun respectievelijke arena’s en maken grotere plannen voor de toekomst.

Versterkende leeragent verslaat menselijke AlphaGo-spelers

Deze Natuur paper herinnert aan een glorieus moment waarop een leermedewerker versterking verslaat ’s werelds beste menselijke Go-spelers. In de eerste versie van AlphaGo werden trainingsgegevens van menselijke spelers gebruikt, en verder afgestemd door het gecombineerde gebruik van self-play en Monte Carlo Tree Search. Daarna in AlphaGo Zero, leerde de machine zelfstandig te spelen zonder enige menselijke tussenkomst. De wetenschap en technologie die in deze versie van het spel worden gebruikt, wordt treffend beschreven in het papier getiteld Snel en langzaam denken met Deep Learning en Tree Search . Deze spellen hebben zoveel menselijke spelers gemotiveerd om hun technieken te perfectioneren dat DeepMind een AlphaGo Teach om menselijke spelers te trainen.

De volgende hindernis voor DeepMind

Getuige van het recente succes en de populariteit van AlphaGo-gameserie, DeepMind begon na te denken over pokerspellen voor meerdere spelers met behulp van RL-technieken. DeepMind werkt ook aan Starcraft 2 – een RL onderzoeksomgeving.

De rol van diep leren bij AI: verkeerde informatie is mogelijk

Volgens de waakhond van de industrie KDNugget, Deep Learning is niet de toekomst van AI. Omdat zowel Google als Facebook hun DL-aanbod wereldwijd op de markt hebben gebracht, hebben de gebruikers ten onrechte de verkeerde berichten ontvangen over het belang van DL in kunstmatige-intelligentietoepassingen. KDNuggets denkt dat de wereldwijde publiciteit van DL-technieken meer hype dan inhoud is. In zijn verdediging stelt KDNuggets verder dat technieken zoals Beslissingsbomen zoals gebruikt in XGBoost “halen geen krantenkoppen”, maar zijn net zo belangrijk als deep learning, zo niet meer.

Zelfs in het geval van AlphaGo waren de media gehyped over DL, terwijl de Monte Carlo Tree Search-methode in werkelijkheid net zo goed bijdroeg aan het succes van het spel als DL. Bij RL worden veel leertaken behaald via Neuroevolution’s NEAT en niet vanwege terugpropagatie, zoals beweerd door de media.

De grootste beperking van diep leren: machines kunnen geen juridische uitleg geven

DL heeft momenteel twee grote nadelen: de eerste is de neiging om eerdere leerervaringen abrupt te vergeten, en de tweede is het onvermogen om de verstrekte informatie in twijfel te trekken of te rationaliseren. In een andere wereld, in de DL-wereld, gelooft de machine wat hij tijdens het leerproces krijgt, en heeft hij niet het vermogen om de verworven kennis in twijfel te trekken. De laatste trend is gevaarlijk omdat de machine onzin kan worden gevoerd in de naam van “truisms”.

De NLP-opmerkingen in DL-aanvragen kunnen niet door een rechter worden geaccepteerd of in een rechtszaak worden ingevoerd als bewijs of argument. Met andere woorden, zelfs de slimste AI-systemen kunnen om zojuist beschreven redenen niet ‘verantwoordelijk’ worden gehouden voor hun daden. In de toekomst zullen veel DL-gestuurde AI-systemen vanwege deze enorme beperking als illegaal of niet-klachten worden beschouwd.

DL-geschikte systemen voor gegevensverzameling voldoen niet aan de AVG-vereisten

Omdat gegevensbeveiliging van cruciaal belang zal zijn in de Data Science-wereld van 2021 en daarna, hebben veel AI-systemen met DL-technologie te maken met de beveiligingsvoorschriften die zijn opgesteld door verschillende regelgevende instanties. Een mooi voorbeeld hiervan niet-naleving van de beveiliging is de Algemene Verordening Gegevensbescherming (AVG) die vereist dat alle geautomatiseerde besluitvorming wordt becommentarieerd met zeer gedetailleerde, logische uitleg om discriminatie op basis van ras, gezondheidsomstandigheden, persoonlijke meningen, enzovoort te voorkomen. AVG werd van kracht in 2018. Alle gegevensverzamelingsbureaus die actief zijn in de 28 Europese landen werden lang daarvoor gedwongen hun DL-apps of platforms te wijzigen, anders riskeerden ze ernstige strafmaatregelen.

Fotocredits: Shutterstock.com

follow:
admin

admin

Related Posts

Een korte geschiedenis van gegevensbeheer

Datamanagement is de organisatie van gegevens, de stappen die worden gebruikt om efficiëntie te bereiken en informatie uit die gegevens

Datakans klopt! Moet je antwoorden?

Klik voor meer informatie over auteur Kartik Patel. Als zakenmensen krijgen we vaak te maken met wat misschien een geweldige

Een korte geschiedenis van gegevensbeheer

Datamanagement is de organisatie van gegevens, de stappen die worden gebruikt om efficiëntie te bereiken en informatie uit die gegevens

Datakans klopt! Moet je antwoorden?

Klik voor meer informatie over auteur Kartik Patel. Als zakenmensen krijgen we vaak te maken met wat misschien een geweldige