nlaic logo


 

Reinforcement learning

Transcript:

Mijn naam is Fabian Akkerman, ik ben  promovendus aan de Universiteit Twente. Ik doe onderzoek naar reinforcement learning. Dat is een vorm van AI. Ik doe dit onderzoek met name in de logistiek, dus de toepassing van reinforcement   learning in de logistiek. Met name een toepassing en een focus op transport. Reinforcement learning wordt met name  gebruikt voor sequentiële beslisproblemen. Dus er zijn problemen waar  we een beslissing nemen,   maar we weten nog niet alle  toekomstige informatie. Je moet een beslissing nemen. Vervolgens krijgen we informatie binnen,   en vervolgens moeten we weer  opnieuw een beslissing nemen. Nou dat is iets wat we heel veel  terug zien in de logistiek. dus we   moeten een beslissing nemen maar  we hebben niet alle informatie. Pas na de beslissing komt  er nieuwe informatie binnen. Dus ik denk dat reinforcement  learning heel krachtig kan   zijn voor dynamische problemen in de logistiek. Dynamische problemen kunnen bijvoorbeeld  het routeren van voertuigen zijn,  waarbij we tijdens het rijden te horen krijgen   dat er een nieuwe klant is. 'Kunnen we  die nog misschien in de route stoppen?' Met reinforcement learning kunnen we  bepalen of we die klant gaan toevoegen  of we die klant toch aan een  andere route gaan toevoegen,  of misschien morgen doen. Andere dynamische problemen zijn bijvoorbeeld  het inladen van containers op een schip. We weten nu van deze set met containers hebben we, die kunnen we nu inladen. Maar het kan ook zijn dat er morgen nog een  een hele set met meer containers binnen komt. Dus misschien moeten we gewoon even  wachten met een bepaalde set zodat   we er meer tegelijk kunnen doen  en meer kosten kunnen besparen. Dat zijn twee voorbeelden van dynamische problemen   in de logistiek waar reinforcement  learning heel krachtig voor kan zijn..

 

Tags

 

 VIDEO

Deze video wordt aangeboden door Nederlandse AI Coalitie onder een Creative Commons-licentie.