Reinforcement learning er perfekt, når du ikke kan bygge et datasæt

Illustration: AWS
Reinforcement learning er en af de trends inden for data science, der spås stort potentiale.

Når man ser på eksempler på opgaver, der kan løses med reinforcement learning, kan man nemt få det indtryk, at teknikken primært er anvendelig til spiludvikling.

Metoden er f.eks. adskillige gange blevet brugt til at besejre mobilspillet Angry Birds. I OpenAI's toolkit til reinforcement learning kan man prøve kræfter med klassikere som Pong og Space Invaders. Og da en AI i denne uge besejrede mennesker i skydespillet Quake III Arena var det reinforcement learning, der stod bag sejren.

Det er både godt og skidt, mener Julien Simon, der er machine learning-ekspert hos AWS, da DataTech møder ham i Stockholm.

»Det er godt, fordi det viser, at her er noget, som er væsentligt anderledes end fraud detection eller churn prediction - almindelige machine learning use cases. Det er sjovt, og alle kan forstå det,« siger han og fortsætter:

»Det er mindre godt, fordi fokus på gaming leder folk til at tro, at reinforcement learning kun er til videospil. Og de use cases tiltrækker opmærksomhed, så jeg kan godt forstå, hvorfor man får det indtryk.«

Hos AWS tilføjede man i slutningen af sidste år reinforcement learning til skykæmpens Sagemaker-værktøj, der bruges til at udvikle og håndtere ML-modeller. Begrundelsen er den samme som for alle andre tiltag, siger Julien Simon: Det bliver efterspurgt.

Tips og korrekturforslag til denne historie sendes til tip@version2.dk
Kommentarer (0)
sortSortér kommentarer
  • Ældste først
  • Nyeste først
  • Bedste først
Log ind eller Opret konto for at kommentere
IT Company Rank
maximize minimize