nlaic logo


 

Videoland Thumbnails: AI in Actie

Wat voor algoritmes past RTL toe op hun gelabelde data?

Transcript:

Op Videoland krijgt iedere video een  plaatje, een thumbnail noemen we dat:   Een representatief plaatje voor de video. Deze worden gekozen door een  designer en met kunstmatige intelligentie   hebben wij een deel  van dat proces geautomatiseerd. Waar we daarmee zijn begonnen is  begrijpen 'Wat doet die designer nou? Wat maakt een mooi thumbnail  plaatje op Videoland voor hem?' Hij kon daar het één en ander over vertellen. Hij zei van: "Ik kies eigenlijk  altijd één tot drie gezichten.  Ik wil dat er geen tekst in beeld is,  en ik wil dat het een mooi plaatje is." Wat natuurlijk wat moeilijk te  operationaliseren is voor ons. Als proces hebben we vervolgens  geprobeerd dat na te bouwen. Dus we hebben gezichtsherkenning gedaan zodat we  konden meten hoeveel gezichten er in beeld waren. We kunnen een tekst herkennen, dus die plaatjes  konden we er relatief makkelijk uit halen. Om te kijken of een plaatje mooi  is hebben we een model gevonden,   en later verbeterd, wat een inschatting  kan maken van hoe goed een plaatje is. Dus dat kijkt naar de esthetische kwaliteiten maar ook de technische kwaliteiten  zoals 'Is de voorgrond in focus?' en meer van dat soort aspecten. Het proces waar we dan vaak doorheen  lopen om zo'n model te maken,   dat lijkt heel erg op de 'Build, Measure,  Learn' loop uit Lean Startup. Dus we bouwen een model..