Videoland Thumbnails: AI in Actie
Wat voor algoritmes past RTL toe op hun gelabelde data?
Transcript:
Op Videoland krijgt iedere video een plaatje, een thumbnail noemen we dat: Een representatief plaatje voor de video. Deze worden gekozen door een designer en met kunstmatige intelligentie hebben wij een deel van dat proces geautomatiseerd. Waar we daarmee zijn begonnen is begrijpen 'Wat doet die designer nou? Wat maakt een mooi thumbnail plaatje op Videoland voor hem?' Hij kon daar het één en ander over vertellen. Hij zei van: "Ik kies eigenlijk altijd één tot drie gezichten. Ik wil dat er geen tekst in beeld is, en ik wil dat het een mooi plaatje is." Wat natuurlijk wat moeilijk te operationaliseren is voor ons. Als proces hebben we vervolgens geprobeerd dat na te bouwen. Dus we hebben gezichtsherkenning gedaan zodat we konden meten hoeveel gezichten er in beeld waren. We kunnen een tekst herkennen, dus die plaatjes konden we er relatief makkelijk uit halen. Om te kijken of een plaatje mooi is hebben we een model gevonden, en later verbeterd, wat een inschatting kan maken van hoe goed een plaatje is. Dus dat kijkt naar de esthetische kwaliteiten maar ook de technische kwaliteiten zoals 'Is de voorgrond in focus?' en meer van dat soort aspecten. Het proces waar we dan vaak doorheen lopen om zo'n model te maken, dat lijkt heel erg op de 'Build, Measure, Learn' loop uit Lean Startup. Dus we bouwen een model..