4 tips för att komma igång med bildigenkänning

9 april 2019

Det kan kännas överväldigande att försöka lära sig mer om bildanalys och bildigenkänning. Det är (med rätta) ett hypat område just nu, och det finns så mycket information tillgänglig att det kan vara svårt att veta var du ska börja. Här är fyra tips för dig som är Data scientist och vill komma igång med bildigenkänning:

1. Ha en bra plan

En identifierad utmaning och en bra plan är förutsättningar för att köra ett AI-projekt. Vilka utmaningar behöver du lösa? Vad mäts företaget, avdelningar eller individer på? För att en modell ska ge ett svar eller stöd måste du veta vilken utmaning som ska lösas.

 

Mer konkreta frågeställningar kring data och modellen kan vara: Vad vill du komma fram till? Ett minskat fel i resultaten? Samma magnitud på felet, men ett snabbare flöde? Hur ska du mäta lösningens effektivitet? Allt detta borde vara klart när du börjar.

 

2. Säkerställ datakvalitet

Det pratas mycket om att "Data is the new soil". Med bra data kan du genomföra mycket med AI. Vilka och hur många bilder finns? Hur ser metadatan i anknytning till bilderna ut? Är bilderna uppmärkta? Människor inom organisationen har bra kännedom om hur bilderna används just nu. Använd deras insikter för att förstå datan och förbättra kvaliteten.

 

Om det inte finns tillräckligt med data kan du med hjälp av "data augmentation" (spegling, rotering, ...) skapa nya bilder och på så sätt utöka ditt dataset. Om det är inte möjligt, kan det vara bättre att ändra förutsättningar på plats (nya kameror, bättre fokuserade kameror, ...) så att bildkvaliteten ökar och sedan vänta till datat har tillräckligt hög kvalitet.

 

3. Läs om Convolutional Neural Networks and Transfer Learning

När man pratar bildigenkänning är det nuförtiden huvudsakligen Convolutional Neural Networks (CNN) som används. Så för att förstå hur de nya teknikerna och metoderna fungerar borde du i alla fall ha en grundläggande förståelse av deras omfattning och hur de fungerar. Kolla till exempel Neural networks and deep learning. Transfer learning är en metod som också används mycket för att accelerera utvecklingsprocessen. Här återanvänder och bygger man på delar av en gammal CNN så att en ny modell med ett nytt syfte utvecklas. Det sparar mycket tid och resurser.

 

4. Testa och lär dig

Det finns många AutoML-tjänster online som du kan använda som benchmark. I dessa tjänster laddar du upp bilder och deras uppmärkningar, och tjänsten tränar därefter en modell helt automatiskt. En AutoML-modell är ganska generell, så ofta får du bättre resultat om du skräddarsyr modellen genom att utveckla den själv i ett maskininlärningsbibliotek som Keras eller TensorFlow.

 

Börja enkelt och bygg gradvis mer omfattande lösningar. Var inte rädd att någonting inte fungerar. Lär av det och gå vidare. Att experimentera är fundamentalt om du vill lära dig mer om machine learning!

 

Av Peter Lenaers, Senior Data scientist

Nästa nyhet

AI är en kompetensfråga på alla nivåer

9 april 2019