Exjobb inom avläsning av teckenspråk från video: juni 2008

Under vecka 26 (arbetets första vecka) började jag med att söka efter artiklar som var relaterade till området. Tre av artiklarna (av Thad Starner i samarbete med andra) behandlar tolkning av amerikanskt teckenspråk (med begränsat antal ordtecken) från videodata med HMM-system (Hidden Markov Model) medan en annan artikel beskriver ett arbete där ett antal olika klassificeringsmetoder tillämpades på det turkiska alfabetet av tecken genom att plocka ut en representativ bildruta från varje träningsvideo.

Utöver artiklarna installerade jag också Ubuntu med tillhörande verktyg på en laptop som företaget tillhandahåller och började undersöka hur man kunde spela in video från en webbkamera. I nuläget används mencoder, vilket är videospelaren mplayer:s verktyg för att koda filmklipp, för att fånga webcam:ens videoström under ett visst antal sekunder till en fil. Den första webcam:en som jag testade, en Logitech QuickCam, visade sig ha problem att spela in video med över 10 FPS vid upplösningen 320x240, så jag bytte till en Canyon-kamera som klarar 15 FPS vid upplösning 352x288 utan problem.

Det programspråk som kommer användas till implementationen av huvuddelen av projektet är mest sannolikt C. Mot slutet av veckan undersöktes ffmpeg, libavcodec och SDL för att läsa in och spela upp de inspelade filmklippen och lite enklare försök att segmentera hudområden från bilderna gjordes även, med blandad framgång. Ljusförhållandena på kontoret i kombination med webcam:ens design gjorde att information om fingrarnas färg ofta gick förlorad eftersom det infallande ljuset gjorde att kameran "slog över" och visade delar av fingrarna som helt vita.

Under vecka 27 kommer litteraturstudien fortsätta med mer ingående studier av använda metoder i tidigare arbeten som HMM och SVM (Support Vector Machines). Om tid finns över kommer även försöken att segmentera händer från videoströmmen att fortsätta.

Exjobb inom avläsning av teckenspråk från video

2008-06-30

Vecka 26

2008-06-24

Introduktion

Bloggarkiv