2008-07-04

Vecka 27

Efter arbetets andra vecka är förstudien på god väg. När jag började strukturera upp en tidig draft av rapporten (baserad på en mall från institutionen) insåg jag att min fördjupningsstudie inte skulle innehålla särskilt mycket fördjupning i ämnets grunder så som jag hade planerat den. Efter vissa trassel med LaTeX tack vare bland annat namnen "Oğuz" och "Władysław" (lösningen är "O\u{g}uz" och "W\l{}adys\l{}aw" - ifall någon bryr sig) är inledningen till fördjupningsstudiens kapitel samt delar om färgrepresentation och hudmodeller nu delvis skrivna. Jag började skriva på svenska men bytte relativt snabbt språk till engelska (för hela rapporten) eftersom vissa koncept är svåröversatta och mallen också var på engelska. Utöver rapportskrivandet har jag också arbetat med förstudien genom att läsa fler artiklar och gå in lite djupare i de jag haft sedan tidigare. Ett störningsmoment har varit att Citeseer (som är den vanligaste länkade sidan för de artiklar jag använder) varit nere hela veckan, men de flesta artiklarna har gått att få tag på oavsett. Ett undantag är Optimal Transform in Perceptually Uniform Color Space and Its Application in Image Coding som jag inte lyckats få tag i ännu. Den enda fungerande länken jag kan hitta är Springerlink, som kräver betalning - även från universitetets maskiner där man vanligtvis kan komma åt deras artiklar gratis. Edit: Hittade artikeln.

Antalet kameror som använts vid något tillfälle i projektet är nu uppe i fyra. Utöver de tre webbkameror (två Logitech och en Canyon) har jag har också undersökt om det går att använda en nätverkskamera från AXIS. AXIS-kameran klarar av att producera video med mycket bra färgåtergivning vid 30 FPS och 640x480 upplösning, men den har några år på nacken och lider av vissa problem. Ibland kommer fördröjningar på några sekunder mitt i videoströmmen och ibland verkar den krascha helt och inget hjälper utom att koppla ur och in strömtillförseln. Den kamera som jag använder oftast är den billigare av Logitech-kamerorna, eftersom både den dyrare Logitech-kameran och den från Canyon envisas med att automatiskt justera bilden utifrån ljusnivån på bilden. Det är säkert en användbar funktion om man håller videokonferens, men när man försöker hitta föremål som borde ha en viss färg är det rent sabotage (beroende på vilken tröja jag har på mig kan mina händer variera mellan nära naturlig färg och kritvita).

Försöken att plocka ut hudområden från videorutor i YCbCr-rymden (vilket är det format som bilderna hur som helst behöver avkodas till för att spelas upp under SDL, men som även rekommenderas av densamme Mr. Oğuz Altun, et al., som den optimala färgrymden för hudsegmentering) har fortsatt även om de inte fått så hög prioritet eftersom jag officiellt inte kommit till implementeringsstadiet innan fördjupningsstudien är slutförd. Efter kalibrering i form av att mäta medelvärdet för hudområden kunde mitt testprogram oftast markera händerna korrekt på bilden, men så fort ljusförhållandena ändrades det minsta sjönk nogrannheten snabbt.

Under en diskussion på kontoret kom ett förslag som jag inte hade tagit hänsyn till alls - det faktum att det finns andra spektrum än det synliga att samla data från! Johnny Lee har fått massvis med (välförtjänt) publicitet för sina projekt som använder den infraröda (IR) kameran som Wii-kontroller har inbyggda för att spåra fingrar, producera virtuella whiteboards och producera en helt ny sort av 3D-upplevelser. Som Johnny nämner i den första videon verkar dock inte mänsklig hud lysa tillräckligt ljust i IR-spektrat för att vara synliga, men om man belyser hud med en IR-källa reflekterar dom ljuset betydligt bättre än omgivningen. Jag har tittat lite under veckan på ett C-bibliotek som heter wiiuse (samt fått det att kompilera, efter en kort kamp) och tillhandahåller möjligheten att läsa av data från en Wii-kontroll via Bluetooth.

Jag kommer troligtvis diskutera möjligheten att utnyttja IR-läsare för att hitta hudområden i fördjupningsstudien och om jag får tag på en Wii-kontroll och en IR-strålkastare (vilken troligtvis kommer bestå av ett antal IR-dioder på en liten yta) även testa hur bra det fungerar själv.

Under nästa vecka (vecka 29) ska jag arbeta med de delar av fördjupningsstudien som sammanfattar artiklar med relaterat arbete och även beskriva olika klassificeringsmetoder som kan vara lämpliga för problemet. Förhoppningsvis kan fördjupningsstudiens kapitel vara till största delen färdigt efter nästa vecka. Ifall jag får tillgång till en Wii-kontroller kommer jag givetvis börja leka med den. Om jag har tid ska jag även ta en titt på drivrutinerna för webbkamerorna för att se om det går att slå av automatiska justeringarna av ljusnivån. Förr eller senare bör jag också börja titta på att implementera (eller hitta bibliotek) för bildanalysalgoritmer för postprocessing av segmenteringsdata och lite annat, men just nu lutar det åt "senare".

Inga kommentarer: