AutorWitold Dębski
Opiekundr inż. Grzegorz Galiński
Pracamagisterska
Data obrony2023

Wykrywanie gestów ludzkiej dłoni przejawia się w wielu dziedzinach nauki i o ile istnieją rozwiązania pozwalające zimplementować wykrywanie gestów, więszkość z nich wymaga dużego nakładu pracy stwarzającego barierę dla pojedyńczych programistów lub niewielkich zespołów chcących wykorzystać wykrywanie gestów w swoich aplikacjach.

W pracy zaprezentowano proces tworzenia biblioteki GestRec, mającej na celu obniżenie bariery wejścia do wdrożenia wykrywania gestów w aplikacjach. Przeprowadzono analizę dostępnych rozwiązań i zbiorów danych, przygotowano własny zbiór i za jego pomocą wytrenowano modele popularnych sieci neuronowych, osiągając dokładność (ang. accuracy) na poziomie 95,7% dla modelu sieci ResNet34. Dodatkowo przetestowano rozwiązanie do klasyfikacji gestów oparte na MediaPipe od Google w połączeniu z algorytmem SVC, które osiągnęło wynik na poziomie 93,4%.

Po przygotowaniu odpowiedniego modelu sieci, stworzono i upubliczniono bibliotekę GestRec, pozwalającą klasyfikować gesty ludzkiej dłoni w czasie rzeczywistym. W ramach biblioteki napisano automatycznie generowaną dokumentację
oraz dwie przykładowe aplikacje prezentujące jej wykorzystanie, które użytkownicy mogą wykorzystać do przygotowania własnych projektów. W bibliotece zastosowano szereg technik optymalizacyjnych, dzięki czemu uzyskano przetwarzanie ponad 15 klatek na sekundę w czasie rzeczywistym bez wykorzystania platformy CUDA.