AutorZofia Zubrzycka
Opiekundr inż. Grzegorz Galiński
Pracainżynierska
Data obrony2025

Praca dotyczyła zagadnienia wirtualnego przymierzania ubrań z wykorzystaniem generatywnego modelu dyfuzyjnego. Celem pracy była realizacja aplikacji umożliwiającej użytkownikom wirtualne przymierzanie ubrań na podstawie załadowanych zdjęć sylwetki i ubrania. W pracy omówiono podstawy teoretyczne, a także proces projektowania i realizacji proponowanego systemu.

Aplikacja została stworzona w architekturze klient-serwer, co pozwala na wykorzystanie zasobów procesora graficznego (GPU) dostępnego na serwerze do generowania obrazów wynikowych. Aplikacje˛ zrealizowano w języku Python w formie aplikacji desktopowej działającej na systemach operacyjnych Windows i Linux. Do implementacji wykorzystano modele sieci neuronowych OOTDiffusion i YOLOv8 oraz biblioteki takie jak PyQt5, OpenCV, Ultralytics, ZeroMQ.

Aplikacja umożliwia przesyłanie obrazów wejściowych lub ich akwizycję za pomocą kamery podłączonej do komputera. Przesłane obrazy poddawane są wstępnemu przetwarzaniu, obejmującemu detekcję osoby lub ubrania z wykorzystaniem splotowej sieci neuronowej, skalowanie oraz usunięcie tła. Na podstawie tak przetworzonych obrazów generowane są realistyczne wizualizacje przedstawiające użytkownika w wybranym ubraniu.

W aplikacji zaimplementowano także przeglądarkę obrazów, dzięki której użytkownik może obejrzeć wszystkie uzyskane rezultaty w jednym miejscu. Rezultaty są również zapisywane dedykowanym folderze w lokalnym systemie plików. Aplikacja umożliwia także jednoczesne wgrywanie wielu par zdjęć wejściowych, co pozwala na optymalizację procesu generowania wielu wizualizacji.

W ramach pracy dokonano i przedstawiono ocenę modelu wykorzystanego do generowania obrazów. Otrzymane wyniki potwierdzają potencjał systemu, jednak wykazano, że jakość generowanych obrazów mocno zależy od jakości obrazów wejściowych oraz warunków ich akwizycji.