Multi-Stage FSRCNN

Model

Unduhan :

Pendahuluan

Model deteksi wajah pada resolusi rendah sering digunakan dalam aplikasi seperti pengawasan CCTV, yang menghasilkan data wajah dengan kualitas gambar yang rendah. Deteksi wajah dalam kondisi ini menjadi tantangan karena kualitas gambar yang buruk, pencahayaan yang tidak konsisten, dan perubahan pose wajah. Untuk mengatasi hal ini, pendekatan gabungan antara deteksi wajah menggunakan Cascade Classifier dan rekonstruksi multi-stage FSRCNN diusulkan.

Arsitektur Model

Model ini menggabungkan dua komponen utama: Cascade Classifier untuk deteksi wajah dan FSRCNN (Fast Super-Resolution Convolutional Neural Network) multi-stage untuk rekonstruksi gambar wajah yang terdeteksi. Proses ini terdiri dari beberapa tahap sebagai berikut:

Deteksi Wajah Menggunakan Cascade Classifier
Cascade Classifier digunakan sebagai metode awal untuk mendeteksi ROI (Region of Interest) yang berpotensi mengandung wajah. Classifier ini dilatih menggunakan data wajah beranotasi dari footage CCTV dan lingkungan sekolah dengan kondisi pencahayaan yang berbeda (pagi, siang, dan sore) pada lokasi tertentu (gerbang masuk).
Rekonstruksi Gambar Wajah dengan Multi-Stage FSRCNN
Setelah ROI wajah terdeteksi, proses rekonstruksi dilakukan dalam dua tahap menggunakan arsitektur FSRCNN:
- Tahap Pertama: FSRCNN tahap pertama bertugas merekonstruksi ROI dari resolusi 25x25 piksel menjadi 50x50 piksel. Pada tahap ini, residual atau sisa rekonstruksi disimpan untuk digunakan pada tahap selanjutnya.
- Tahap Kedua: FSRCNN tahap kedua merekonstruksi wajah dari resolusi 50x50 piksel menjadi 100x100 piksel. Residual dari tahap pertama dimanfaatkan untuk meningkatkan akurasi rekonstruksi dengan menambahkan informasi detail pada wajah.
Validasi ROI Wajah
Validasi dilakukan untuk memastikan bahwa ROI hasil deteksi benar-benar merupakan wajah. Dua pendekatan digunakan:
- Validasi Menggunakan FSRCNN: ROI wajah yang telah direkonstruksi ke resolusi 100x100 piksel divalidasi secara visual untuk mengidentifikasi keakuratan deteksi.
- Validasi Menggunakan Dlib: Dlib digunakan untuk memvalidasi ulang ROI dan memastikan bahwa area tersebut merupakan wajah yang valid.

Keunggulan Pendekatan

Pendekatan ini menawarkan beberapa keunggulan:

Efektivitas Deteksi pada Resolusi Rendah: Cascade Classifier yang terlatih pada kondisi pencahayaan dan lokasi yang spesifik mampu mendeteksi wajah pada resolusi rendah dengan baik.
Rekonstruksi Bertahap yang Efisien: Proses rekonstruksi bertahap dengan FSRCNN memperbaiki kualitas gambar wajah secara progresif, memungkinkan deteksi yang lebih akurat dan pengenalan wajah yang lebih baik.
Validasi Ganda untuk Akurasi Deteksi: Dengan menggunakan FSRCNN dan Dlib, model ini meminimalkan kesalahan deteksi dan memastikan bahwa ROI yang diidentifikasi benar-benar merupakan wajah.

Implementasi dan Aplikasi

Model ini diimplementasikan dalam skenario pemantauan dengan sumber data dari CCTV dan dataset wajah seperti CelebA. Aplikasi potensial termasuk pemantauan keamanan di area publik, pengawasan pintu masuk, dan sistem pengenalan wajah dalam kondisi pencahayaan dan resolusi rendah.

Kesimpulan

Penggabungan deteksi wajah dengan Cascade Classifier dan rekonstruksi multi-stage FSRCNN menyediakan pendekatan yang efektif untuk mengatasi tantangan deteksi wajah dalam kondisi resolusi rendah. Model ini memberikan hasil rekonstruksi yang lebih jelas dan akurat, memperkuat deteksi serta validasi ROI, dan meningkatkan kinerja sistem pengenalan wajah secara keseluruhan.

Model :

Model Deteksi Wajah dengan Cascade Classifier dan Rekonstruksi Multi-Stage Fast Super-Resolution Convolutional Neural Network (FSRCNN)