Histogram of Oriented Gradient untuk Pengenalan Gerakan Bibir (Part 1)

Baca Juga

 Abstrak:

Penelitian ini bertujuan untuk mengidentifikasi gerakan bibir saat mengucapkan kosakata bahasa Arab menggunakan metode Histogram of Oriented Gradient (HOG) untuk ekstraksi fitur. Studi ini fokus pada pengucapan kosakata bahasa Arab, salah satunya kata “Afwan” (minta maaf dalam bahasa Indonesia) yang diekstraksi dari video dan disimpan dalam bentuk CSV per-frame. Hasil penelitian ini diharapkan dapat meningkatkan pemahaman tentang gerakan bibir dalam pengucapan bahasa Arab dan membantu pengembangan sistem pengenalan ucapan yang lebih efisien.

Pengenalan gerakan bibir merupakan salah satu aspek penting dalam pengenalan ucapan, terutama dalam konteks pembelajaran bahasa. Dalam penelitian ini, kami menggunakan metode Histogram of Oriented Gradient (HOG) untuk mengidentifikasi gerakan bibir saat mengucapkan kosakata bahasa Arab. HOG merupakan metode ekstraksi fitur yang telah terbukti efektif dalam pengenalan objek visual, termasuk deteksi manusia dan pengenalan wajah.

Metodologi

Untuk mengimplementasikan metode HOG dalam penelitian ini, kami menggunakan video pengucapan beberapa kosakata bahasa Arab, salah satunya “Afwan” (minta maaf dalam bahasa Indonesia). Video tersebut diolah dengan mengonversi setiap frame menjadi gambar grayscale, kemudian menerapkan HOG untuk menghitung distribusi gradien orientasi lokal di sekitar titik tertentu pada gambar. Fitur-fitur yang diekstraksi kemudian disimpan dalam bentuk CSV per-frame untuk analisis lebih lanjut.

Dari hasil ekstraksi fitur menggunakan HOG, kami dapat mengidentifikasi pola gerakan bibir yang khas saat mengucapkan kata “Afwan” dalam bahasa Arab. Pola ini mencakup perubahan bentuk bibir, posisi, dan orientasi yang berbeda sepanjang pengucapan kata tersebut. Analisis lebih lanjut dari fitur-fitur yang diekstraksi dapat membantu dalam mengidentifikasi karakteristik unik gerakan bibir yang terkait dengan pengucapan kosakata bahasa Arab lainnya. Hasil penelitian ini diharapkan dapat membantu pengembangan sistem pengenalan ucapan yang lebih efisien dan meningkatkan pemahaman tentang gerakan bibir dalam konteks pembelajaran bahasa.

Tidak ada komentar:

Posting Komentar

 

Theme by Gus Fahmi

© 2014-2023 Home | About | Privacy