Hamida dkk. (2022) mengusulkan pendekatan yang efisien untuk meningkatkan pengenalan kata-kata dari tulisan tangan berbahasa Arab. Mereka menggunakan tiga deskriptor gambar untuk tahap ekstraksi fitur dan menerapkan teknik preprocessing. Proses tersebut diimplementasikan pada 100 classes dari basis data tulisan tangan berbahasa Arab. Mereka melatih algoritma k-nearest neighbor (k-NN) untuk setiap deskriptor ekstraksi fitur dan menggunakan model terbaik untuk mengklasifikasikan gambar tulisan tangan Arab tersebut.
Algoritma yang dipilih kemudian digunakan untuk menggabungkan hasil prediksi. Sistem yang diusulkan mencapai tingkat pengenalan yang tinggi, yakni mencapai hingga 99,88%. Hal tersebut melebihi hasil yang sebelumnya ada dengan menggunakan dataset dari Institut Für Nachrichtentechnik/Ecole Nationale d’Ingénieurs de Tunis (IFN/ENIT). Dataset pelatihan dan pengujian disiapkan dengan menerapkan teknik preprocessing pada 100 class yang dipilih dari basis data bahasa Arab tulisan tangan dari IFN/ENIT.
Teknik preprocessing spesifik yang digunakan tidak disebutkan dalam artikel tersebut. Namun, dapat disimpulkan bahwa teknik preprocessing diterapkan pada kelas-kelas yang dipilih untuk mempersiapkan dataset untuk penelitian ini. Dataset pelatihan dan pengujian kemudian digunakan untuk melatih dan mengevaluasi algoritma k-NN pada setiap deskriptor ekstraksi fitur. Model k-NN terbaik dipilih berdasarkan metrik evaluasi kinerja umum dan digunakan untuk mengklasifikasikan gambar tulisan tangan berbahasa Arab sesuai dengan kelasnya. Sistem yang mereka usulkan menunjukkan keandalan untuk pengenalan kata-kata Arab yang ditulis tangan.
Arabic handwritten text recognition has long been a difficult subject, owing to the similarity of its characters and the wide range of writing styles. However, due to the intricacy of Arabic handwriting morphology, solving the challenge of cursive handwriting recognition remains difficult. In this paper, we propose a new efficient based image processing approach that combines three image descriptors for the feature extraction phase. To prepare the training and testing datasets, we applied a series of preprocessing techniques to 100 classes selected from the handwritten Arabic database of the Institut Für Nachrichtentechnik/Ecole Nationale d’Ingénieurs de Tunis (IFN/ENIT). Then, we trained the k-nearest neighbor’s algorithm (k-NN) algorithm to generate the best model for each feature extraction descriptor. The best k-NN model, according to common performance evaluation metrics, is used to classify Arabic handwritten images according to their classes. Based on the performance evaluation results of the three k-NN generated models, the majority-voting algorithm is used to combine the prediction results. A high recognition rate of up to 99.88% is achieved, far exceeding the state-of-the-art results using the IFN/ENIT dataset. The obtained results highlight the reliability of the proposed system for the recognition of handwritten Arabic words.
Efficient feature descriptor selection for improved Arabic handwritten words recognition
Soufiane Hamida, Oussama El Gannour, Bouchaib Cherradi, Hassan Ouajji, Abdelhadi Raihani
Redaksi: I. Busthomi