Monday, August 5, 2024

TRANSLITERASI MESIN BAHASA MELAYU: JAWI LAMA - RUMI BERASASKAN PETUA

https://bit.ly/Jawi_transliterasi


 Abstrak. 

Transliterasi mesin adalah proses menukar skrip daripada teks sumber kepada teks sasaran secara automatik. Ia banyak digunakan Dalam Capaian Maklumat Merentas Bahasa (CLIR), Terjemahan Mesin dan Pengekstrakan Maklumat. Isu utama dalam kajian transliterasi mesin adalah bagaimana untuk mendapatkan hasil transliterasi yang mempunyai ketepatan yang tinggi bagi perkataan yang tiada dalam kamus atau perbendaharaan kata (OOV). Model yang digunakan di dalam kajian ini adalah pendekatan berasaskan petua (rule based approach). Hasil eksprimen mendapati bahawa ketepatannya mencapai sehingga 75.39% berdasarkan ujian terhadap set data Jawi lama pada Majalah Qalam (1950) dan Kitab Hidayah Al-Salikin (1935). Berdasarkan hasil ujikaji, pendekatan berasaskan petua tidak mampu menyelesaikan sepenuhnya masalah yang terdapat di dalam transliterasi Jawi lama kepada Rumi. Ini kerana terdapat sebahagian ejaan Jawi lama mempunyai homograf (ejaannya sama tetapi sebutannya berbeza) yang mana memerlukan pendekatan yang berlainan. Oleh yang demikian, kajian ini mencadangkan agar dilanjutkan pada masa akan datang dalam menangani perkataan yang homograf atau kabur (ambiguity) agar ralat yang berlaku dapat dikurangkan.

Full paper >> Download here


MACHINE TRANSLITERATION OF MALAY LANGUAGE: OLD JAWI - ROMAN (RUMI) BASED ON RULES

Abstract. 

Machine transliteration is the process of automatically converting a script from a source text to a target text. It is widely used in Cross-Language Information Access (CLIR), Machine Translation and Information Extraction. The main issue in the study of machine transliteration is how to obtain transliteration results that have high accuracy for words that are not in the dictionary or out-of-vocabulary (OOV). The model used in this study is a rule based approach. The results of the experiment found that the accuracy reached up to 75.39% based on tests on old Jawi data sets in Qalam Magazine (1950) and Hidayah Al-Salikin Book (1935). Based on the results of the experiment, the rule based approach is not able to fully solve the problems found in the transliteration of old Jawi to Rumi. This is because some old Jawi spellings have homographs (the spelling is the same but the pronunciation is different) which requires a different approach. Therefore, this study suggests that it be continued in the future in dealing with words that are homographs or ambiguous (ambiguity) so that the errors that occur can be reduced.

Full paper >> Download here


Wednesday, September 27, 2023

Konvokesyen UIS ke 26 2023

















Konvokesyen UIS ke 26 pada 23-26 September 2023.



Friday, June 30, 2023

Korban Aidil Adha Raya ke 2 1444H

30 Jun 2023

Alhamdulillah, 

Seekor lembu berjaya dikorbankan untuk hari ke2 di Kg Felda Pasoh 2 Negeri Sembilan.










Selamat Hari Raya Korban 1444h

Alhamdulillah, Hari Raya Aidiladha dapat join sukarelawan bagi membantu Majlis Ibadah Korban di Masjid Al Azhar Universiti Islam Selangor (UIS). 

Enam ekor lembu berjaya ditumbangkan bermula selepas solat sunat Aidiladha lebih kurang jam 9.30pagi. Selesai majlis Korban sebelum solat Zohor.











Perginya seorang ibu yang tercinta mengadap PenciptaNya

 Tarikh 13 Mac 2022

Aku dikejutkan dengan pemergian ibuku yang tercinta ke rahmatullah buat selama-lamanya.




Semoga arwah ibu tenang di sana dan di tempatkan bersama-sama orang yang solehah.