Wahyuni, Mirda
Program Studi Informatika Universitas Tanjungpura

Published : 1 Documents
Articles

Found 1 Documents
Search

Pengaruh Kuantitas Korpus Monolingual Terhadap Akurasi Mesin Penerjemah Statistik Wahyuni, Mirda; Sujaini, Herry; Muhardi, Hafiz
Jurnal Sistem dan Teknologi Informasi (JUSTIN) Vol 7, No 1 (2019)
Publisher : Program Studi Informatika Universitas Tanjungpura

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (541.954 KB) | DOI: 10.26418/justin.v7i1.27241

Abstract

Untuk mencapai hasil terjemahan yang optimal mesin penerjemah statistik membutuhkan korpus paralel dalam jumlah yang besar dimana korpus tersebut berisi salinan teks bahasa sumber dan bahasa target yang sejajar. Ketersediaan korpus paralel menjadi salah satu permasalahan karena sumber yang menyediakan dokumen korpus paralel sulit ditemukan. Tidak seperti data paralel, korpus monolingual yang berisi teks hanya dalam satu bahasa dapat mempermudah pembuatan korpus (terutama bahasa target), karena dokumen teks monolingual tersedia secara luas sehingga tidak diperlukan usaha lebih untuk menerjemahkan teks korpus bilingual. Tujuan yang ingin dicapai dalam penelitian ini adalah untuk mengetahui seberapa besar pengaruh kuantitas korpus monolingual terhadap nilai akurasi hasil terjemahan pada mesin penerjemah statistik Bahasa Inggris ke Bahasa Indonesia. Pengujian otomatis menggunakan BLEU dilakukan secara bertahap terhadap 2000 kalimat uji dengan menambahkan korpus monolingual bahasa target dengan jumlah yang sama pada setiap mesinnya yaitu sebanyak 6000 hingga mencapai jumlah 60000 kalimat dan didapatkan peningkatan akurasi sebesar 10,13%. Pengujian manual dilakukan oleh seorang ahli Bahasa Inggris dengan korpus uji sebanyak 100 kalimat dengan peningkatan akurasi sebesar 10,07%. Penggunaan korpus monolingual dapat mempermudah penyediaan sumber data pada mesin penerjemah statistik namun karena peningkatan akurasinya yang terbilang cukup kecil maka dibutuhkan jumlah korpus yang sangat besar sehingga penambahan korpus monolingual ini kurang efisien untuk meningkatkan akurasi terjemahan di atas 30%.