Articles

SISTEM TEMU KEMBALI DOKUMEN TEKS DENGAN PEMBOBOTAN TF-IDF DAN LCS Saadah, Munjiah Nur; Atmagi, Rigga Widar; Rahayu, Dyah S.; Arifin, Agus Zainal
JUTI: Jurnal Ilmiah Teknologi Informasi Vol 11, No 1, Januari 2013
Publisher : Teknik Informatika, ITS Surabaya

Show Abstract | Original Source | Check in Google Scholar | Full PDF (612.866 KB)

Abstract

Sistem temu kembali dokumen teks membutuhkan metode yang mampu mengembalikan sejumlah dokumen yang memiliki relevansi tinggi sesuai dengan permintaan pengguna. Salah satu tahapan penting dalam proses representasi teks adalah proses pembobotan. Penggunaan LCS dalam penyesuaian bobot Tf -Idf mempertimbangkan kemunculan urutan kata yang sama antara query dan teks di dalam dokumen. Adanya dokumen yang sangat panjang namun tidak relevan menyebabkan bobot yang dihasilkan tidak mampu merepresentasikan nilai relevansi dokumen. Penelitian ini mengusulkan penggunaan metode LCS yang memberikan bobot urutan kata dengan mempertimbangkan panjang dokumen terkait dengan rata-rata panjang dokumen dalam korpus. Metode ini mampu melakukan pengembalian dokumen teks secara efektif. Penambahan fitur urutan kata dengan normalisasi rasio panjang dokumen terhadap keseluruhan dokumen dalam korpus menghasilkan nilai presisi dan recall yang sama baiknya dengan metode sebelumnya.
USER EMOTION IDENTIFICATION IN TWITTER USING SPECIFIC FEATURES: HASHTAG, EMOJI, EMOTICON, AND ADJECTIVE TERM Sari, Yuita Arum; Ratnasari, Evy Kamilah; Mutrofin, Siti; Arifin, Agus Zainal
Jurnal Ilmu Komputer dan Informasi Vol 7, No 1 (2014): Jurnal Ilmu Komputer dan Informasi (Journal of Computer Science and Information)
Publisher : Faculty of Computer Science - Universitas Indonesia

Show Abstract | Original Source | Check in Google Scholar | Full PDF (271.587 KB)

Abstract

Abstract Twitter is a social media application, which can give a sign for identifying user emotion. Identification of user emotion can be utilized in commercial domain, health, politic, and security problems. The problem of emotion identification in twit is the unstructured short text messages which lead the difficulty to figure out main features. In this paper, we propose a new framework for identifying the tendency of user emotions using specific features, i.e. hashtag, emoji, emoticon, and adjective term. Preprocessing is applied in the first phase, and then user emotions are identified by means of classification method using kNN. The proposed method can achieve good results, near ground truth, with accuracy of 92%.
Fuzzy Region Merging using Fuzzy Similarity Measurement on Image Segmentation Gunawan, Wawan; Arifin, Agus Zainal; Indraswari, Rarasmaya; Navastara, Dini Adni
International Journal of Electrical and Computer Engineering (IJECE) Vol 7, No 6: December 2017
Publisher : Institute of Advanced Engineering and Science

Show Abstract | Original Source | Check in Google Scholar

Abstract

Some image?s regions have unbalance information, such as blurred contour, shade, and uneven brightness. Those regions are called as ambiguous regions. Ambiguous region cause problem during region merging process in interactive image segmentation because that region has double information, both as object and background. We proposed a new region merging strategy using fuzzy similarity measurement for image segmentation. The proposed method has four steps; the first step is initial segmentation using mean-shift algorithm. The second step is giving markers manually to indicate the object and background region. The third step is determining the fuzzy region or ambiguous region in the images. The last step is fuzzy region merging using fuzzy similarity measurement. The experimental results demonstrated that the proposed method is able to segment natural images and dental panoramic images successfully with the average value of misclassification error (ME) 1.96% and 5.47%, respectively.
TERM WEIGHTING BASED ON INDEX OF GENRE FOR WEB PAGE GENRE CLASSIFICATION Sugiyanto, Sugiyanto; Rozi, Nanang Fakhrur; Putri, Tesa Eranti; Arifin, Agus Zainal
JUTI: Jurnal Ilmiah Teknologi Informasi Vol 12, No 1, Januari 2014
Publisher : Teknik Informatika, ITS

Show Abstract | Original Source | Check in Google Scholar | Full PDF (402.086 KB)

Abstract

Automating the identification of the genre of web pages becomes an important area in web pages classification, as it can be used to improve the quality of the web search result and to reduce search time. To index the terms used in classification, generally the selected type of weighting is the document-based TF-IDF. However, this method does not consider genre, whereas web page documents have a type of categorization called genre. With the existence of genre, the term appearing often in a genre should be more significant in document indexing compared to the term appearing frequently in many genres despites its high TF-IDF value. We proposed a new weighting method for web page documents indexing called inverse genre frequency (IGF). This method is based on genre, a manual categorization done semantically from previous research. Experimental results show that the term weighting based on index of genre (TF-IGF) performed better compared to term weighting based on index of document (TF-IDF), with the highest value of accuracy, precision, recall, and F-measure in case of excluding the genre-specific keywords were 78%, 80.2%, 78%, and 77.4% respectively, and in case of including the genre-specific keywords were 78.9%, 78.7%, 78.9%, and 78.1% respectively.
PENDEKATAN POSITIONAL TEXT GRAPH UNTUK PEMILIHAN KALIMAT REPRESENTATIF CLUSTER PADA PERINGKASAN MULTI-DOKUMEN Suputra, I Putu Gede Hendra; Arifin, Agus Zainal; Yuniarti, Anny
Jurnal Ilmu Komputer Vol 6, No 2: September 2013
Publisher : Jurnal Ilmu Komputer

Show Abstract | Original Source | Check in Google Scholar

Abstract

Coverage and saliency are major problems in Automatic Text Summarization. Sentence clusteringapproaches are methods able to provide good coverage on all topics, but the point to be considered is theselection of important sentence that can represent the cluster’s topic. The salient sentences selected asconstituent to the final summary should have information density so that can convey important informationcontained in the cluster. Information density from the sentence can be mined by extracting the sentenceinformation density (SID) feature that built from positional text graph approach of every sentence in the cluster.This paper proposed a cluster representative sentence selection strategy that used the positional text graphapproach in multi-document summarization. There are three concepts that used in this paper: (1) sentenceclustering based on similarity based histogram clustering, (2) cluster ordering based on cluster importance and(3) representative sentence selection based on sentence information density feature score. The candidatesummary sentence is a sentence that has greatest sentence information density feature score of a cluster. Trialsconducted on task 2 DUC 2004 dataset. ROUGE-1 measurement was used as performance metric to comparethe use of SID feature with other method namely Local Importance and Global Importance (LIGI). Test resultshowed that the use of SID feature was successfully outperform LIGI method based on ROUGE-1 values wherethe greatest average value of ROUGE-1 that achieved by SID features is 0.3915.
OTOMATISASI PERBANDINGAN PRODUK BERDASARKAN BOBOT FITUR PADA TEKS OPINI Azhar, Yufis; Arifin, Agus Zainal; Purwitasari, Diana
Jurnal Ilmu Komputer Vol 6, No 2: September 2013
Publisher : Jurnal Ilmu Komputer

Show Abstract | Original Source | Check in Google Scholar

Abstract

Proses otomatisasi perbandingan produk berdasarkan teks opini dapat dilakukan dengan caramengekstrak fitur yang dimiliki produk tersebut. Fitur-fitur inilah yang umumnya dinilai kemudian digunakanuntuk membandingkan suatu produk dengan produk yang lain. Banyak peneliti yang menggunakan kamus kataopini untuk mengekstrak fitur tersebut. Akan tetapi hal tersebut tidak efektif karena sangat bergantung padakelengkapan kamus kata yang digunakan. Oleh karena itu, dalam penelitian ini diusulkan suatu metode untukmembandingkan produk berdasarkan bobot fitur produk tanpa harus menggunakan kamus kata opini yanglengkap. Caranya adalah dengan menjumlahkan bobot dari fitur-fitur unggul yang dimiliki oleh suatu produkuntuk mendapatkan skor tiap produk. Hasil yang didapat menunjukkan bahwa penerapan metode tersebut dapatmeningkatkan akurasi dari proses perbandingan dua buah produk sebesar 81% dari pada metode sebelumnyayang hanya 71%.
KOMPRESI CITRA PENGINDERAAN JAUH MULTISPEKTRAL BERBASIS CLUSTERING DAN REDUKSI SPEKTRAL Arifin, Agus Zainal; Lestriandoko, Nova Hadi
JUTI: Scientific Journal of Information Technology Vol 2, No 1 Januari 2003
Publisher : Teknik Informatika, ITS Surabaya

Show Abstract | Original Source | Check in Google Scholar | Full PDF (278.187 KB)

Abstract

Kompresi Citra pada aplikasi Penginderaan Jauh Multispektral merupakan kebutuhan yang sangat vital, sebab citra multispektral merupakan citra yang membutuhkan ruang penyimpanan yang sangat besar. Di sisi lain, citra multispektral memiliki karakteristik istimewa yang dapat dimanfaatkan untuk meningkatkan efektifitas proses kompresinya. Karakteristik ini berkaitan dengan penggunaan citra tersebut dalam proses klasifikasinya. Dengan demikian, kompresi citra multispektral tidak perlu menggunakan cara konvensional, melainkan dengan memanfaatkan karakteristik yang dimilikinya. Penelitian ini membahas sebuah metode kompresi citra multispektral yang mengintegrasikan metode clustering, manipulasi spektral, serta pengkodean. Metode clustering yang digunakan adalah Improved Split and Merge Clustering (ISMC). Pada proses manipulasi spektral digunakan Principal Component Analysis (PCA). Sedangkan untuk pengkodean digunakan metode kompresi data lossless yaitu metode Lempel-Ziv Welch (LZW). Integrasi dari clustering, manipulasi spektral, dan pengkodean ini dibagi menjadi 2 kombinasi, yakni clustering-LZW dan PCA-clustering-LZW. Evaluasi dilakukan dengan mengukur rasio kompresi, waktu komputasi, jumlah cluster, dan ukuran kesalahan yang meliputi total error, maksimum error, dan rata-rata error. Dari hasil uji coba, didapatkan bahwa masing-masing metode ini memiliki keunggulan yang berbeda pada tiap faktor evaluasinya, sehingga pengguna dapat memilih untuk menggunakan metode yang tepat sesuai kebutuhannya. Kata kunci : Clustering, kompresi citra, citra multispektral, ISMC, reduksi spektral, LZW
PENGGUNAAN ANALISA FAKTOR UNTUK KLASIFIKASI CITRA PENGINDERAAN JAUH MULTISPEKTRAL Arifin, Agus Zainal; Kurniati, Wiwik Dyah Septiana
JUTI: Jurnal Ilmiah Teknologi Informasi Vol 1, No 1 Juli 2002
Publisher : Jurusan Teknik Informatika ITS, Fakultas Teknologi Informasi, Institut Teknologi Sepuluh N

Show Abstract | Original Source | Check in Google Scholar | Full PDF (421.672 KB)

Abstract

Proses clustering bisa berlangsung baik secara hierarchical (split dan merge) maupun partitional (partisi). Proses split yang pembagiannya berdasarkan histogram lebih mudah dilakukan pada satu dimensi, sehingga dibutuhkan proses transformasi. Metode transformasi yang umum digunakan adalah Principal Component Analysis (PCA). Namun PCA ternyata hanya didasarkan pada pencarian dimensi bervariansi maksimum, sehingga memungkinkan terjadinya overlapping kelas, dalam arti ada kelas yang tidak dapat dipisahkan Pada penelitian ini, metode transformasi yang digunakan adalah Analisa Faktor (Factor Analysis / Canonical Analysis). Metode ini lebih baik bila dibandingkan dengan metode Principal Component Analysis (PCA). Sebab, Analisa Faktor mentransformasi sekaligus memilah cluster dalam feature space. Tiga proses utama dalam penelitian ini yaitu split, merge, dan partitional K-means clustering. Citra multispektral ditransformasi menjadi satu dimensi. Histogram satu dimensi displit dengan pemilihan puncak kurva. Merge menggabungkan cluster hasil split tersebut. Cluster yang berdekatan digabungkan menjadi cluster baru. K-means clustering digunakan untuk mendeteksi lokasi pusat cluster (prototipe cluster) dan sekaligus mengelompokkan pixel ke setiap cluster. Hasil penelitian ini dibandingkan dengan hasil algoritma clustering yang proses transformasinya menggunakan PCA. Hasil perbandingan membuktikan bahwa clustering yang proses transformasinya menggunakan Analisa Faktor menghasilkan heterogenitas antar cluster lebih tinggi (Tr(SB) meningkat antara 0.83 % sampai 19.58 %). Adapun kekompakan tiap cluster tidak selalu optimal. Hal ini sangat mungkin disebabkan jumlah kelas sampel kurang banyak dan pengambilan sampel di tiap kelas kurang bervariasi. Kata kunci: Analisa Faktor, complete link, K-means clustering, Scatter within class, Scatter between class
ANALISA KERAPATAN TRABECULAR BONE BERBASIS GRAPH BERBOBOT PADA CITRA PANORAMA GIGI UNTUK IDENTIFIKASI OSTEOPOROSIS Abidin, Zainal; Arifin, Agus Zainal
JUTI: Jurnal Ilmiah Teknologi Informasi Vol 7, No 2, Juli 2008
Publisher : Teknik Informatika, ITS Surabaya

Show Abstract | Original Source | Check in Google Scholar | Full PDF (1012.774 KB)

Abstract

Osteoporosis is bone disease indocated by low bone mass density and micro architectures disorder which lead to bone fragility or fractures. Graph may be useful to describe density of trabeculae bone due to morphological change on mandibular bone in dental panoramic radiographs. The density of trabecular bone can be discribed by generating graph. Trabecular image firstly was transformed to binary image. A white pixel on the binary image presented as part of trabeculae, which assumed as an isolated node on the graph. Graph generation by Erdos and Royi method was used to build connections between an isolated node and others. This paper introduced the use of weight on each node based on probabilities average of its neigbourhoods. Graph’s properties which used to measure the density were degree and cluster coefficient. Both of properties are used to build feature space. Feature space indicated distribution of node on dense or sparse area. Early indication of osteoporosis could be assumed that ratio of nodes on dense area were greater than that on sparse area. We achieved accuration of 54%, sensitivity of 60%, and spesificity of 49%.   Keywords: osteoporosis, trabeculae, random graph, graph berbobot
MULTI-DOCUMENT SUMMARIZATION BASED ON SENTENCE CLUSTERING IMPROVED USING TOPIC WORDS Lukmana, Indra; Swanjaya, Daniel; Kurniawardhani, Arrie; Arifin, Agus Zainal; Purwitasari, Diana
JUTI: Jurnal Ilmiah Teknologi Informasi Vol 12, No 2, Juli 2014
Publisher : Teknik Informatika, ITS

Show Abstract | Original Source | Check in Google Scholar | Full PDF (292.988 KB)

Abstract

Informasi dalam bentuk teks berita telah menjadi salah satu komoditas yang paling penting dalam era informasi ini. Ada banyak berita yang dihasilkan sehari-hari, tetapi berita-berita ini sering memberikan konten kontekstual yang sama dengan narasi berbeda. Oleh karena itu, diperlukan metode untuk mengumpulkan informasi ini ke dalam ringkasan sederhana. Di antara sejumlah subtugas yang terlibat dalam peringkasan multi-dokumen termasuk ekstraksi kalimat, deteksi topik, ekstraksi kalimat representatif, dan kalimat rep-resentatif. Dalam tulisan ini, kami mengusulkan metode baru untuk merepresentasikan kalimat ber-dasarkan kata kunci dari topic teks menggunakan Latent Dirichlet Allocation (LDA). Metode ini terdiri dari tiga langkah dasar. Pertama, kami mengelompokkan kalimat di set dokumen menggunakan kesamaan histogram pengelompokan (SHC). Selanjutnya, peringkat cluster menggunakan klaster penting. Terakhir, kalimat perwakilan yang dipilih oleh topik diidentifikasi pada LDA. Metode yang diusulkan diuji pada dataset DUC2004. Hasil penelitian menunjukkan rata-rata 0,3419 dan 0,0766 untuk ROUGE-1 dan ROUGE-2, masing-masing. Selain itu, dari pembaca prespective, metode kami diusulkan menyajikan pengaturan yang koheren dan baik dalam memesan kalimat representatif, sehingga dapat mempermudah pemahaman bacaan dan mengurangi waktu yang dibutuhkan untuk membaca ringkasan.
Co-Authors - Azhari - Suprijanto Adam, Safri Adi Guna, I Gusti Agung Socrates Ahmad Reza Musthafa, Ahmad Reza Ahmad Wahyu Rosyadi, Ahmad Wahyu Akira Asano, Akira Akira Taguchi, Akira Al Haromainy, Muhammad Muharrom Alhaji Sheku Sankoh, Alhaji Sheku ali fauzi Alif Akbar Fitrawan, Alif Akbar Aminul Wahib Andi Baso Kaswar, Andi Baso Anggraini, Syadza Anny Yunairti, Anny Anny Yuniarti Anto Satriyo Nugroho, Anto Satriyo Arif Fadllullah, Arif Arifin, M. Jainal Arifzan Razak, Arifzan Arisa, Nursanti Novi Arrie Kurniawardhani Arya Yudhi Wijaya Aryo Harto, Aryo Bintana, Rizqa Raaiqa Bisono, Eva Firdayanti Chandranegara, Didih Rizki Christian Sri kusuma Aditya, Christian Sri kusuma Danardono, Renest Daniel Swanjaya Darlis Herumurti Darmawan, Tio Dasrit Debora Kamudi, Dasrit Debora Diana Purwitasari Dika Rizky Yunianto, Dika Rizky Dimas Fanny H. P., Dimas Fanny Dini Adni Navastara, Dini Adni Dwi P., Galang Amanda Dyah S. Rahayu Edwadr, Gregorius Effendi, Ari Ekoputris, Rizqi Okta Endang Juliastuti Erliyah Nurul Jannah, Erliyah Nurul Evy Kamilah Ratnasari Fajrin, Ahmad Miftah Farosanti, Lafnidita Fathoni, Kholid Fidi Wincoko Putro, Fidi Wincoko Go Frendi Gunawan Gosaria, Sonny Christiano Gulpi Qorik Oktagalu Pratamasunu, Gulpi Qorik Oktagalu Gus Nanang Syaifuddiin, Gus Nanang Hadi, Ahmad Mustofa Hani`ah, Mamluatul Hudan Studiawan Husain, Nursuci Putri I Made Widiartha I Putu Gede Hendra Suputra Indra Lukmana Indraswari, Rarasmaya Indraswari, Rarasmaya Indraswari, Rarasmaya Irna Dwi Anggraeni, Irna Dwi Jayanti Yusmah Sari, Jayanti Yusmah Kartika, Dhian Khadijah F. Hayati Khadijah Fahmi Hayati Holle, Khadijah Fahmi Hayati Khairiyyah Nur Aisyah, Khairiyyah Nur Khoirul Umam Laili Cahyani Lailly S. Qolby, Lailly S. Lukman Hakim Lutfiani Ratna Dewi, Lutfiani Ratna M. Ali Fauzi, M. Ali Mamluatul Hani’ah, Mamluatul Manek, Siprianus Septian Maryamah Maryamah Maulana, Hendra Meidyani, Biandina Moch Zawaruddin Abdullah, Moch Zawaruddin Moh. Zikky, Moh. Mohammad Fatoni Anggris, Mohammad Fatoni Muhamad Nasir, Muhamad Muhammad Imron Rosadi Munjiah Nur Saadah Musa, Saiful Bahri Mutmainnah Muchtar, Mutmainnah Muttaqi, Muhammad Mirza Nanang Fakhrur Rozi Naser Jawas, Naser Nova Hadi Lestriandoko Nur, Nahya Nurilham, Adhi Parwita, Mika Pasnur Pasnur Prayitno Rozi, Ismail Eko Priyatno, Arif Mudi Puji Budi Setia Asih, Puji Budi Puspaningrum, Alifia Puspaningrum, Alifia Putra, Fatra Nonggala Putriwijaya, Novi Nur Putu Praba Santika Qolby, Lailly Qomariah, Dinial Utami Nurul Rahayu, Putri Nur Randy Cahya Wihandika, Randy Cahya Ratri Enggar Pawening, Ratri Enggar Resti Ludviani Rigga Widar Atmagi Riyanarto Sarno Riza, Ozzy Secio Rizka Wakhidatus Sholikah, Rizka Wakhidatus Ryfial Azhar, Ryfial Saprina Mamase, Saprina Setyawan, Dimas Ari Sholikah, Rizka Siti Mutrofin Subali, Made Agus Putra Sugiyanto Sugiyanto Syuhada, Fahmi Takashi Nakamoto, Takashi Tanuwijaya, Evan Tesa Eranti Putri Tuwohingide, Desmin Umi Salamah Verdianto, Satrio Waluya, Onny Kartika Wanvy Arifha Saputra, Wanvy Arifha Wardhana, Septiyawan R. Wattiheluw, Fadli Husein Wawan Gunawan Wijayanti Nurul Khotimah Wiwik Dyah Septiana Kurniati Yudhi Diputra Yufis Azhar Yuita Arum Sari Yunianto, Dika R. Zainal Abidin Zarkasi, Mohammad