TEXT MINING DAN KLASTERISASI DOKUMEN SURAT PEMERINTAHAN KONSEP, METODE, DAN IMPLEMENTASI
Puji syukur ke hadirat Tuhan Yang Maha Esa atas rahmat dan karunia-Nya sehingga penulis dapat menyelesaikan naskah berjudul “Text Mining dan Klasterisasi Dokumen Surat Pemerintahan: Konsep, Metode, dan Implementasi”. Penyusunan karya ini dilatarbelakangi oleh kebutuhan akan inovasi dalam pengelolaan dokumen pemerintahan yang semakin kompleks, khususnya dalam era digitalisasi administrasi publik. Volume surat masuk dan surat keluar yang terus meningkat menuntut penerapan teknologi analisis teks yang mampu melakukan ekstraksi informasi, pengelompokan otomatis, serta penyajian data secara lebih efisien. Buku ini dirancang untuk memberikan pemahaman komprehensif mengenai dasar teori text mining, teknik pra-proses teks, metode ekstraksi fitur, serta pendekatan klasterisasi yang relevan untuk dokumen pemerintahan. Selain itu, naskah ini juga menyertakan implementasi langsung menggunakan teknik modern seperti TF-IDF dan embedding berbasis transformer (IndoBERT), sehingga dapat menjadi referensi praktis bagi akademisi, peneliti, mahasiswa, dan praktisi di lingkungan instansi pemerintah.
Sinopsis
Buku ini disusun untuk memberikan pemahaman komprehensif mengenai penerapan text mining dan teknik klasterisasi dalam konteks pengelolaan dokumen surat pemerintahan. Seiring meningkatnya aktivitas administrasi publik dan digitalisasi birokrasi, instansi pemerintah menghadapi volume dokumen yang semakin besar, beragam, dan kompleks. Pengelompokan manual tidak lagi efisien, sehingga diperlukan pendekatan otomatis yang mampu mengekstraksi informasi, memahami struktur teks, dan mengelompokkan surat berdasarkan kemiripan konten.