No image available for this title

Text

Penerapan Principal Component Analysis (PCA) Untuk Reduksi Dimensi Pada Proses Clustering Data Produksi Pertanian Di Kabupaten Bojonegoro



Dalam penelitian, data harus melalui proses pengolahan agar dapat digunakan dalam penelitian tersebut. Data yang digunakan haruslah valid untuk dapat menghasilkan solusi yang tepat guna. Pengolahan data dalam jumlah besar secara manual berpeluang menghasilkan banyak kesalahan. Untuk itu diperlukan pendekatan teknologi untuk dapat meminimalisir kesalahan yang dapat terjadi. Data mining merupakan suatu proses pengekstrakan informasi dari kumpulan data yang besar. Proses ini bertujuan untuk mendapatkan intisari dari kumpulan data tersebut. Proses data mining dapat menghasilkan menghasilkan informasi penting berupa klasifikasi (classification), pengelompokan (clustering), bahkan prediksi (prediction). Clustering merupakan suatu proses analisis data untuk membentuk sekelompok objek berdasarkan sifat dan cirinya sehingga terbentuk suatu kelompok yang bersifat homogen antar anggota pada kelompok yang sama. Namun, beberapa algoritma clustering menemui masalah ketika dihadapkan pada data dengan dimensi tinggi, termasuk juga KMeans. Reduksi dimensi dapat dijadikan sebagai salah satu langkap optimasi algoritma clustering. Proses reduksi dimensi yang umumnya diterapkan pada tahap pre-processing data bertujuan untuk mengurangi jumlah fitur (dimensi) tanpa menghilangkan informasi penting dari suatudata. Metode PCA akan membentuk sekumpulan dimensi baru yang kemudian di ranking berdasarkan varian datanya, sehingga tercipta kumpulan data dengan fitur yang lebih sederhana. Penelitian ini akan menguji kinerja PCA sebagai salah satu metode optimasi algoritma clustering K-Means yang diterapkan pada data pertanian Kab. Bojonegoro pada tahun 2017 hingga 2020. Dataset hasil clustering yang didapatkan dari situs BPS akan dibandingkan dengan dataset dari sumber yang sama namun telah mengalami proses reduksi dimensi menjadi 1 PC, 2 PC, dan 3 PC. Evaluasi data hasil clustering menggunakan nilai DB Index menunjukkan nilai paling optimal pada dataset yang direduksi menjadi 1 PC dan dibentuk menjadi 3 klaster, yaitu 0.4072. sedangkan dengan jumlah klaster yang sama, dataset dengan 2PC menghasilkan nilai DB Index 0.6168, dataset dengan 3 PC menghasilkan nilai 0.6598, dan dataset tanpa proses reduksi dimensi menghasilkan nilai DB Index 0.4598.


Availability

No copy data


Detail Information

Series Title
-
Call Number
-
Publisher Journal Information Engineering and Educational Technology : Indonesia.,
Collation
005.3
Language
Indonesia
ISBN/ISSN
2549-869X
Classification
NONE
Content Type
-
Media Type
-
Carrier Type
-
Edition
-
Subject(s)
Specific Detail Info
-
Statement of Responsibility

Other Information

Accreditation
-

Other version/related

No other version available


File Attachment



Information


Web Online Public Access Catalog - Use the search options to find documents quickly