Alhamdulillah Sangat bermanfaat videonya, sangat membantu saya untuk presentasi materi tentang Clusterisasi dengan perolehan nilai terbaik. Terimakasih kak
Assalamualaikum pak, luar biasa banget cuma di channel ini saya bisa mengerti semua materi machine learning dan AI yang disampaikan pada video2 bapak. Dari logika algoritma machine learning itu sendiri. Jadi tau perbedaan dari mana perhitungannya dan buat apa peruntukannya. Meskipun di vidio ini agak bingung karena dari video sebelumnya yang ke-3 tiba2 sekarang loncat ke-7 hehe 🙏 .. Mungkin bisa request pak untuk algoritma Regresi khususnya Regresi linear, SVM, atau juga ANN hehe. Terima kasih banyak pak, semoga lancar rezeki dan sehat selalu 🙏
Alhamdulillaah, terima kasih banyak atas support dan feedback positifnya. Iya, mohon maaf, itu mmg terpaksa dilompat seri videonya, karena harus nyesuaikan dengan materi kuliah di kampus, hehe. Oya, untuk ANN bisa ditonton di sini: ruclips.net/video/O-tfsQPI3RE/видео.html
Superb penjelasannya, cukup detail dan mudah dipahami. Terima kasih Banyak Pak, semoga terus menghasilkan video-video pembelajaran yang berkualitas. auto subscribe!
Terima kasih ilmunya pak, sangat bermanfaat dan mudah dimengerti. Saya sudah lulus kuliah, tapi masih mengeksplor banyak hal yang ingin saya tekuni, seperti machine learning ini.
Pak ini apa gaada part 2 nya?? pliss setelah menjelajahi konten youtube terkait materi ini, video ini saja yang mudah dipahami dan penyampaiannya sangat jelas. tampilan videonya juga sangat bagus jadi saat ditonton sangat memanjakan mata dan nyaman untuk dipelajarii. Saya rasa durasi 44 menit untuk materi clustering ini masih sangat kuraangg pakk. Mungkin bisa dishare juga tutorial tanpa menggunakan tools rapidminer melainkan menggunakan baris code program di google collab hehehe. pliss pak buatin videonyaaaa. bintang 5 untuk videonyaa⭐⭐⭐⭐⭐
Alhamdulillaah jika videonya bermanfaat.. terus terang saya belum sempat upload video baru lagi. Sejak WFH selesai, sulit mencari waktu khusus untuk buat slide, rekaman, dan editing video.. tapi mudah2an saya bisa upload video terbaru lagi sesegera mungkin ya.. :)
Assalamualaikum pak.... sebelumnya terimakasih u/ video2 yg sdh dishre selama ini, sangat membantu sekali. terkait dengan Klasterisasi mungkin bs ditambahkan metode FSC (Fuzzy substractive cluster), bagaimanan membentuk klaster dengan metode tersebut. trimakasih sebelumnya
Assalamualaikum pak izin bertanya, kenapa ya pada example set saya tidak ada pilihan visualization-nya? Sebelumnya sih ada, cuman sekarang jadi tidak ada.. mohon bantuannya 🙏🏽
Wa'alaikumussalaam. Wah ini sulit saya ngeceknya. Apakah prosesnya sudah dijalankan? apakah example setnya dilihat di dalam tab 'Result'? seharusnya example set selalu bisa divisualisasikan lewat menu di sidebar kiri.
@@dwinaretno8125 nah, kayanya kalau warna itu ada settingan lanjutan, masih di bagian menu visualization itu, coba diexplore ya. Saya belum pernah juga mengubah warna klaster secara kustom
Assalamu'alaikum pak. Apakah ada media lain untuk bisa tanya-tanya dengan bapak selain di komen yt ini pak. Soal ny pertanyaan saya terkait penelitian saya yg kebetulan menggunakan k-means.
videonya bagus banget, Pak yg menurut saya perlu diperdalam dari penyajiannya adalah bagaimana pemaknaan terhadap clustering data tersebut. Misalnya, dengan cluster 0 itu, trus apa dan bagaimana kesimpulannya? misalnya bagi pengguna facebook. Terima kasih
Pelatihan yang pakai Rapidminer cukup jarang sebenarnya. Tapi Brainmatics setau saya ada pelatihan terkait Data Mining dengan Rapidminer dan KNime. Coba cek: brainmatics.com/
Kalau misl analisis data daerah rawan kriminal menggunakan kmeans itu berarti klaster nya cukup jenis kasus yang terjadi sm daerah mana saja enggk klaster ny
untuk proses training/ development, data baru bisa kita ambil dari 20% atau 30% dari total data yang kita punya. Biasanya 70% data kita pakai untuk training, 30% nya untuk testing (dianggap sebagai data baru yang belum dipelajari oleh algoritma)
terima kasih pak atas sharing ilmunya.. Mohon pencerahan, jika yang ingin kita clustering dalam bentuk teks, apakah k-means ini bisa digunakan ya? ataukah ada algoritma lain yang lebih pas?
Iya nih, mohon maaf.. lagi banyak kerjaan di kampus, jadi belum sempat update konten lagi.. Rencananya awal tahun ini lanjut lagi nerusin konten2 yang belum selesai. BTW, makasih yaa atensinya :)
Izin bertanya Pak, bagaimana melihat nilai statistik (correctly classified instance, ROC area dll) untuk pengolahan menggunakan rapidminer? di sebelah mana ya menu itu?
Permisi pak mau tanya bagaimana cara penerapan algoritma K-means untuk analisis nilai siswa berdasarkan nilai pengetahuan dan keterampilan. Karena sy masih kurang paham pak 🙏
Wa'alaikumussalaam. Klasterisasi itu adalah teknik untuk mengelompokkan data sesuai kemiripan atributnya. Algoritmanya salah satunya bisa pakai K-Means. K-Means itu sendiri adalah algoritma yang memakai prinsip centroid-based algorithm.
Wa'alaikumussalaam. Mohon maaf, playlist ini memang kemarin terpaksa lompat ke nomor 7 karena menyesuaikan dengan perkuliahan di kampus. Materi ke-4 belum sempat saya buat 😅🙏
Deep Learning seperti CNN dan LSTM bisa dipakai di Rapidminer, tapi kita perlu install dulu extensionnya. Silakan dicek di menu Extension, dan nanti ketik saja keyword 'deep learning' atau 'cnn'. terima kasih juga untuk supportnya
Terima kasih pak, mudah dipahami penjelasannya. Izin bertanya pak, untuk klasterisasi titik koordinat dengan parameter longitude dan latitude apa bisa diolah langsung dengan rapidminer?
Dicek dulu tipe data yang string itu apakah "text" ataukah "nominal". Jika dia tipenya masih "text", maka gunakan operator "Text to nominal" lalu sambungkan ke operator "nominal to numerical". Jika datanya bertipe "nominal", maka langsung saja gunakan operator "nominal to numerical"
Permisi pak perbedaan algoritma k means dan xmeans apa ya minim sekwli tutor algoritma x means dan saya harap dibuatkan videonya tentang algortima x means
x-means itu pengembangan dari k-means. pada k-means, jumlah klaster harus ditentukan secara manual, tetapi pada x-means hal ini bisa dilakukan secara otomatis.
@@halikkukami9171 ngga begitu, algoritma x means tetap menggunakan euclidean distance untuk mengukur jarak data. Maksudnya otomatis itu begini, si user nggak perlu input jumlah klaster yang mau dibuat, tapi si x means itu sendiri yang akan menentukan berapa klaster yang terbentuk. Dia ada mekanismenya sendiri
Wah, pastikan operatornya ga keliru ya. Sebenernya tanda minus itu bisa diabaikan saja, nanti kita hapus manual juga gpp. Karena pake maximize itu cuma untuk ngilangin minusnya saja
assalamualaikum pak.. Izin bertanya untuk pengelompokan data barang lebih bagus pakai claustering atau klasifikasi .? Kalau claustering knp ? Dan kalau klasifikasi kenapa ?
Mau nanya pak, kalo misal emang mau bagi data jadi 2 cluster misalkan mau clustering data penduduk menjadi 2 cluster miskin dan tidak miskin, itu bagaimana pak?🙏
Kalau kriteria miskin dan tidak miskin itu sudah ada aturannya secara jelas, sebaiknya ditentukan secara manual atau by rule (IF-THEN). Tapi jika tidak, bisa menggunakan K-Means dengan k=2. Tapi nanti hasil klasterisasi harus dicek manual kira2 data penduduk miskin dan tidak miskin tersebut valid atau tidak berdasarkan atribut yang dipakai
banyak sebetulnya. pengelompokan customer, nasabah bank, pengelompokan artikel, dll. Sebenarnya ketika ingin mencari topik, sebaiknya baca referensi dari artikel jurnal terlebih dahulu, dari situ kita bisa menemukan celah/ ide yang bisa dikerjakan berdasarkan masalah yang masih tertinggal dari artikel tersebut. Dataset yang tidak memiliki label, itu bisa dijadikan untuk bahan klasterisasi. CMIIW
sulit dan kompleks, tapi bisa dilakukan. Jika untuk simulasi, bisa dibuatkan dalam beberapa iterasi saja. Konsep dasarnya sudah saya jelaskan di dalam video. Intinya adalah melakukan pengukuran jarak tiap ke pusat centroid yang kita inisialisasi. Rumus2 di excel sudah support untuk perhitungan matematikanya
Halo Pak Fahri, saat ini saya sedang melakukan ta Pak, saya ingin bertanya seputar seleksi fitur dalam klasifikasi sentimen (nb), lebih tepatnya seleksi fitur dengan information gain, yg saya sudah saya ketahui, ig ini menghilangkan fitur/atribut yg kurang informatif/relevan dengan treeshold tertentu yg ditetapkan sehingga meningkatkan nilai akurasi, namun itu secara garis besarnya saja, untuk lebih detailnya bagaimana yaa pak? Bagaimana ig dapat meningkatkan akurasi klasifikasinya, bisa tolong diberikan penjelasan Pak? Terima Kasih
Jadi gini, information gain itu kan gunanya untuk menunjukkan seberapa besar pengaruh suatu atribut terhadap label atau hasil klasifikasinya. Semakin besar nilai IG, maka semakin penting atribut tersebut, dan begitu pula sebaliknya. Jadi atribut yang nilai IG nya kecil, bisa kita buang. Sebetulnya, hal ini bisa dilakukan dengan melakukan teknik pruning (pemangkasan cabang) di decision tree, dan itu sudah disediakan oleh rapidminer.
Pak kalo nama kecamatan / kabupaten kan tipe nya polynominal jadi di performance nya ga ke detek..biar bisa ke detek selain di matiin ceklis nya bagaimana ya pak..soalnya bagian data nama kecamatan itu di pake untuk penelitian ..terimakasih
@@daye8754 Ooo kalo itu tidak perlu pake algoritma klastering kayak K-Means. cukup pakai analisis deskriptif saja: menghitung jumlah kejadian di tiap kecamatan. pake excel udh bisa itu
Pak mau nanya kalo di table centeroid nya mau nya cuman atribute (nama, alamat, asal sekolah) tapi di aku hasilnya gini ( nama=..... Nama=.... Dst. Terus alamat=..... Alamat=.... Dst dan asal sekolah=.... Asal sekolah=...... Dst) itu gapapa kan?? Atau bakal ngaruh juga ke hasil nya??
Terimakasih pak untuk ilmunya, Mau tanya pak, saya sedang mengerjakan tugas akhir, apakah data gizi yg belum dilabeli bisa digunakan di rapidminer jg ngk pak? TA saya adalah untuk mengklasifikasi status gizi anak pak
Pak izin bertanya di rapidminer apakah bisa setting centroidnya manual atau tidak ya? saya melakukan perbandingan menggunakan perhitungan manual dan rapidminer tetapi hasilnya selalu beda karena centroid saya selalu beda dengan sistem, kira-kira apakah ada cara untuk menyetting manual centroidnya atau ada cara agar kita bisa melihat centroid yg dipilih rapidminernya pak? terima kasih
@@wisnuhartono6416 tidak bisa, rapidminer tidak menyediakan fitur itu, karena memang pada dasar ya K Means itu dimulai dari centroid yang random, jadi mustahil untuk mendapatkan hasil akhir yang sama antara K Means di Rapidminer dengan hitungan manual kita. Prinsipnya gini, kalau perhitungan dan alur kerja kita sudah sesuai dengan algoritma K Means, tidak perlu khawatir, yakin hasilnya benar.
Permisi Bapak. izin bertanya. Apakah bisa cluster digunakan untuk mengelompokkan hasil scoring dari data, contohnya data rawan banjir. C1 (Sangat Rawan) C2(Rawan) Dst?
Kalau sudah ada kelompoknya seperti sangat rawan, rawan, ga perlu klasterisasi lagi, kan sudah terkategori. Kecuali jika belum ada pengelompokannya, baru kita bisa lakukan klasterisasi. CMIIW
terima kasih videonya Pak, saya ingin bertanya lebih lanjut mengenai klastering ini, apakah saya bisa menghubungi Bapak melalui email? terima kasih sebelumnya.
Tercampur bagaimana? klasterisasi tidak melihat label data, dia hanya melihat kemiripan (jarak) antar data, jadi wajar saja jika menggunakan data berlabel, ketika diklaster ternyata ada data dari beberapa kelas yang tercampur dalam satu klaster.
Pak maaf, ini saya mengerjakan untuk laporan ta, kok tampilan di bapak sama di saya beda ya .. di saya views nya cuman design sama result aja. Dan di result tampilannya cumab 3 jenis aja pak. Mohon bantuannya, untuk menambahkan bagaimana ya pak?
Permisi pak. Terimakasih atas ilmunya yang telah diberikan. Saya mempunyai 2 pertanyaan, mohon jawabannya 🙏. 1. Saya mencoba perhitungan manual di excel dan uji coba menggunakan rapid miner, tetapi pada perhitungan kedua software tersebut, kedapatan nilai yg berbeda. Untuk itu kenapa ya pak? 2. Apakah di rapid miner untuk pengambilan centeroid secara acak, apa bisa ditentukan oleh kita pak? Terimakasih pak mohon jawabannya 🙏🙏
1. Iya, besar kemungkinan akan berbeda hasil perhitungan kita dengan rapidminer, karena centroid awal selalu ditentukan secata acak. 2. Sayangnya di rapidminer, kita tidak bisa mengatur nilai centroid awal secara manual 🙂
Permisi pak izin bertanya, jika daya menggunakan k-means kedalam sebuah kasus penyakit disuatu wilayah lalu dihubungkan dengan layanan kesehatan dan pemukiman kumuh apa bisa ya? Semoga dijawab nggih pak😊
Pak jika ingin mengukur jarak data menggunakan euclidean distance antara berapa banyak kasus penyakit dari suatu kecamatan dengan berapa banyak wilayah permukiman kumuh , apa nyambung nggih? Atau ada saran lain dari bapak bagaimana mengaitkan antara kasus penyakit dengan permukiman kumuh? Semoga dibales😭🥰
@@raturaharjo tidak tepat, euclidean distance dipakai untuk mengukur dua data yang memiliki atribut yang sama. Kalau jumlah kasus penyakit dengan jumlah wilayah kumuh itu dua hal yang berbeda. Kalau ini lakukan analisis deskriptif biasa saja pakai average atau sum. tiap wilayah kumuh dihitung berapa jumlah kasus penyakit yang muncul, lalu nanti bisa dilihat jumlah penyakit banyak muncul di wilayah yang karakternya seperti apa.
Hehehe.. mohon maaf ya, belum sempat update lagi playlist Citra Digitalnya 😅 Mudah-mudahan bisa saya update lagi ya.. terima kasih banyak atas supportnya
data baru berasal dari data yang tidak digunakan pada proses klasterisasi. Jadi gini, kita membangun klaster itu menggunakan data historis (data yang sudah ada), ketika nanti ada data baru, maka data baru itu bisa kita kelompokkan ke klaster yang sudah ada. Kalau bingung, bayangin aja seperti swalayan. Petugas swalayan pasti menempatkan produk2 sesuai dengan jenisnya (klaster), misalnya makanan ringan, minuman, bumbu dapur, dll. Ketika nanti ada produk baru yang masuk swalayan itu, petugas tau harus meletakkan produk tersebut di mana, sesuai dengan jenisnya (klasternya).
Assalamualaikum Pak izin bertanya, bagaimana kalau hasil klasteringya ternyata tidak memiliki perbedaan antarklasternya Pak, apakah ada yang salah dengan prosesnya atau data saya yang bermasalah ya Pak?
Kalau datanya dari kuisoner pak kan udh number tuh, nah dijadiin puas atau tidaknya bagaiamana tuh pak? Terus baru dah dibuat k-means nya soalnya saya liat jurnal puas 7 tidak puasnya 3 wkwkwk saya bingung
Kita harus buat ketentuan sendiri, batas nilai puas dan tidak puas itu berapa, baru setelah itu kita bisa konversi numeriknya ke dalam 2 kategori "puas" dan "tidak puas"
@@KuliahInformatika manual berati yah pak, tolong buatin vidionya dong pak saya penasaran hbis liat jurnal org katanya kuisoner tadi saya buat, saya jawab sndiri dgn total 7 pertnyaan dengan skala likert 1-4 , nah saya bisanya ubah manual pakai rumus countif= 4,3,2,1 ada berapa, terus jumlahin hasil 4 dan 3, 2 dan 1 baru dah jadi kyk dijurnal 😭😭, tapi kadang nggk mau kebaca di rapidminer disitu saya stck krn apa🤣🤣🙏
Assalamu'alaikum pak, izin bertanya pak. Kalau untuk data perilaku belajar siswa dengan atribut tertentu seperti nilai akademik, non akademik, ekonomi dll. Apakah bisa di klaster pak? Terima kasih, klasternya berdasarkan perilaku(sangat baik, baik, biasa, tidak baik, sangat tidak baik) apakah bisa seperti itu pak?
Pak, izin bertanya ini kan kita melihat jarak data dengan euclidian distance which mean kalau kita melakukan one hot encoding or changing our categorical data to binary 0 and 1 ini kurang recommended pakai K-mean ? dan kalau range data A dan B ini terlalu beda memang perlu di standart dlu kah ? semisal range data 1 itu 1-10 dan range data 2 itu 1000 - 1000.000 ?
Pertanyaannya bagus sekali mbak 😁 Euclidean distance bisa dipakai utk data numerik maupun kategorik, termasuk binary seperti one hot encoding. Yup, betul mbak, jika antar atribut itu rentang nilainya timpang, skalanya berbeda jauh, sebaiknya data kita normalisasi dahulu sebelum melakukan klastering.
Aslmkum pak..izin tanya...perhitungan clustering manual di excel dengan aplikasi rapid miner hasilnya ko bisa berbeda ya pak,apakah ada salah hitung atau gimana ya..terima kasih
ya, parti berbeda. karena di awal penentuan lokasi centroid itu menggunakan nilai acak. Nilai acak di rapidminer dan yang Anda pakai sudah pasti berbeda, maka hasil akhirpun akan berbeda
setiap data kan punya nilai x dan y. untuk menghitung rata2 x: jumlahkan semua nilai x dari data di dalam klaster tersebut, lalu dibagi dengan jumlah data di klaster itu. menghitung rata2 y juga seperti itu.
@@KuliahInformatika brrti operator Optimize Weight (PSO) yg ada di rapid miner itu hanya bisa bekerja untuk algoritma yg memakai label seperti c4.5 atau knn ya pak? Terima kasih sebelumnya atas jawabnnya pak🙏
@@lokap4903 bukan. Optimize Weight (PSO) itu operator untuk pembobotan feature/ atribut. Bukan untuk optimasi parameter dan hanya bisa dipakai pada supervised learning (klasifikasi atau regresi)
@@KuliahInformatika oo gtu.... Mau nanyak lagi pak😁🙏 .... Ada gak aplikasi atau tool atau sejenisnya saat ini.... untuk melakukan pengolahan data dengan k-means berbasis pso ni?
Misi pak ijin bertanya, kebetulan skripsi saya berhubungan dengan metode elbow, apakah bapak bisa membagikan link materi atau jurnal yang terkait? Terima kasih
Satu judul maksudnya gimana? Dijadikan dalam satu topik penelitian ya? Bisa saja. Melakukan klasterisasi untuk melabeli data, lalu membuat model klasifikasinya.
hallo, cara menghapus garis bawah ( _ ) di attribute bagaimana ya pak? yang ditabel atas sendiri, misal asal_kota seperti itu. cara menghilangkannya bagaimana, terimakasih.
Kak kalau misalkan hasil dari pengklusteran nilainya sama bagaimana kak misal data pertama itu bisa masuk C1 dan C2 nah itu gimana kak karena nilainya sama
Jaraknya sama ya maksudnya? Ngga apa2, kita masukkan saja ke salah satu klaster, misalnya kita default dimasukkan ke c1. Nanti kan stlh itu dia akan evaluasi posisi centroidnya lagi.
@@ruditiga454 saya belum nemu landasan teori terkait hal tersebut :) tapi, secara logik saja, ketika suatu data berada pada posisi yang seimbang di antara dua pusat klaster, maka mau tidak mau, dia harus dikategorikan ke dalam salah satu klaster tersebut. CMIIW
Assalamualaikum Pak, izin bertanya pak saya sedang menyusun skripsi text clustering menggunakan k-means dan reduksi dimensi menggunakan SVD di RapidMiner. Kemudian saya ingin menggunakan paramter Local Random Seed dan Determine Good Start Value pada K-Means untuk menunjukan bahwa ada perbedaan nilai DBI yang akan dihasilkan. Namun setelah saya coba inputkan dengan nilai brp pun DBI yang dihasilkan Local Random Seed dan Determine Good Start Value selalu sama. Bagaimana ya Pak itu kenapa bisa atau karena ada pengruh SVD nya Pak?
@Kuliah Informatika saya coba dari rentang 400, 600,800,900, 1000, 1500, 1992, 2500 nilai DBI nya sama semua Pak. Bagaimana ya Pak apa ada kaitannya karena saya menggunakan SVD? karena kalau SVD nya saya hapus jadi hanya kmeans saja dan saya isikan local random seed yang berbeda beda hasil DBI nya berbeda beda pula Pak
Assalamu'alaikum pak fahri Saya afan arifian Mhs Unisnu jepara Thn 2022 yang pernah ikut seminar data analitic Boleh saya minta kontaknya bapak? Karena mau minta masukan buku" Mengenai data mining dll.. Karena buat belajar lagi
Izin bertanya pak Skripsi saya menggunakan klasifikasi C4.5 Saya baca banyk jurnal semua rata rata menggunakan cuma 2 class saja yaitu yes dan no Bagai mana kalo ada 3 pak Kebetulan di kasus saya ada 3 class pak Tolong penjelasan nya pak Terimakasih pak 🙏🙏
Assalamu'alaikum pak berarti k-means itu bukan metode klasifikasi tapi klusterisasi?? , kalo Klasifikasi yang udah ada labelnya itu pake metode K-Means atau bukan
@@KuliahInformatika ok pak mkasih. pak mau tanya kalo di contoh perhitungannya, misalkan punya 10 data dan 3 kluster dengan centroid random, dalam euclidean distancenya itu centroid di kurangi dengan jumlah data atau jumlah data dikurangi centroid?? soalnya suka kebalik buat di skripsi
@@febisyarifpermana6226 centroid tidak dikurangi dngn jumlah data. Mungkin maksud Anda adalah mengurangi nilai tiap data dgn centroid. Kalo di euclidean, hasilnya akan sama, centroid dikurangi data atau data dikurangi centroid
Alhamdulillah Sangat bermanfaat videonya, sangat membantu saya untuk presentasi materi tentang Clusterisasi dengan perolehan nilai terbaik. Terimakasih kak
Penjelasan nya mudah dimengerti, membantu saya lancar dalam presentasi
Alhamdulillaah, senang mendengarnya. terima kasih atas supportnya
keren sekali penjelasannya pak, suara dan tata bahasanya jelas juga mudah dipahami
Terima kasih atas apresiasinya 😊🙏
Assalamualaikum pak, luar biasa banget cuma di channel ini saya bisa mengerti semua materi machine learning dan AI yang disampaikan pada video2 bapak. Dari logika algoritma machine learning itu sendiri. Jadi tau perbedaan dari mana perhitungannya dan buat apa peruntukannya. Meskipun di vidio ini agak bingung karena dari video sebelumnya yang ke-3 tiba2 sekarang loncat ke-7 hehe 🙏 .. Mungkin bisa request pak untuk algoritma Regresi khususnya Regresi linear, SVM, atau juga ANN hehe. Terima kasih banyak pak, semoga lancar rezeki dan sehat selalu 🙏
Alhamdulillaah, terima kasih banyak atas support dan feedback positifnya. Iya, mohon maaf, itu mmg terpaksa dilompat seri videonya, karena harus nyesuaikan dengan materi kuliah di kampus, hehe. Oya, untuk ANN bisa ditonton di sini: ruclips.net/video/O-tfsQPI3RE/видео.html
The best pak,makasih banyak penjelasanya mudah dimengerti gak berbelit Belit,lanjutkan pak dan sehat selalu 😁
Siiapp. makasih banyak ya atas dukungannya 😊
Terimakasih informasinya sangat membantu dan izin juga isi materinya saya gunakan juga untuk mengajar
Siap. Terima kasih ya 😊
Superb penjelasannya, cukup detail dan mudah dipahami. Terima kasih Banyak Pak, semoga terus menghasilkan video-video pembelajaran yang berkualitas. auto subscribe!
Terima kasih 😁🙏
terima kasih banyak bapak. sangat membantu ,sehat sehat ya pak
Aamiin.. Terima kasih ya 😊
makasih pak membantu bgtt, sehat selalu yaa pak rajin rajin upload, suda saya like share dan subscribe🥰
saya awalnya bingung, skrg mulai tercerahkan
Alhamdulillaah.. senang membacanya.. semoga bermanfaat yaa
Terima kasih ilmunya pak, sangat bermanfaat dan mudah dimengerti. Saya sudah lulus kuliah, tapi masih mengeksplor banyak hal yang ingin saya tekuni, seperti machine learning ini.
Siap.. semoga sukses ya
aamiin...@@KuliahInformatika
Pak ini apa gaada part 2 nya?? pliss setelah menjelajahi konten youtube terkait materi ini, video ini saja yang mudah dipahami dan penyampaiannya sangat jelas. tampilan videonya juga sangat bagus jadi saat ditonton sangat memanjakan mata dan nyaman untuk dipelajarii. Saya rasa durasi 44 menit untuk materi clustering ini masih sangat kuraangg pakk. Mungkin bisa dishare juga tutorial tanpa menggunakan tools rapidminer melainkan menggunakan baris code program di google collab hehehe. pliss pak buatin videonyaaaa. bintang 5 untuk videonyaa⭐⭐⭐⭐⭐
Alhamdulillaah jika videonya bermanfaat.. terus terang saya belum sempat upload video baru lagi. Sejak WFH selesai, sulit mencari waktu khusus untuk buat slide, rekaman, dan editing video.. tapi mudah2an saya bisa upload video terbaru lagi sesegera mungkin ya.. :)
@@KuliahInformatika Semangat Pak
makasi pa sudah membantu saya dalam mengerjakan tugas akhir D3 pa sehat sehat nggih pa
Alhamdulilllaah, sukses ya
Terima kasih pak, sangat membantu untuk tugas saya
MasyaAlloh keren pak
Terima kasih mas atas dukungannya
Sangat membantu, trimakasih pak
makasih ya
Terima kasih pak ilmunya. Sangat bermanfaaat
terima kasih kembali atas supportnya 😄
Mantap kontennya pak, mohon diteruskan konten ini pak
Semoga bermanfaat untuk mahasiswa" seperti kami
Siap. Terima kasih supportnya ya 😉👌
Terima kasih banyak pak untuk vidionya 🙏🏻
Terima kasih juga sudah berkunjung
kerenn pak, makasihh ilmunyaa
Alhamdulillaah, semoga bermanfaat.
Assalamualaikum pak.... sebelumnya terimakasih u/ video2 yg sdh dishre selama ini, sangat membantu sekali. terkait dengan Klasterisasi mungkin bs ditambahkan metode FSC (Fuzzy substractive cluster), bagaimanan membentuk klaster dengan metode tersebut. trimakasih sebelumnya
Terima kasih atas support dan masukannya. Kebetulan saya belum pernah mempelajari tentang metode FSC tersebut 😁🙏
Alhamdulillah sangat bermanfaat Mas,
request clustering K-Means pake model RFM mas
terima kasih atas supportnya 😊
Terimakasih 🙏🙏
Sama2 😁🙏
40:31 menentukan 6 atau 7 kali itu berdasarkan apa ya pak, soalnya saya ditanya itu sama dose. Mohon jawabannya?
Tidak ada landasan baku. Kalau bisa lebih dari 7 kali lebih baik.
Hallo pak apakah sudah tidak upload lagi ?
Doakan yaa.. saya sedang menyusun plan untuk mengembangkan konten channel ini lagi..
ada video khusus bagian Hierarchical clustering gak pak?
Mohon maaf, belum ada
Mantap apk penjelasanya, request tutorial algoritma svm dong pak
Terima kasih apresiasinya.. sarannya ditampung dulu yak, hehe
Assalamualaikum pak izin bertanya, kenapa ya pada example set saya tidak ada pilihan visualization-nya? Sebelumnya sih ada, cuman sekarang jadi tidak ada.. mohon bantuannya 🙏🏽
Wa'alaikumussalaam. Wah ini sulit saya ngeceknya. Apakah prosesnya sudah dijalankan? apakah example setnya dilihat di dalam tab 'Result'? seharusnya example set selalu bisa divisualisasikan lewat menu di sidebar kiri.
@@KuliahInformatika siap pak sudah muncul setelah ikut step by step, kalau untuk mengubah warna-warna pada tiap cluster bagaimana ya?
@@dwinaretno8125 nah, kayanya kalau warna itu ada settingan lanjutan, masih di bagian menu visualization itu, coba diexplore ya. Saya belum pernah juga mengubah warna klaster secara kustom
Untuk part 6,5,4 nya belum ada ya pak, jujur ini membantu sekali
wahhh,, baru tau kl UTY juga ternyata. Halo kak salam kenal
Salam kenal juga 😊
Izin menyimak dengan seksama Pak Dosen :)
Hahaha... ada bang sahrul ternyata. Gimana kabar rul? 😁
@@KuliahInformatika alhamdulillah sehat Mas. Saya sedang nyusun thesis, ternyata nemu chanel ini bahan bagus hehe..
@@sahrulmulia4775 alhamdulillaah.. makasih bang sahrul 😁
Assalamu'alaikum pak. Apakah ada media lain untuk bisa tanya-tanya dengan bapak selain di komen yt ini pak. Soal ny pertanyaan saya terkait penelitian saya yg kebetulan menggunakan k-means.
Boleh via email ke muhammad.fachrie@staff.uty.ac.id
mantap gan
luar biasa keren pak, btw mana ya pak seri 4-6 machine learning??:)) soalnya paham bgt klo nonton video dari bapak😢
Hehehe... saya belum sempat update konten lagi.. mohon doanya ya, karena harus meluangkan waktu betul untuk membuat 1 video
videonya bagus banget, Pak
yg menurut saya perlu diperdalam dari penyajiannya adalah bagaimana pemaknaan terhadap clustering data tersebut.
Misalnya, dengan cluster 0 itu, trus apa dan bagaimana kesimpulannya? misalnya bagi pengguna facebook.
Terima kasih
Waah, terima kasih banyak masukannya.. Iya, masih perlu memperdalam materi lagi, hehe
Tq mas, apa ada pelatihan khususnya terkait penggunaan rapidminer atau knime dalam data analysis
Pelatihan yang pakai Rapidminer cukup jarang sebenarnya. Tapi Brainmatics setau saya ada pelatihan terkait Data Mining dengan Rapidminer dan KNime. Coba cek: brainmatics.com/
Kalau misl analisis data daerah rawan kriminal menggunakan kmeans itu berarti klaster nya cukup jenis kasus yang terjadi sm daerah mana saja enggk klaster ny
maas mau nanya bisa ga kita gunakan metode ini untuk mencegah pembusukanbuah pada umkm?
nice
mohon maaf pak, ini untuk dapetin data baru untuk patokan perhitungan Distance Euclidean nya gimana ya?
untuk proses training/ development, data baru bisa kita ambil dari 20% atau 30% dari total data yang kita punya. Biasanya 70% data kita pakai untuk training, 30% nya untuk testing (dianggap sebagai data baru yang belum dipelajari oleh algoritma)
terima kasih pak atas sharing ilmunya.. Mohon pencerahan, jika yang ingin kita clustering dalam bentuk teks, apakah k-means ini bisa digunakan ya? ataukah ada algoritma lain yang lebih pas?
Iya, K Means bisa digunakan, asalkan data teks sudah diproses dan dikonversi menjadi ciri/ features, misalnya menggunakan tf-idf
Pak kok gak update lagi tentang AI
Iya nih, mohon maaf.. lagi banyak kerjaan di kampus, jadi belum sempat update konten lagi.. Rencananya awal tahun ini lanjut lagi nerusin konten2 yang belum selesai. BTW, makasih yaa atensinya :)
Izin bertanya Pak, bagaimana melihat nilai statistik (correctly classified instance, ROC area dll) untuk pengolahan menggunakan rapidminer? di sebelah mana ya menu itu?
kita pakai operator "Performance (Classification)", nanti operator "Apply Model" dikoneksikan ke situ.
Permisi pak mau tanya bagaimana cara penerapan algoritma K-means untuk analisis nilai siswa berdasarkan nilai pengetahuan dan keterampilan.
Karena sy masih kurang paham pak 🙏
caranya sama saja dengan di video, hanya saja datanya mengandung atribut nilai pengetahuan dan nilai keterampilan. Prosedur hitung2annya sama saja.
Assalamu'alaikum. ijin bertanya, apa hubungan antara klasterisasi, K-Means dan metode centroid based algorithm ?
Wa'alaikumussalaam. Klasterisasi itu adalah teknik untuk mengelompokkan data sesuai kemiripan atributnya. Algoritmanya salah satunya bisa pakai K-Means. K-Means itu sendiri adalah algoritma yang memakai prinsip centroid-based algorithm.
Salam pak, bagus video2 nya. Bagaimana boleh hubungi pak menerusi emel ya?
Terima kasih. Kontak via email bisa ke muhammad.fachrie@staff.uty.ac.id
Tq
Assalamu'alaykum Pak, Part #4 bisa disimak dimana njih pak?
Wa'alaikumussalaam. Mohon maaf, playlist ini memang kemarin terpaksa lompat ke nomor 7 karena menyesuaikan dengan perkuliahan di kampus. Materi ke-4 belum sempat saya buat 😅🙏
terima kasih pak, apakah algoritma deep learning seperti cnn lstm bisa di gunakana aplikasi rapidminer ini.? terima kasih
Deep Learning seperti CNN dan LSTM bisa dipakai di Rapidminer, tapi kita perlu install dulu extensionnya. Silakan dicek di menu Extension, dan nanti ketik saja keyword 'deep learning' atau 'cnn'. terima kasih juga untuk supportnya
Terima kasih pak, mudah dipahami penjelasannya. Izin bertanya pak, untuk klasterisasi titik koordinat dengan parameter longitude dan latitude apa bisa diolah langsung dengan rapidminer?
saya belum pernah coba, tapi harusnya bisa. Dicoba saja.
Assalamualaikum pak izi bertanya. Kalau kita mau ubah record dari string ke integer gimana ya pak trus datanya juga cukup banyak
Dicek dulu tipe data yang string itu apakah "text" ataukah "nominal". Jika dia tipenya masih "text", maka gunakan operator "Text to nominal" lalu sambungkan ke operator "nominal to numerical". Jika datanya bertipe "nominal", maka langsung saja gunakan operator "nominal to numerical"
Mohon maaf bapak izin bertanya untuk ubah polinomial ke numerical bagaimana ya pak?
Pakai operator nominal to numeric
Selamat pagi pak numpang tanya apakah rapidMiner bisa untuk digunakan mengukur efektivitas misalnya efektivitas program penanggulangan kemiskinan ?
Efektivitas itu harus dibreakdown lagi lebih rinci apa kriterianya, diarahkan ke salah satu dari proses ini: klasifikasi, regresi, atau klasterisasi
Pak kalau data katagorik apakah bisa menggunakan k-means? Saya membaca beberapa sumber cocoknya k-medoids
K-Means hanya untuk data numerik
@@KuliahInformatika meskpiun kita pakai operator nominal to numerical apakah ttp tdk cocok Pak?
@@diliaaaa93 bisa.
@@KuliahInformatikajika data saya kategorik yang saya transformasikan ke numerik maka measure types nya lebih baik apa ya Pak?
izin tanya pak dan teman teman. tabel baru / hitam itu didapatkan darimana ya?
data baru. data yang memang belum ada di database kita sebelumnya, dan ingin kita kelompokkan ke dalam salah satu klaster.
Permisi pak perbedaan algoritma k means dan xmeans apa ya minim sekwli tutor algoritma x means dan saya harap dibuatkan videonya tentang algortima x means
x-means itu pengembangan dari k-means. pada k-means, jumlah klaster harus ditentukan secara manual, tetapi pada x-means hal ini bisa dilakukan secara otomatis.
@@KuliahInformatika berarti gak perlu rumus euclidian kah om langsung olah data di rapidminner aja? Kalo x means
@@halikkukami9171 ngga begitu, algoritma x means tetap menggunakan euclidean distance untuk mengukur jarak data. Maksudnya otomatis itu begini, si user nggak perlu input jumlah klaster yang mau dibuat, tapi si x means itu sendiri yang akan menentukan berapa klaster yang terbentuk. Dia ada mekanismenya sendiri
@@KuliahInformatika baik terima kasih om setelah saya pahami berarti xmeans lebih sederhana caranya ketimbang kmeans
Terima kasih atas responnya om semoga sukses selalu
pak, untuk melihat jumlah iterasi tiap percobaan itu dimana ?
sepertinya tidak ada fitur untuk itu
punya saya performa nya jua ada tanda - tp pas saya pencet performa nya ngga muncul tulisan maximize nya. gimna tu bg
Wah, pastikan operatornya ga keliru ya. Sebenernya tanda minus itu bisa diabaikan saja, nanti kita hapus manual juga gpp. Karena pake maximize itu cuma untuk ngilangin minusnya saja
assalamualaikum pak..
Izin bertanya untuk pengelompokan data barang lebih bagus pakai claustering atau klasifikasi .?
Kalau claustering knp ?
Dan kalau klasifikasi kenapa ?
datanya seperti apa? apakah sudah ada label/ kategorinya atau belum? kalau sudah ada labelnya, pakai klasifikasi.
Mau nanya pak, kalo misal emang mau bagi data jadi 2 cluster misalkan mau clustering data penduduk menjadi 2 cluster miskin dan tidak miskin, itu bagaimana pak?🙏
Kalau kriteria miskin dan tidak miskin itu sudah ada aturannya secara jelas, sebaiknya ditentukan secara manual atau by rule (IF-THEN). Tapi jika tidak, bisa menggunakan K-Means dengan k=2. Tapi nanti hasil klasterisasi harus dicek manual kira2 data penduduk miskin dan tidak miskin tersebut valid atau tidak berdasarkan atribut yang dipakai
Hallo syalom pak.ijin bertanya topik judul apa yang cocok dengan metode k-means yaa..
banyak sebetulnya. pengelompokan customer, nasabah bank, pengelompokan artikel, dll. Sebenarnya ketika ingin mencari topik, sebaiknya baca referensi dari artikel jurnal terlebih dahulu, dari situ kita bisa menemukan celah/ ide yang bisa dikerjakan berdasarkan masalah yang masih tertinggal dari artikel tersebut. Dataset yang tidak memiliki label, itu bisa dijadikan untuk bahan klasterisasi. CMIIW
mohon maaf pak, bagaimana jika penentuan nilai k optimum secara manual menggunakan excel?
sulit dan kompleks, tapi bisa dilakukan. Jika untuk simulasi, bisa dibuatkan dalam beberapa iterasi saja. Konsep dasarnya sudah saya jelaskan di dalam video. Intinya adalah melakukan pengukuran jarak tiap ke pusat centroid yang kita inisialisasi. Rumus2 di excel sudah support untuk perhitungan matematikanya
Apakah ada contoh video pengerjaannya pak?@@KuliahInformatika
Halo Pak Fahri, saat ini saya sedang melakukan ta Pak, saya ingin bertanya seputar seleksi fitur dalam klasifikasi sentimen (nb), lebih tepatnya seleksi fitur dengan information gain, yg saya sudah saya ketahui, ig ini menghilangkan fitur/atribut yg kurang informatif/relevan dengan treeshold tertentu yg ditetapkan sehingga meningkatkan nilai akurasi, namun itu secara garis besarnya saja, untuk lebih detailnya bagaimana yaa pak? Bagaimana ig dapat meningkatkan akurasi klasifikasinya, bisa tolong diberikan penjelasan Pak? Terima Kasih
Jadi gini, information gain itu kan gunanya untuk menunjukkan seberapa besar pengaruh suatu atribut terhadap label atau hasil klasifikasinya. Semakin besar nilai IG, maka semakin penting atribut tersebut, dan begitu pula sebaliknya. Jadi atribut yang nilai IG nya kecil, bisa kita buang. Sebetulnya, hal ini bisa dilakukan dengan melakukan teknik pruning (pemangkasan cabang) di decision tree, dan itu sudah disediakan oleh rapidminer.
Pak kalo nama kecamatan / kabupaten kan tipe nya polynominal jadi di performance nya ga ke detek..biar bisa ke detek selain di matiin ceklis nya bagaimana ya pak..soalnya bagian data nama kecamatan itu di pake untuk penelitian ..terimakasih
Nama kecamatannya mau dipake sebagai apa?
@@KuliahInformatika buat pemetaan daerah kecamatan yang paling terdampak covid pak
@@daye8754 Ooo kalo itu tidak perlu pake algoritma klastering kayak K-Means. cukup pakai analisis deskriptif saja: menghitung jumlah kejadian di tiap kecamatan. pake excel udh bisa itu
Pak mau nanya kalo di table centeroid nya mau nya cuman atribute (nama, alamat, asal sekolah) tapi di aku hasilnya gini ( nama=..... Nama=.... Dst. Terus alamat=..... Alamat=.... Dst dan asal sekolah=.... Asal sekolah=...... Dst) itu gapapa kan?? Atau bakal ngaruh juga ke hasil nya??
Cara mengetahui validasi dun index dan silhoute coefisen gimana yah pak?
mohon maaf, sejauh ini saya hanya pernah menggunakan elbow method
Terimakasih pak untuk ilmunya,
Mau tanya pak, saya sedang mengerjakan tugas akhir, apakah data gizi yg belum dilabeli bisa digunakan di rapidminer jg ngk pak?
TA saya adalah untuk mengklasifikasi status gizi anak pak
bisa. kita bisa melabelinya dahulu secara manual supaya bisa membangun model klasifikasinya. atau jika tidak, bisa kita klasterisasi langsung
@@KuliahInformatika Baik Pak,, Terimakasih banyak
Pak izin bertanya di rapidminer apakah bisa setting centroidnya manual atau tidak ya? saya melakukan perbandingan menggunakan perhitungan manual dan rapidminer tetapi hasilnya selalu beda karena centroid saya selalu beda dengan sistem, kira-kira apakah ada cara untuk menyetting manual centroidnya atau ada cara agar kita bisa melihat centroid yg dipilih rapidminernya pak? terima kasih
@@wisnuhartono6416 tidak bisa, rapidminer tidak menyediakan fitur itu, karena memang pada dasar ya K Means itu dimulai dari centroid yang random, jadi mustahil untuk mendapatkan hasil akhir yang sama antara K Means di Rapidminer dengan hitungan manual kita. Prinsipnya gini, kalau perhitungan dan alur kerja kita sudah sesuai dengan algoritma K Means, tidak perlu khawatir, yakin hasilnya benar.
@KuliahInformatika ouh baik pak, terima kasih atas jawabannya 🙏
Permisi Bapak. izin bertanya. Apakah bisa cluster digunakan untuk mengelompokkan hasil scoring dari data, contohnya data rawan banjir. C1 (Sangat Rawan) C2(Rawan) Dst?
Kalau sudah ada kelompoknya seperti sangat rawan, rawan, ga perlu klasterisasi lagi, kan sudah terkategori. Kecuali jika belum ada pengelompokannya, baru kita bisa lakukan klasterisasi. CMIIW
terima kasih videonya Pak, saya ingin bertanya lebih lanjut mengenai klastering ini, apakah saya bisa menghubungi Bapak melalui email? terima kasih sebelumnya.
Silakan mbak, email saya: muhammad.fachrie@staff.uty.ac.id
Kak aku punya data excel (.xlsx) brrti harus diganti csv dulu ya sebelum masuk ke rapid?
nggak perlu, rapidminer bisa baca data excel ataupun csv
Kenapa hasil yang saya dapat tidak tercluster dengan baik dan masih ada yang tercampur pak?
Tercampur bagaimana? klasterisasi tidak melihat label data, dia hanya melihat kemiripan (jarak) antar data, jadi wajar saja jika menggunakan data berlabel, ketika diklaster ternyata ada data dari beberapa kelas yang tercampur dalam satu klaster.
mau nanya pak, kalo elbow method denggan nilai SSE paling kecil itu bisa juga kan ya?
Maksudnya gimana ya? Kalau di klastering, kita tidak bisa menghitung nilai error seperti SSE
Pak maaf, ini saya mengerjakan untuk laporan ta, kok tampilan di bapak sama di saya beda ya .. di saya views nya cuman design sama result aja. Dan di result tampilannya cumab 3 jenis aja pak. Mohon bantuannya, untuk menambahkan bagaimana ya pak?
Nggak masalah, saya seperti itu karena menggunakan lisensi education. Result itu tampilannya menyesuaikan dengan apa saja yang kita outputkan.
rapidminer cuma ada untuk windows ya pak?
Halo, maaf baru bisa balas. Rapidminer tersedia untuk windows, linux, dan mac. Silakan cek rapidminer.com
Kalo boleh tau rapidnya versi berapa yaaa
Apakah Untuk menggunakan elbow method versi berapapun bisa
Saya pakai versi lama, 9.10. Elbow method itu saya lakukan di excel, bukan di rapidminer
Permisi pak. Terimakasih atas ilmunya yang telah diberikan. Saya mempunyai 2 pertanyaan, mohon jawabannya 🙏.
1. Saya mencoba perhitungan manual di excel dan uji coba menggunakan rapid miner, tetapi pada perhitungan kedua software tersebut, kedapatan nilai yg berbeda. Untuk itu kenapa ya pak?
2. Apakah di rapid miner untuk pengambilan centeroid secara acak, apa bisa ditentukan oleh kita pak?
Terimakasih pak mohon jawabannya 🙏🙏
1. Iya, besar kemungkinan akan berbeda hasil perhitungan kita dengan rapidminer, karena centroid awal selalu ditentukan secata acak.
2. Sayangnya di rapidminer, kita tidak bisa mengatur nilai centroid awal secara manual 🙂
@@KuliahInformatika terimakasih pak, karna dari konten yg lain hasil perhitungan bisa sama. Itu yg jadi tanda tanya saya hehe
Assalamualaikum pak, mengapa hasil dari cluster di exel dengan hasil cluster di rapidminer bisa tidak sama ya pak?
Wa'alaikumussalaam. Tentu saja akan berbeda, karena titik awal klaster selalu ditentukan secara acak.
Permisi pak izin bertanya, jika daya menggunakan k-means kedalam sebuah kasus penyakit disuatu wilayah lalu dihubungkan dengan layanan kesehatan dan pemukiman kumuh apa bisa ya?
Semoga dijawab nggih pak😊
bisa saja. asalkan tujuan klasterisasinya jelas. Ditentukan dulu latar belakang masalahnya apa, lalu goal apa yang ingin dicapai
Pak jika ingin mengukur jarak data menggunakan euclidean distance antara berapa banyak kasus penyakit dari suatu kecamatan dengan berapa banyak wilayah permukiman kumuh , apa nyambung nggih?
Atau ada saran lain dari bapak bagaimana mengaitkan antara kasus penyakit dengan permukiman kumuh?
Semoga dibales😭🥰
@@raturaharjo tidak tepat, euclidean distance dipakai untuk mengukur dua data yang memiliki atribut yang sama. Kalau jumlah kasus penyakit dengan jumlah wilayah kumuh itu dua hal yang berbeda. Kalau ini lakukan analisis deskriptif biasa saja pakai average atau sum. tiap wilayah kumuh dihitung berapa jumlah kasus penyakit yang muncul, lalu nanti bisa dilihat jumlah penyakit banyak muncul di wilayah yang karakternya seperti apa.
Pak Fahri tolong upload Pengolahan Citra Digital lagi pak.
Hehehe.. mohon maaf ya, belum sempat update lagi playlist Citra Digitalnya 😅
Mudah-mudahan bisa saya update lagi ya.. terima kasih banyak atas supportnya
permisi pak mau tanya data baru ini di dapat darimana ya?
data baru berasal dari data yang tidak digunakan pada proses klasterisasi. Jadi gini, kita membangun klaster itu menggunakan data historis (data yang sudah ada), ketika nanti ada data baru, maka data baru itu bisa kita kelompokkan ke klaster yang sudah ada. Kalau bingung, bayangin aja seperti swalayan. Petugas swalayan pasti menempatkan produk2 sesuai dengan jenisnya (klaster), misalnya makanan ringan, minuman, bumbu dapur, dll. Ketika nanti ada produk baru yang masuk swalayan itu, petugas tau harus meletakkan produk tersebut di mana, sesuai dengan jenisnya (klasternya).
misi kak. kalo misal analisis sentimen twitter utk mencari positif dan negatif itu, apakah cocok menggunakan klusterisasi?
Analisis sentimen lebih tepat masuknya ke ranah klasifikasi, karena dia sudah ada label (positif dan negatif)
Silakan cek di playlist, saya pernah membuat video ttg sentimen analisis dengan Rapidminer
Assalamualaikum Pak izin bertanya, bagaimana kalau hasil klasteringya ternyata tidak memiliki perbedaan antarklasternya Pak, apakah ada yang salah dengan prosesnya atau data saya yang bermasalah ya Pak?
Bisa jadi jumlah klasternya tidak tepat, atau boleh jadi mmg datanya sebarannya mmg seperti itu
Kalau datanya dari kuisoner pak kan udh number tuh, nah dijadiin puas atau tidaknya bagaiamana tuh pak? Terus baru dah dibuat k-means nya soalnya saya liat jurnal puas 7 tidak puasnya 3 wkwkwk saya bingung
Kita harus buat ketentuan sendiri, batas nilai puas dan tidak puas itu berapa, baru setelah itu kita bisa konversi numeriknya ke dalam 2 kategori "puas" dan "tidak puas"
@@KuliahInformatika manual berati yah pak, tolong buatin vidionya dong pak saya penasaran hbis liat jurnal org katanya kuisoner tadi saya buat, saya jawab sndiri dgn total 7 pertnyaan dengan skala likert 1-4 , nah saya bisanya ubah manual pakai rumus countif= 4,3,2,1 ada berapa, terus jumlahin hasil 4 dan 3, 2 dan 1 baru dah jadi kyk dijurnal 😭😭, tapi kadang nggk mau kebaca di rapidminer disitu saya stck krn apa🤣🤣🙏
Assalamu'alaikum pak, izin bertanya pak. Kalau untuk data perilaku belajar siswa dengan atribut tertentu seperti nilai akademik, non akademik, ekonomi dll. Apakah bisa di klaster pak? Terima kasih, klasternya berdasarkan perilaku(sangat baik, baik, biasa, tidak baik, sangat tidak baik) apakah bisa seperti itu pak?
Bisa saja. Tapi kalau sudah ada ketentuan kategorisasinya berdasarkan prilaku, brarti itu ranahnya klasifikasi
Pak, izin bertanya ini kan kita melihat jarak data dengan euclidian distance which mean kalau kita melakukan one hot encoding or changing our categorical data to binary 0 and 1 ini kurang recommended pakai K-mean ? dan kalau range data A dan B ini terlalu beda memang perlu di standart dlu kah ? semisal range data 1 itu 1-10 dan range data 2 itu 1000 - 1000.000 ?
Pertanyaannya bagus sekali mbak 😁
Euclidean distance bisa dipakai utk data numerik maupun kategorik, termasuk binary seperti one hot encoding. Yup, betul mbak, jika antar atribut itu rentang nilainya timpang, skalanya berbeda jauh, sebaiknya data kita normalisasi dahulu sebelum melakukan klastering.
Aslmkum pak..izin tanya...perhitungan clustering manual di excel dengan aplikasi rapid miner hasilnya ko bisa berbeda ya pak,apakah ada salah hitung atau gimana ya..terima kasih
ya, parti berbeda. karena di awal penentuan lokasi centroid itu menggunakan nilai acak. Nilai acak di rapidminer dan yang Anda pakai sudah pasti berbeda, maka hasil akhirpun akan berbeda
@@KuliahInformatika mksih infonya pak...sangat membantu
@@yeyebc8747 sama2
pas di klaster kan hitung rata x dan y, itu itungnya bagiamna?
setiap data kan punya nilai x dan y. untuk menghitung rata2 x: jumlahkan semua nilai x dari data di dalam klaster tersebut, lalu dibagi dengan jumlah data di klaster itu. menghitung rata2 y juga seperti itu.
Pak apakah rapidminer ini hanya untuk algoritma k-means?
Tidak. Rapidminer menyediakan banyak sekali algoritma, baik untuk klasifikasi ataupun klasterisasi
Pak mau nanya...kalok k-means yg berbasis pso itu gimana caranya di rapidminer? 🙏
di Rapidminer belum bisa/ belum ada operator K-Means berbasis PSO
@@KuliahInformatika brrti operator Optimize Weight (PSO) yg ada di rapid miner itu hanya bisa bekerja untuk algoritma yg memakai label seperti c4.5 atau knn ya pak? Terima kasih sebelumnya atas jawabnnya pak🙏
@@lokap4903 bukan. Optimize Weight (PSO) itu operator untuk pembobotan feature/ atribut. Bukan untuk optimasi parameter dan hanya bisa dipakai pada supervised learning (klasifikasi atau regresi)
@@KuliahInformatika oo gtu.... Mau nanyak lagi pak😁🙏 .... Ada gak aplikasi atau tool atau sejenisnya saat ini.... untuk melakukan pengolahan data dengan k-means berbasis pso ni?
@@lokap4903 setahu saya tidak ada. Atau mungkin coba cari library untuk bahasa pemrograman Python
Pak mau tanya, keluar dari topik cluster. Kalau klasifikasi dengan algoritma naive bayes datanya bisa numerik atau tidak ? Terimakasih🙏🏼
Halo, maaf baru bisa balas. Bisa, naive bayes bisa dipakai untuk data numerik dan nominal
Misi pak ijin bertanya, kebetulan skripsi saya berhubungan dengan metode elbow, apakah bapak bisa membagikan link materi atau jurnal yang terkait? Terima kasih
Coba cek link berikut:
mdpi-res.com/d_attachment/J/J-02-00016/article_deploy/J-02-00016.pdf
jika klasifikasi dan klasterisasi dijadikan satu judul apakah bisa pak? Mohon jawabannya
Satu judul maksudnya gimana? Dijadikan dalam satu topik penelitian ya? Bisa saja. Melakukan klasterisasi untuk melabeli data, lalu membuat model klasifikasinya.
hallo, cara menghapus garis bawah ( _ ) di attribute bagaimana ya pak? yang ditabel atas sendiri, misal asal_kota seperti itu. cara menghilangkannya bagaimana, terimakasih.
Pakai operator "replace" atau "replace by remove". Selengkapnya bisa dicek di video ini: ruclips.net/video/iwTMfcJUde8/видео.html
@@KuliahInformatika terimakasih 🙏🏻
Kak kalau misalkan hasil dari pengklusteran nilainya sama bagaimana kak misal data pertama itu bisa masuk C1 dan C2 nah itu gimana kak karena nilainya sama
Jaraknya sama ya maksudnya? Ngga apa2, kita masukkan saja ke salah satu klaster, misalnya kita default dimasukkan ke c1. Nanti kan stlh itu dia akan evaluasi posisi centroidnya lagi.
@@KuliahInformatika nah untuk aturan tersebut ada gk kak teori dari siapa begitu kalau misal hasilnya sama bisa kita default ke salah satu cluster
@@ruditiga454 saya belum nemu landasan teori terkait hal tersebut :)
tapi, secara logik saja, ketika suatu data berada pada posisi yang seimbang di antara dua pusat klaster, maka mau tidak mau, dia harus dikategorikan ke dalam salah satu klaster tersebut. CMIIW
@@KuliahInformatika siap kak sangat membantu, sukses buat channel nya kak, terimakasih ya
Assalamualaikum Pak, izin bertanya pak saya sedang menyusun skripsi text clustering menggunakan k-means dan reduksi dimensi menggunakan SVD di RapidMiner. Kemudian saya ingin menggunakan paramter Local Random Seed dan Determine Good Start Value pada K-Means untuk menunjukan bahwa ada perbedaan nilai DBI yang akan dihasilkan. Namun setelah saya coba inputkan dengan nilai brp pun DBI yang dihasilkan Local Random Seed dan Determine Good Start Value selalu sama. Bagaimana ya Pak itu kenapa bisa atau karena ada pengruh SVD nya Pak?
Wa'alaikumussalaam. Local Random Seed yg dpake berapa saja?
@Kuliah Informatika saya coba dari rentang 400, 600,800,900, 1000, 1500, 1992, 2500 nilai DBI nya sama semua Pak. Bagaimana ya Pak apa ada kaitannya karena saya menggunakan SVD? karena kalau SVD nya saya hapus jadi hanya kmeans saja dan saya isikan local random seed yang berbeda beda hasil DBI nya berbeda beda pula Pak
Assalamu'alaikum pak fahri
Saya afan arifian
Mhs Unisnu jepara
Thn 2022 yang pernah ikut seminar data analitic
Boleh saya minta kontaknya bapak?
Karena mau minta masukan buku" Mengenai data mining dll.. Karena buat belajar lagi
Kebetulan saya sangat suka analis dan pengolahan data"..
Wa'alaikumussalaam wr wb.
boleh mas. sementara bisa melalui email: muhammad.fachrie@staff.uty.ac.id
Izin bertanya pak
Skripsi saya menggunakan klasifikasi C4.5
Saya baca banyk jurnal semua rata rata menggunakan cuma 2 class saja yaitu yes dan no
Bagai mana kalo ada 3 pak
Kebetulan di kasus saya ada 3 class pak
Tolong penjelasan nya pak
Terimakasih pak 🙏🙏
Sama saja prosesnya, hanya menambah sedikit di perhitungan information gainnya saja karena ada 3 clas. Secara umum sama prosesnya, berapapun classnya
apakah di rapidminer tidak ada elbow durve?
Setahu saya, tidak/ belum ada pak
@@KuliahInformatika siap, terima kasih infonya mas
sama-sama pak
Apakah clustering bisa menggunakan 1 data? Jadi hanya X saja,tidak ada Y nya
Bisa.
@@KuliahInformatika terimakasih pak
Assalamu'alaikum pak berarti k-means itu bukan metode klasifikasi tapi klusterisasi?? , kalo Klasifikasi yang udah ada labelnya itu pake metode K-Means atau bukan
Wa'alaikumussalaam. Iya betul, K-Means adalah algoritma klasterisasi, bukan klasifikasi. Kalo sdh ada labelnya, jangan pake K-Means, pake yg supervised learning seperti KNN, ANN, Decision Tree, Naive Bayes, dll
@@KuliahInformatika ok pak mkasih. pak mau tanya kalo di contoh perhitungannya, misalkan punya 10 data dan 3 kluster dengan centroid random, dalam euclidean distancenya itu centroid di kurangi dengan jumlah data atau jumlah data dikurangi centroid?? soalnya suka kebalik buat di skripsi
@@febisyarifpermana6226 centroid tidak dikurangi dngn jumlah data. Mungkin maksud Anda adalah mengurangi nilai tiap data dgn centroid. Kalo di euclidean, hasilnya akan sama, centroid dikurangi data atau data dikurangi centroid
Permisi pak, apa boleh minta sosmed atau nomor wa nya untuk minta tutor hari data set supervised rapidminer
Bisa ke IG @fachrie.jogja ya
permisi ka izin bertanya, saya ingin masuk uty dengan nilai rata’rapor sem 234(80.13,79.20,81.17) bisa diterima di jurusan informatika?
insya Allah bisa. Silakan cek pmb.uty.ac.id/
semoga bisa ketemu di UTY :)