Klasifikasi Data dengan Naive Bayes Classifier pada Aplikasi Rapidminer
HTML-код
- Опубликовано: 17 окт 2024
- Pada video ini kita belajar melakukan klasifikasi data menggunakan salah satu algoritma Machine Learning, yakni Naive Bayes Classifier. Berbeda dengan Decision Tree yang menghasilkan model/ knowledge berupa pohon keputusan, algoritma Naive Bayes menghasilkan model/ knowledge (pengetahuan) berupa nilai probabilitas pada dataset. Di video ini, kita juga membahas membandingkan akurasi antara algoritma Naive Bayes Classifier dengan Decision Tree pada klasifikasi data bunga Iris yang tersedia pada aplikasi Rapidminer. Selamat menonton :)
#machinelearning #artificialintelligence #naivebayes #rapidminer
Assalamualaikum pak, saya cuma mau mengucapkan terimakasih banyak berkat video video bapak saya lulus sidang tugas akhir pak, saya membuat klasifikasi spam tweet menggunakan naive bayes, dan dinyatakan lulus, terimakasih banyak sekali lagi pak🙏🙏
Wa'alaikumussalaam. Alhamdulillaah mbak. Selamat ya, saya ikut senang mendengarnya. Semoga video2 saya berguna untuk banyak orang. Congrats y mbak 👏👏👏
Ka boleh aku email gk kk nya, mau tanya-tanya perihal naive bayes ka, soalnya aku juga lagi nyusum skrispi kaa. makasih
@@desironaulilumbanraja5249 kak boleh minta contact nya gak? aku juga lagi nyusun skripsi naive bayes wkwk
Terima kasih banyak Pak atas pembelajarannya saya mencoba teknik ini, penjelasannya juga cukup detail Pak jadi saya sedikit mencoba, ilmunya sangat bermanfaat semoga sehat selalu semua sekeluarga Bapak :) sangat #membantu sekali Pak :)
Alhamdulillaah. Terima kasih banyak atas supportnya ya mas. Sukses selalu :)
Bapak sehat sehat yaaa, terimakasih banyak atas ilmunya ❤. Semoga menjadi amal jariyah untuk bapakk
Aamiin.. terima kasih yaa supportnya 😊
keren mas, kebetulan saya mau buat penelitian untuk membandingkan antara decision tree dan naive bayes ini, semuanya sudah lengkap dan dijelaskan dengan mudah dan dapat dipahami. jazakumullah khairan mas
Alhamdulillaah.. wa iyyaa kum. terima kasih juga atas dukungannya untuk channel ini :)
Alhamdulillah akhirnya saya mengerti Pak, terima kasih ilmunya semoga berkah aamiin 🙏
Alhamdulillaah. Terima kasih sudah mampir 😊
Alhamdulillah penjelasanya sangat detail dan mudah dipahami untuk para pelajar, terimakasih pak Channel yg sangat bermanfaat sehat selalu untuk bapak 🙏
Alhamdulillaah. Terima kasih supportnya mas
terima kasih pak sangat berguna ilmunya.. penjelasannya sangat mudah di pahami
Semoga sukses ya
Assalamu'alaikum Pak, terimakasih banyak atas penjelasannya.. Sangat membantu sekali dengan pembelajaran saya khususnya saat UAS.. Sukses dan sehat selalu yaa Bapak..
Wa'alaikumussalaam. sama2. Terima kasih untu doa dan dukungannya 🙂
bapak jelasinnya bikin aku paham bangetttt masyallah,pak kalo boleh request bikinin SVM dong buat skripsiku
Makasih banyak yaa buat feedback.. Mudah2an saya bisa segera memenuhi permintaan teman2 semuanya.. 😊🙏
Makasih banyak ilmunya pak. Semoga selalu diberikan keberkahan hidup.
Aamiin. makasih doanya ya
terima kasih videonya pak sangat bermanfaat, semoga sehat selalu, jazakallahu khair
Terima kasih banyak atas supportnya.. aamiin ya Rabb
trimaksih atas pencerahanya pak, panjang umur dan semoga sehat selalu
Aamiin. Terima kasih. Doa yang sama utk Anda 😊
terimakasih pak . semoga semakin sukses ke depannya
Aamiin ya Allah. Terima kasih doanya ya
Alhamdulillah saya ucapkan terimakasih pak materinya sangat mudah difahami dan saya mohon izin materi ini saya ajarkan ke siswa saya di kelas saya
Alhamdulillaah, semoga bermanfaat ya. Terima kasih juga untuk supportnya :)
terima kasih kak buat penjelsannyaa udah membantu. btw, kak boleh request tutorial yang memakai cross validation yang buat melihat performancenya gk kak? thank you
Makasih supportnya ya.. mudah2an saya bisa menyajikan videonya ya.. sedang susah mencari waktu untuk ngonten lagi, hehe...
Terima kasih pak, bismillah jika saya sudah lulus sidang tugas akhir saya akan balik lagi kesini.
Aamiin.. semoga diberikan kemudahan dan kelancaran di setiap urusannya.
Halo pak, izin bertanya dong. Berarti jika naive bayes ini ditingkatkan akurasinya menggunakan metode PSO, kita tinggal menyesuaikan di bagian awalnya saja ya pak dengan menambahkan fitur metodenya? untuk step algoritma-nya tetap sesuai dengan yang bapak ajarkan diatas? Terima kasih pak sebelumnya 🙏🏻
Harus diperjelas dulu, PSO-nya dipakai untuk mengoptimasi bagian apa pada Naive Bayes. Menurut saya, PSO tidak cocok jika dipakai untuk optimasi parameter pada NB, karena NB termasuk algoritma non-parametrik. Alternatifnya, kita bisa pakai PSO untuk memberi bobot pada atribut dataset (feature weighting)
punten pak, berarti untuk parameter di naive bayes itu lebih cocok pake data diskrit ya pak daripada menggunakan data kontinyu? lalu bagaimana cara mensiasati data kontinyu yang muncul pak? apakah harus menggunakan normalisasi kayak minmax scaler atau std scaler gitu pak? terima kasih
Bukan parameter, tapi atribut. Naive bayes bisa untuk data kategorikal maupun numerik (diskrit atau kontinu). Utk data numerik, nanti probabilitasnya pakai rumus distribusi gaussian. Coba search saja di Google "naive bayes untuk data numerik"
@@KuliahInformatika siap pak terima kasih banyak pak ilmu nya
Terimakasih bnyak pak ilmunya, sangat mudah dipahami dan detail.. sehat dan sukses selalu pak Aamiin
Terima kasih kembali 😊
assalamualaikum pak
videonya sangat jelas dan sangat membantu. jika boleh apakah bapak bisa tolong buatkan tutorial klasifikasi data dengan metode regresi logistik multinomial menggunakan rapidminer pak? karena skripsi saya menggunakan metode tersebut.
terima kasih sebelumnya pak, semoga sehat selalu
wa'alaikumussalaam. makasih banyak ya atas dukungannya 😊
sebetulnya mirip dengan tutorial di video ini, cukup ganti saja operator klasifikasinya dari naive bayes menjadi logistic regression. selamat mencoba :)
Alhamdulilah penjelasannya simple mudah dipahami, saya yg bukan background IT sangat tertarik untuk belajar naive bayes, apakah bapak ada referensi buku untuk saya dapat pelajari lebih lanjut, terima kasih
Alhamdulillaah, terima kasih atas feedback positifnya. Saya rekomendasikan belajar dari buku ini: www.gramedia.com/products/machine-learning-tingkat-dasar-dan-lanjut-edisi-2
MAKASI BANGEDD BUAT BAPAKNYAAAA... SKRIPSIKU LANCAR HEHE
Selamat ya mas. Turut bahagia 😊🙏
izin bertanya pak, jadi ketika p(new|yes) dan p(new|no) ketika dijumlahkan hasilnya tidak harus sama dengan 1 ya?
Iya, tidak harus satu. karena p(new|yes) dan p(new|no) itu sendiri adalah gabungan dari probabilitas terhadap feature2 yang ada di dalam dataset.
Request bang: buat analisis sentimen menggunakan algoritma knn, terus perhitungan similaritas nya pke cosine similarity di rapid miner bang🙏
Siap, insya Allah.. usulannya saya tampung dulu ya. makasih feedbacknya
Uppp
assalamualaikum pak, maaf izin tanya pak.
untuk rumus probabilitas bukannya seperti ini ya pak?
P(B|A) = P(A and B) / P(A)
jadi untuk contoh p(new|yes) itu seharusnya dibagi dengan p(yes).
Mohon konfirmasinya pak. Terimakasih juga pak sudah mau share ilmu mahal ini
sehingga p(new|yes) + p(new|no) = 1
betul. algoritma dasarnya dibagi dengen P(A). Tapi ada proses penurunan rumus lagi di situ, saya agak lupa. coba dicari di buku2 Machine Learning.
Nah ini ngga bisa straight forward seperti ini. karena kondisi 'new' di situ sebenarnya mewakili semua feature yang ada di dataset, jadi kita ngga bisa pukul rata seperti itu. Nilai probabilitas 1 itu diperoleh dari menjumlahkan semua probabilitas yang ada untuk semua feature pada kondisi yes maupun no. CMIIW
Permisi pak saya mau bertanya tentang data training misal anak A dinyatakan lulus sekolah. Lalu kita membuat data training dengan atribut unsur dan penilaian tersendiri, nilai nya berbeda misal C semua, untuk class lebel target nya mengikuti apa yang sudah ada? anak si A class lebel target nya lulus, apa mengikuti penilaian yang dibuat sendiri.
Trimakasih
Data training dan data testing itu tidak kita buat sendiri, tapi kita pakai data real (data yang benar2 ada). Namun nanti, data tersebut bisa kita olah agar memberikan performa klasifikasi yang maksimal.
Assalamuálaykum
pak, nanya
Setelah kita tau bahwa data kita berakurasi tinggi
lalu next step-nya apa ya?
Misalnya saya punya DATA BARU yang saya mau uji, apakah ini masuk klasifikasi IRIS VERNICOLOR atau bukan, bagaimana caranya?
Wa'alaikumussalaam. Pertanyaan yang bagus. Jadi, model yang sudah dilatih dengan data latih dapat kita simpan menggunakan operator "Store", lalu kita bisa membuat proses baru, lalu kita load model yang sudah disimpan sebelumnya menggunakan operator "Retrieve". Kemudian kita koneksikan operator Retrieve tadi ke operator "Apply Model", begitupun dengan data baru yang ingin diklasifikasikan kita koneksikan ke Apply Model.
@@KuliahInformatika syukron Pak atas jawabannya. Kalo bisa sih dibuatkan videonya, hehehehe
@@KuliahInformatika kayaknya memang harus bikin videonya nih Pak Dosen. Uji coba saya gagal, hehehe
Ijin bertanya Pak untuk menit 27:21, bagaimana membaca model yang dihasilkan ketika atributnya berupa data numerik (mean dan standar deviasi) bukan berupa kategori? kemudian secara proses apakah dilakukan klasifikasi pada atribut yang merupakan data numerik sebelum dihitung probabilitasnya?
Terima kasih sebelumnya Pak 😊
ada rumus tersendiri ketika atributnya bertipe numerik (bukan nominal), di mana yang perhitungannya melibatkan mean dan standar deviasi dari masing2 atribut. hasil perhitungannya tetap dianggap sebagai probabilitas. Alternatif lain, atribut bertipe numerik bisa dipandang nominal, caranya adalah dengan membuat rentang nilai tertentu pada setiap atribut. Misal ada atribut usia, kita bisa konversi nilai usia yang semula numerik menjadi nominal dengan membuat rentang usia 0 - 10: kanak2, 11 - 17: remaja, 18 - 30: dewasa, dst..., sehingga bisa diperlakukan sebagaimana atribut nominal biasa. CMIIW
@@KuliahInformatika Alhamdulilllah, Terima kasih Penjelasannya Pak 🙏😊
Assalamualaikum pak, saya ingin bertanya. saya sudah memiliki dataset review pengguna tix id di playstore (tanggal review, komentar pengguna, versi update aplikasi, skor rating 1-5, ). nah fokus saya itu untuk mengetahui sejauh mana user acceptance pengguna tsb berdasarkan rating 1-5 dgn variabel DANA. saya sudah memiliki datanya. kalau untuk data training dan testingnya bagaimana ya pak? untuk pelabelannya apakah bsa dilakukan dgn fokus rating tsb pak? saya berfokus dengan menggunakan metode naive bayes pak.
Wa'alaikumussalaam mas Devid. Oya, saya baru baca juga email yang dikirimkan ke saya. Sebelum saya bisa menjawab pertanyaan Anda, saya mau bertanya dulu, apakah user acceptance bisa diukur melalui skor playstorenya? Jika iya, maka sebetulnya tidak ada urgensi untuk membangun model Machine Learning untuk itu, karena kita sudah bisa menilai kepuasan user lewat skor di playstore. Bukan begitu?
@@KuliahInformatika sebenarnya fokus skripsi saya itu mengenai data mining pengguna tix tsb pak untuk dapat mengetahui gambaran umum review pengguna tsb yg difokuskan lagi oleh Dana & Promo pak. nanti hasilnya dapat diketahui dari gambaran umum rating 1-5, rating 1 dan rating 5 saja serta berapa akurat perhitungan tsb yg nanti berakhir ke user acceptance berdasarkan klasifikasi data tsb. untuk urgensi atau tidaknya, sebenarnya dari awal skripsi saya mengetahui user acceptance tsb dengan metode survei (SEM PLS) namun oleh dospem saya disuruh cari metode lain yg masih jarang digunakan oleh pihak UNIB maupun luar. oleh karna itu saya memilih data mining pak. di dalam data tsb juga sebenarnya ada variabel lain untuk mengetahui kepuasan user yaitu dari isi review pengguna bukan hanya berdasarkan rating atau skor saja pak. oleh karna itu saya menggabungkan keduanya dgn fokus berdasarkan rating / skor sbg labelnya.
sejauh ini saya sudah mencoba dgn metode naive bayes sudah dapat diketahui pak hasilnya dengan membandingkan dari variabel DANA & Promo dari review user tsb dgn fokus dari skor 1-5, skor 1 dan skor 5 saja. pada awalnya tidak bsa dikarenakan label saya yaitu skor bersifat numerikal (integer). oleh karna itu saya ubah ke polynominal tipe datanya. apakah hal tsb boleh dilakukan pak?
Assalamualaikum pak, izin bertanya. Saya ingin membuat penelitian mengenai prediksi tingkat polusi udara di 4 wilayah kotamadya dengan memasukkan data curah hujan dari ke4 wilayah tsb. Saya sdh memiliki dataset polusi dan curah hujan dalam rentang 5 tahun. Saya bermaksud ingin melakukan proses klasifikasi antara dua dataset tersebut terlebih dahulu, baru kemudian mengembangkan algoritma prediksi LSTM-Propet.
Adakah masukan untuk penelitian ini pak? Saya berfikir untuk melakukan klasifikasi dengan Naive Bayes namun saya tdk tahu bagaimana menjalankannya untuk dua dataset dan menghubungkannya.
Terima kasih jika berkenan memberikan masukan pak🙏
ini datasetnya seperti apa karakteristiknya? timeseries atau multivariat biasa? Rapidminer bisa menggabungkan 2 data terpisah jadi 1 data. Pakai operator Append (jika atribut kedua dataset sama) atau pakai Union. Kalau datanya timeseries, tidak disarankan pakai Naive Bayes
Assalamualaikum pak
Pak maaf mau tanya
Saya Ta menggunakan algoritma naive byes pak. Dengan judul ttg kepuasan pelanggan. Nah dataset saya ambil dari kuesioner dengan total responden 100 orang.
Data saya bagi jadi 2 yaitu training 80 dan testing 20.
Untuk training blm ada labelnya pak. Apakah labelnya bisa pakai interval pak? Karena kuesinoner nya dr skala likert
Sebetulnya model kuisioner seperti ini tidak perlu machine learning lagi untuk memprediksi. cukup kita hitung skala likertnya dari seluruh pertanyaan, misalnya jika rata-rata skornya di atas 3, bisa kita katakan bahwa pelanggannya puas, selebihnya berarti pelanggan tidak puas. Begitu saja. Jadi case seperti ini menurut saya tidak usah lagi dimodelkan dengan machine learning.
@@KuliahInformatika baik pak terimakasih penjelasannya
Assalamu'alaikum pak Saya mau bertanya untuk cara perhitungan naive bayes manual misal ada 10 data set dan 1 data testing, 1data testing lalu sudah di hitung dan muncul lagi 1 data testing, cara menghitung nya menggunakan 10 data set apa 11 data set ditambah kan 1 data yang sudah tadi dihitung
Trimakasih pak
tetap pakai data training yang 10 tadi.
Baik trimakasih pak
Pak mau nanya. Klo variabel prediktornya numerik seperti misalnya umur atau gaji, cara hitung manual probabilitas bersyarat nya gimana ya?
Secara teori nya kan memang bisa, tapi untuk implementasi nya di NBC gimana ya? Trimakasih
ada dua cara. cara pertama kita konversi nilai numerik ke nilai kategorik berdasarkan rentang tertentu, misalnya umur 0 - 15: anak-anak, 16-21: remaja, 22-45: dewasa, dst. lalu diproses dengan metode seperti di video. cara kedua membiarkan data tersebut dalam bentuk numerik, lalu probabilitasnya dihitung dengan distribusi normal, silakan cek tutorialnya di sini: medium.com/analytics-vidhya/use-naive-bayes-algorithm-for-categorical-and-numerical-data-classification-935d90ab273f
semoga membantu.
Halo Pak, dalam mengukur akurasi kan diperlukan data aktual untuk dibandingkan dengan data hasil prediksi. Berarti kita harus melabeli secara manual seluruh data ujinya terlebih dahulu ya, Pak? Sebelumnya, terima kasih videonya 🙏
betul mas, data uji kita labeli juga secara manual.
@@KuliahInformatika Baik, terima kasih banyak Pak 👍
makasih banyak pak ilmunyaaa!
Terima kasih sudah berkunjung 😁🙏
Permisi pak saya izin bertanya terkait penggunaan model pada jenis tipe data, untuk tipe data numerik itu kan bisa menggunakan knn dan yang lainnya, dan untuk tipe data nominal itu bisa menggunakan naibe bayes dan decision tree, tetapi kalau misalnya data yang kita punya itu campur dimana terdapat data numerik dan nominal maka kira kira model apa ya yang cocok diterapkan? terima kasih 🙏
sebetulnya semua algoritma machine learning yang ada saat ini bisa mengakomodasi baik numerik maupun nominal, sudah ada proses penyesuaiannya. tapi, strategi lainnya adalah Anda bisa mengkonversi data nominal menjadi numerik dengan mengganti nilai2 di dalam atribut nominal menjadi angka. coba pelajari tentang one-hot encoding
izin bertaya pak,
misal saya memiliki rekam medis,
pada kasus pertama memiliki gejala g1, g2, g3 dengan diagnosis penyakit p1
pada kasus kedua memiliki gejala g1, g2, g3 dengan diagnosis penyakit p1
jika ditotal, rekam medis tersebut = 2 atau tetep terhitung 1 ? tolong pencerahannya pak terima kasih
Umumnya itu dianggap 1 data, karena dia sama. Duplikasi data sebaiknya dihindari, kecuali jika kasusnya pada imbalanced dataset sehingga mengharuskan adanya oversampling.
Jadi jika saya ingin mencari nilai probabilitas bada penyakit p1 berdasarkan contoh yg saya sebutkan sebelumnya
P(p1)=jumlah penyakit p1 pada tabel kasus / jumlah data kasus
1/1 ya pak, bukan 1/2 karena data yang sama dianggap 1?
@@genthaaliansi2740 ya tergantung data p1 ada berapa di dalam datasetnya. Kalau kasus duplikat tadi, bisa dihitung 1 saja kemunculannya
@@KuliahInformatika tapi pak tabel pada menit 8:44, kasus -> young, male, credit card, yes ini muncul sebanyak 4 kali, ini bagaimana ya pak? kenapa tidak dihitung 1 saja kemunculannya
@@genthaaliansi2740 sepertinya saya yang keliru memberikan contoh. Tapi pada dasarnya duplikasi data seperti itu bisa saja terjadi, dan sebetulnya bisa saja menganggap data itu 1 atau dihitung juga dengan duplikatnya. Maaf jika malah membuat bingung ya
terimakasih pembelajaran nya
izin tanya, apakah model nya hasil train nya bisa di save dan di deploy untuk predic?, boleh info dokumentasi nya kah?
Maaf baru sempat membalas. Bisa. Pakai operator "Store" untuk menyimpan model yang sudah dilatih ataupun bisa dipakai untuk menyimpan data yang sudah diolah. Nanti ketika akan dipakai untuk memprediksi, model yang sudah disimpan bisa dibuka melalui panel Repository, di direktori "Local Repository"
Halo Pak, izin bertanya.. saya ada case untuk NLP, dimana saya data disini merupakan data2 chat dimana sekarang belum memiliki label tertentu, jika saya ingin melakukan klasifikasi apakah bisa? terakhir saya coba menggunakan K-Means untuk unsupervised tetapi masih cukup kurang untuk hasilnya, terima kasih sebelumnya 🙏
untuk melakukan klasifikasi, data-data tersebut perlu dilabeli dahulu, jika tidak, maka tidak bisa diproses dengan pendekatan klasiffikasi.
soalnya ini data raw, at least kita mau melakukan klasifikasi sederhana dulu untuk memisahkan berdasarkan mungkin seperti jenis kalimat atau kata2 yang sering digunakan sehingga kita bisa labelkan dari situ Pak
asalammulaikum pak, mau tanya pak. saya sedang membuat prediksi bahan baku pempek, saya pake data penjualan atribut : Jumlah(integer) Tingkat Jual(sedikit,sedang,banyak)Jenis Pembelian(pesana atau tidak)Restok(iya atau tidak). yang saya tanyakan apakah bisa naive bayes digunakan prediksi bahan baku? saya sudah buat tpi saya tidak mengerti alur prediksiny.. tolong pencerahannya pak terima kasih
kalau untuk new cust pake data deal masih ngerti pak.. tpi yang saya buat malah ga ngerti
Naive Bayes bisa dipakai untuk data kategorikal maupun real. Selengkapnya bisa cek di sini: ruclips.net/video/f3QUflfqFjc/видео.html
Terima kasih sangat bermanfaat
terima kasih banyak ya
selamat pagi pak. apakah video nomor #4, #5, #6 apakah ada? saya sangat interest untuk belajar machine learning. bapak menjelaskan sangat bisa dimengerti. terimakasih pak sebelumnya.
Mohon maaf, nomor 4, 5, 6 memang belum ada. Kemaren itu lompat ke no. 7 karena harus menyesuaikan dengan materi kuliah di kampus 🙏
Assalamualaikum pak, saya mau bertanya, Saya lagi memprediksi kelulusan siswa di SMA menggunakan metode naive bayes, Namun kendalanya nilai semua siswa di atas rata" dan bisa dibilang lulus semua, itu bagaimana solusi untuk perhitungannya ya pak? Mohon arahannya pak🙏
Wa'alaikumussalaam. Sudah saya jawab via email ya
Permisi pak izin tanya untuk evaluasi analisis sentimen apa bisa ya menggunakan ini? Atau ada cara lainnya? Kira kira di dalam rapid mainer apa bisa ya?
bisa pakai cara yang saya jelaskan di video, Jika ingin menghitung akurasi, koneksikan operator "Apply Model" ke operator "Performance (classification)"
Asslamualaikum Pak Fahri, mohon izin perkenalkan saya Alfin mahasiswa magister TI di UTY. Apakah bisa Naive Bayes untuk klasifikasi polunominal? Tidak hanya ya atau tidak, tetapi bisa mengklasifikasi dengan label rendah, menengah, dan tinggi? Terimakasih
Wa'alaikumussalaam. Tentu bisa. Nanti probabilitas utk tiap label dihitung, lalu ambil yg terbesar nilainya
Assalamualikum
Mohon infonya dengan model apa untuk mendeteksi anomali suatu transakasi yang diluar kebiasaan nasabah
misal data set
nominal,lokasi,typetx
100,jkt,trktunai
100jkt,trf
200,bdg,payment
100,sby,topup
deteksi tx berikutnya
300,solo,trf
bagaimana mendeteksi tx berikutnya adalah tx wajar atau anomali
terimakasih
Wa'alaikumussalaam. sebtulnya semua model Machine Learning bisa dipakai untuk deteksi anomali atau kecurangan misalnya, asalkan kita bisa melabeli dulu data yang kita punya ke dalam kategori "anomali" dan "normal"
Request Pak; cara menerapkan algoritma PSO untuk pemilihan paremeter secara otomatis pada algoritma SVM untuk prediksi yang lebih akurat dengan menggunakan rapidminer. Terima kasih sebelumnya Pak.
terima kasih feedbacknya.. kami catat. mudah2an kami bisa segera mnyajikan videonya..
@@KuliahInformatika Semoga video pembahasannya segera hadir ya pak. Video pembahasan bapak itu nantinya akan sangat saya butuhkan dalam pengerjaan Thesis saya pak. Terima kasih
bang, ga masalah kah kalo data uji/data set lebih banyak dari data latih/ data training ny?🙏🏼
sebenarnya ga masalah, cuma nanti jadi aneh, karena knowledge yang dipelajari oleh machine learning tidak komprehensif karena datanya sedikit.
selamat sore pak, saya mau bertanya. saya kan punya data mentah ya pak tentang penjualan mobil dari berbagai merk dan tipe. nah disitu hanya ada total penjualannya saja pak tidak ada class laku dan kurang laku. bagaimana caranya pak agar data mentah tersebut jadi data training yg mempunya class laku dan kurang laku. terima kasih pak semoga dijawab
Harus ada ketentuan batas berapa jumlah yang dikatakan laku dan kurang laku. Kalau sudah ada ketentuannya, nanti kolom total penjualan bisa dikonversi ke dua kelas "laku" dan "kurang laku". Kolom tipe dan merk juga bisa dijadikan sebagai atribut untuk melakukan klasifikasi.
@@KuliahInformatika ketentuan batasnya dari mana ya pak? mohon izin
@@KuliahInformatika dan untuk data testing nya itu total penjualannya harus beda dari data training ya pak?
assalamualaikum pak, saya ingin bertanya kalau semisalkan datanya 1300 kira' data yang harus dilabelin secara manualnya berapa ya pak ? terimakasih
Kalau utk tujuan pengembangan model, semuanya dilabeli, lalu nanti tinggal dibagi 2 untuk train dan test.
izin bertanya pak di apk rapid miner apakah bisa menggunakan dataset yg kita buat sendiri?
Tentu bisa. kita bisa menggunakan operator Read CSV atau Read Excel untuk membaca dataset buatan sendiri
permisi pak mau nanya kn yg split data itu 0.9 dan 0.1
disaya 0.1 jadinya 11 data pak
lalu pertanyaan saya pak:
saya kan data training ny 112 data lalu dengan split data itu 0,9 nya jadiny berapa ya pak data train saya itu?
apakah 100 data jadiny pak data training saya ya? soalny saya diharuskan menghitung manual juga dengan naive bayes pak.
mohon pak bimbingan dan tanggapan ny pak🙏🏻.
sangat berterima kasi dengan materi bapak
mohon dibales secepatny pak🙏🏻🥹
waduh, maaf ya. saya lama ga cek komentar2. Itu 0.9 dan 0.1 adalah rasio atau persentase dari datasetnya. Misalnya data latih kita set 0.9, berarti jumlah data latih yang kita pakai adalah 0.9 x 112 = 100.8 (dibulatkan jadi 101). sisanya menjadi data uji.
Asalamualaikum pak, judul skripsi saya penerapan metode naive bayes untuk prediksi tingkat kelulusan tepat waktu ujian kompetensi, ituu untuk data nilai nilainya yang di ambil apa aja ya pak, apakah ipknya atau nilai dari hasil ujian kompetensi nya? Mohon pencerahan nya,
output sistemnya mau seperti apa? apakah kategorik atau numerik? harus jelas dulu. Untuk atributnya bisa menggunakan nilai IPK dari bbrp smstr terakhir misalnya.
Assalamualaikum bapak, mau nanya kalo yg di jelasin kan akurasi data training kalo akurasi data testing gimana cara nya pak?
siapkan data testingnya (baca data pakai operato "read csv" atau "read excel"), pakai operator "Apply Model" setelah operator Naive Bayes, lalu koneksikan operator Naive Bayes ke Apply Model (melalui konektor "mod"), lalu koneksikan juga data testing ke Apply Model (melalui konektor "exa"). Setelah itu, hubungkan Apply Model ke Performance.
Di rapid miner utk menguji/mengklasifukasi data baru bagaimana ya
bisa mas. Jadi saat kita membangun workflow untuk training data, tambahkan operator "Store", lalu dari operator Machine Learning (misal Decison Tree, Neural Net, dll), tarik koneksi 'mod' dan sambungkan ke operator "Store". Nanti ketika kita jalankan workflow training itu, model ML nya akan disimpan ke dalam repository Rapidminer. Lalu, ketika kita punya data baru (yg belum berlabel), data tersebut bisa kita klasifikasikan menggunakan model ML yang sudah kita simpan tadi. Kurang lebih begitu. Maaf, saya belum buatkan video tentang hal tersebut.
kalau naive bayes menggunakan fitur seleksi mutual information pernah coba, bisa pa?
saya belum pernah coba. selama ini lebih suka melakukan feature selection berbasis Genetic Algorithms :)
Mau tanya pak, di New customer kenapa yg dipilih cuman ada 3 ya, old, female dn, cash, sementara gender male sama young juga ada tu, bisa dijelasin pak, saya masih bingung, trimakasih
kan itu ceritanya ada pelanggan baru dengan usia tua (old), perempuan (female), dan bayar dengan cash.
coba ditonton lagi dengan lebih teliti ya 🙂
izin bertanya, apabila pada saat perhitungan excel data berupa data numerik dan salah satu kelas hasilnya 0 bagaimana cara mengatasinya
Intinya, Naive Bayes akan memilih kelas dengan nilai probabilitas terbesar. Jadi jika nilainya 0, itu berarti kelas tersebut tidak akan dipilih.
Pak mau nanya, saya sedang melakukan penelitian tentang pencarian buku menggunakan Naive Bayes saya punya data data buku sesuai jenis bukunya, yaitu buku sipil, elektro, arsitek dan informatika dengan atribut judul,pengarang dan penerbit nah saya mau klasifikasi tpi cara ngasih labelnya gimana pak?semoga di jawab
Nah, pertanyaannya saya kembalikan, datanya mau diklasifikasikan ke dalam kategori apa aja?
@@KuliahInformatika kategori buku referensi dan buku ajar pak🙏
@@sitinurwahidaarif1087 nah, sip. Brarti bikin kolom baru utk label, lalu diisi dengan "buku ajar" atau "buku referensi" sesuai dgn jenis bukunya. Diisi manual
@@KuliahInformatika maaf pak nanya lagi,untuk bagi data training dan testing caranya gimana pak? Kemudian pemberian label nya itu untuk data training saja atau testing juga atau sebelum datanya dibagi di beri label dulu??
@@sitinurwahidaarif1087 pembagian biasanya 70% training, 30% testing, tp bisa lebih banyak lg, misal 80:20. Untuk tahap pemodelan, baik training dan testing diberi label
Assalamualaikum pak, saya ingin bertanya skripsi saya berjudul klasifikasi tingkat kepuasan mahasiswa pada pelayanan perpustakaan dan saya masih bingung di model perhitungannya kira2 perhitungan yang tepat menggunakan metode apa ya pak, mohon sekali untuk respon nya pak. Terimakasih
Wa'alaikumussalaam. bisa pake metode klasifikasi mana saja, namun perlu disesuaikan juga dengan data yang dimiliki. Misal, jika datanya bertipe nominal, maka gunakan algoritma seperti Naive bayes, decision tree model ID3, kNN, atau algoritma lain yang bisa untuk data nominal. Jika datanya bertipe numerik, maka hampir semua algoritma klasifikasi bisa dipakai.
@@KuliahInformatika maaf pak perbedaan data nominal denga numerik apa ya?
@@yunisaridwiaestriaisaroh6811 data nominal itu yang sifatnya kategori, misal: jenis kelamin (L/P), tingkat pendidikan (SD, SMP, SMA, D3, S1, S2, S3), kota (jakarta, bandung, yogyakarta, dll). Kalqu numerik itu data berupa bilangan, misalnya harga, berat, tinggi, suhu, dll
@@KuliahInformatika maaf pak izin bertanya lagi saya belum terlalu faham, apakah klasifikasi itu sama dengan mengukur atau berbeda pak?
@@yunisaridwiaestriaisaroh6811 mengukur bagaimana? Klasifikasi itu mengelompokkan data berdasarkan kelas atau kategori tertentu
Assalamu'alaikum pakk.
Ijin Mendownload video videonya buat belajar ya ,mkasih banyak pak 🙏
Silakan :)
koreksi pak di menit 6:51 bukannya 6/10 pak karena total bola hitam di wadah B itu 4+2 atau 6
Iya betu. saya keliru menuliskannya. Terima kasih atas koreksinya
hallo pak, untuk pemodelan menggunakan lexicon based paada rapid miner itu seperti apa ya pak🙏🙏?
Terus terang, saya belum pernah melakukan sentimen dengan basis lexicon, tapi nampaknya rapidminer bisa melakukan hal tersebut. Coba baca panduan ini: docs.rapidminer.com/latest/studio/operators/extensions/Operator%20Toolbox/text_processing/dictionary_sentiment_learner.html
@@KuliahInformatika baik pak, pak izin bertanya kalau ingin belajar mandiri seperti kursus dengan bapak apakah bisa?
ijin nanya pak, kalau kita memakai 3 jenis naive bayes yaitu bernoulli, gaussian dan multinominal gimana?
mohon maaf, pertanyaannya kurang jelas :)
Assalamualaikum pak, mohon izin bertanya. Kalau menggunakan data gambar untuk klasifikasi, lalu menggunakan CNN bagaimana ya pak. mohon bimbingannya
Bisa, rapidminer mendukung penggunaan CNN melalui extension yang disediakan. Anda bisa install melalui menu Extension, lalu cari extensionnya dengan kata kunci "Deep Learning" atau "CNN". Saya belum pernah coba, mudah2an berhasil
Pa izin bertanya, untuk data testing itu harus dilabeli atau ngga apa apa kalo ngga dilabeli?
Ya, data testing harus kita labeli agar kita bisa menghitung akurasi dari model ML yang kita rancang.
@@KuliahInformatika izin bertanya pak, kan saya punya data data buku sesuai jenis bukunya yaitu buku teknik sipil, elektro, arsitek, jnformafika dengan atribut judul, pengarang dan penerbit nah cara melabelinya gimana pak untuk klasifikasi nya??
Selamat malam Pak, saya sangat berterimakasih untuk video ini yang sangat bermanfaat bagi saya. Kira kira bapak ada rekomendasi buku machine learning yang bisa saya baca ga yapak yang kira kira menurut bapak bagus untuk dijadikan sumber skripsi, terimakasih banyak sebelumnya Pak..
sama izin tanya pak, untuk mid-age itu tidak perhitungkan atau memang terlewat karena hanya member contoh saja pak?
Buku yang saya rekomendasikan: Machine Learning Tingkat Dasar dan Lanjut, penulisnya Dr. Suyanto, penerbit Informatika.
Iyaa mid age itu saya terlewat. Mohon maaf 🙏
Baik Pak terimakasih..
Maaf Pak izin request, tutor dalam membaca data yang terdapat di situs kaggle u/ dibawa ke skripsi soalnya bingung
Sejauh ini, setau saya Rapidminer belum bisa menarik data dari website tertentu. CMIIW
bro tolong buat materi Gaussian, Bernaulli dan Binomial
Selamat Malam Pak, apakah ada tutorial video utk penggunaan Metode Artificial Neural Network
coba ini: ruclips.net/video/UYp32dGr5X8/видео.html
Assalamu'alaikum pak, izin bertanya, untuk penerapan perhitungan klasifikasi data pada data analisis sentimen apakah bisa diterapkan seperti ini dengan memasukkan data_analisis_sentimen dan model_analisis_sentimen ? izin arahannya pak, terima kasih
wa'alaikumussalaam. mohon maaf, saya kurang paham dengan pertanyaannya. bisa dijelaskan lebih rinci lagi?
@@KuliahInformatika izin pak maksudnya saya menanyakan untuk proses pengukuran akurasinya bapak apakah bisa langsung dihubungkan dengan operator performance ? soalnya hasilnya unknown bapak, izin arahannya bapak
@@andreaspakpahan3271 kalau di video ini, tidak bisa diukur performancenya, karen data tesnya belum dilabeli. Kalau mau menghitung akurasinya, maka gunakan data testing yang sudah dilabel, baru nanti bisa ditambahi operator performance classification
Assalamualaikum pak, rencananya saya ingin membuat simulasi tata kelola naungan kopi yang standar untuk meningkatkan produksi kopi.. kira kira model perhitungan apa yang tepat pak? Terima kasih..
data yang dipunya seperti apa?
Datanya berupa faktor abiotik (tinggi tempat, suhu, kelembapan udara, intensitas cahaya, pH tanah) faktor biotik (tinggi tanaman penaung, luas naungan, jarak tanaman penaung dgn penaung, jarak kopi dgn kopi, jarak penaung dgn kopi), ada juga data standarisasi faktor abiotik yg baik untuk kopi dan jumlah produksi kopi dari perkebunan kopi trsbut..
insya Allah bisa jika seperti itu. Jika data yang ada banyak mengandung nilai nominal (kategorikal), bisa gunakan Naive Bayes atau Decision Tree. Tapi jika datanya lebih banyak bertipe numerik (integer atau real), bisa pakai k Nearest Neighbors atau Neural Networks.
Baikk terima kasih banyak pak..
izin belajar pak
Halo pak untuk video ke 4 yg mana ya
selamat malam pak data deal sama deals-testet dapatnya dari mana ya?
Ada di menu Repository. Cek saja sidebar kiri atas, buka bagian Samples, lalu pilih data
bang ,kalau ini di implementasiin ke excel ada rumusnya ga bang ?
Bisa saja, tapi saya tidak membuat simulasinya di excel 😃
Izin share pak dosen utk mahasiswi saya
Hahaha... pak awink jangan genit-genit di kampus yaa 😂
pak mau nanya ini lanjutanya mana ya kok langsung ke part 7
hehe.. iya, mohon maaf karena waktu itu harus menyesuaikan dengan materi perkuliahan di kampus. Saya belum sempat membuat kelanjutannya lagi.
Pak, kenapa di repository rapidminer saya tidak ada data sama sekali ya, bisa minta datanya pak🙏🏻
itu saya juga pake data dari repositori. Kemungkinan data ga ada itu karena ada error pas memulai Rapidminer. Coba dibuka ulang
Lagi Pak dengan Klasifikasi data menggunakan Algoritma K-NN
Hallo pak, salam kenal
Saya manurung, saya mau tanya dan berdiskusi dengan bapak terkait klasifikasi naive bayes bagaimana ya pak
Terimakasih
silakan mas, kita bisa diskusi di kolom komentar ini ya 🙂👍
@@KuliahInformatika Apakah bapak bisa kontak dengan bapak langsung melalui email atau media lain pak
Terimakasih
bisa ke muhammad.fachrie@staff.uty.ac.id
Selamat siang Pak, Pak mohon pencerahannya Pak tuk Naive Bayes Classifier jika dihadapkan pada data numerik kontinu, Trims Pak
Ada dua pendekatan: cara pertama kita membuat sejumlah kategori utk tiap atribut dengan rentang nilai tertentu, kemudian nilai di tiap atribut dikonversi ke masing2 kategori tersebut, sehingga nilai yang tadinya numerik berubah menjadi kategorik. Pendekatan kedua menggunakan persamaan khusus yang melibatkan nilai mean dan standar deviasi. Selengkapnya bisa dibaca di buku Machine Learning: Tingkat dasar dan lanjut karya Suyanto, atau bisa juga dicari referensi terkait di Google. Semoga membantu ya 😊🙏
@@KuliahInformatika Woaah terima kasih Pak atas pencerahannya. Apakah dua pendekatan tsb jg berlaku utk Chi-Square dan PCA jika digunakan untuk Seleksi Fitur pada data numerik?
@@putridisperindag6986 bisa. Tapi sepengetahuan saya, PCA bukan untuk seleksi fitur, melainkan transformasi fitur. Itu dua hal yang berbeda. CMIIW
Pak maaf, file nya ga ada di deskripsi kah?
File apakah? datasetnya?
@@KuliahInformatika iya datasate pak😂
@@toraogaming1 oh, itu memang ga ada datasetnya
Oh begitu ya, mksh pak
Maaf saya keliru, itu datasetnya pake dari bawaannya rapidminer. Coba ditonton dari awal videonya, di situ saya jelaskan bagaimana menggunakan datasetnya
pak buat video klasifikasi data menggunakan metode K-NN pak, saya masih bingung ini untuk penelitian skripsi saya 😩
Siap, insya Allah
P (hitam |B) harusnya 0,6
Iya betul, saya kurang teliti waktu buat slidenya. Terima kasih atas koreksinya
@@KuliahInformatika sana2🙏
Assalamualaikum pak, request cara mengatasi jika API Twitter error pak 🙏
Wa'alaikumussalaam. Iya, sepertinya memang sudah ada kebijakan baru dari Twitter sejak dibeli Elon Musk, jadi akun2 reguler yang free udah ga bisa download data dari Twitter
Data yang didapat dari mana pak?
Datasetnya bawaan dari rapidminer, sudah tersedia. Bisa dicek di video sebelumnya tentang Decision Tree, di situ saya jelaskan cara menggunakan datanya
probabilitas b sepertinya keliru, bukankah harusnya 6/10 sehingga hasil probabilitasnya adalah 0,60
Iya betul. di situ salah ketik. Terima kasih koreksinya
pak boleh minta kontak bapak tidak? untuk konsultasi
bisa hubungi via email ke muhammad.fachrie@staff.uty.ac.id
pak, bisa joki skripsi tentang naive bayes???
Hehehe... ini beneran nanya nih? jangan pake joki lah. pasti kamu bisa ngerjain sendiri ☺️
@@KuliahInformatika sombong kali
Asallamualaikum,mas izin bertanya,apa saya boleh meminta no wa pribadinya,ada bnyak yg mau saya konsultasikan🙏🙏🙏
Bisa via email: muhammad.fachrie@staff.uty.ac.id
Pak klo mencari materi yg lengkap untuk belajar informatika dari semester 1 sampai semester akhir dmna ya pak?? materi yg mudah untuk dipahami dan sudah bercakupan Global 🙏🙏
kalau channel youtube atau website, saya belum pernah nemu yang komplit dari semester 1 dst. Niatnya sih, channel RUclips Kuliah Informatika ini yang ingin saya jadikan seperti itu, referensi kuliah-kuliah dari semester 1 (meski tidak semua mata kuliah ada di sini nantinya). Tapi kalau untuk materi-materi kuliah tertentu, saya bisa rekomendasikan web punya dosen ITB dan Telkom University berikut ini:
informatika.stei.itb.ac.id/~rinaldi.munir/
suyanto.staff.telkomuniversity.ac.id/ (cek menu Academics)
@@KuliahInformatika Alhamdulillah, terima kasih banyak pak, mudahan rezeki bapak bertambah dan dilancarkan segala urusannya, Btw bapak dosen di universitas mana ya pak?🙏
@@call_me_yuri36 aamiin aamiin aamiin. Terima kasi mas. Saya dosen di Universitas Teknologi Yogyakarta (UTY) 🙂
@@KuliahInformatika salam kenal ya pak🙏 saya Firru asal Pringsewu, Lampung, skrg masih SMK kls 12, niat saya ingin belajar informatika lebih dalam agar nantinya bermanfaat bagi orang banyak apalagi di Era zaman seperti ini lebih harus paham teknologi 🙏😁
@@call_me_yuri36 salam kenal juga mas. Wah, mudah2an bisa kuliah di jurusan informatika ya mas.
mas buat yg vesi knime dung,,,,
Hehe.. saya belum pernah pakai kNime, tapi tampaknya lebih komplit dari Rapidminer 😁
@@KuliahInformatika semoga ya mas, karena knime gratisan,,,hehehe
di menit 6:52 sepertinya itu 6/10 bukan 5/10, karena bola hitam nya ada 6 buah
Yup.. benar.. saya typo saat bikin slidenya.. makasih koreksinya ya 😄
apakah ada rapidminer yg gratis?
Rapidminer itu free kok. Memang di awal diminta membuat akun
Tutorial svm bang
Makasih sarannya.. sementara saya tampung dulu ya 😁🙏
pak minta link dataset
coba ditonton dari awal mas. Itu datasetnya saya pakai yang sudah ada di Rapidminer :)
Terima kasih sangat bermanfaat
Terima kasih kembali 🙂