02 - Klasifikasi Data dengan Decision Tree pada Aplikasi Rapidminer
HTML-код
- Опубликовано: 4 янв 2025
- Pada video ini kita belajar melakukan klasifikasi data menggunakan salah satu algoritma Machine Learning, yakni Decision Tree. Algoritma tersebut melakukan pembelajaran terhadap data latih (training data) dan menghasilkan pengetahuan (knowledge) berupa pohon keputusan (decision tree). Pada video ini, kita juga membahas algoritma Random Forest yang merupakan bentuk lebih canggih dari Decision Tree yang dapat melakukan klasifikasi data menggunakan sejumlah Decision Tree yang dihasilkan dari data training yang dipecah ke dalam beberapa bagian. Kita menggunakan aplikasi Rapidminer untuk menerapkan model klasifikasi data dengan Decision Tree tersebut.
saya baru liat aplikasi rapidminer ini...dengan tutorial yang bapak sajikan diatas, sangat membantu saya belajar tentang rapidminer, terima kasih pak
Sama2.. terima kasih juga sudah mampir 😁
Keren pak, semoga menjadi amal jariyah buat bapak melalui video ini, sangat bermanfaat sekali
Aamiin ya Allah.. terima kasih doanya
Sejauh ini, penjelasan mas yang paling enak ditangkap dengan bahasa yg humble. Terima kasih ya mas, jadi punya opsi topik riset, sama project tim buat di kantor :D
Alhamdulillaah. Terima kasih kembali.. semoga bermanfaat ya
Penjelasan mudah dipahami
Merasa terbantu sekali
Terimakasih tutorial nya😇
@@Nur_Safitri alhamdulillaah. Semoga bermanfaat
Saya bukan orang kuliahan informatika pak.. tapi saya senang mendengarkan penjelasan bapak.. pertanyaan saya yang sangat awam sebenaenya cuma "misalkan kita ingin mengetahui berapa jumlah berita tentang ABC" begitu .. nyasar ke penjelasan pak dosen yang luar biasa
Alhamdulillaah.. terima kasih sudah berkunjung ya
Terimakasih Pak,
Sangat bermanfaat sekali ilmunya,
sehat selalu Pak..
Aamiin.. Terima kasih untuk dukungan dan doanya ya ^^
Terimakasih penjelasannya pak, sangat bermanfaat untuk saya yang sedang ada tugas kuliah :)
Semoga membantu ya
alhamdulillah...tks pak..
terimakasih pak telah mengurai lipatan kusut prasangka mengenai machine learning wkwk
Yo Saya Telah Kembali😮
penjelasannya sangat mudah diterima,
mohon juga untuk membuat tutorial ML menggunakan tools Orange pak,
terima kasih sebelumnya
terima kasih atas dukungannya 😊
terima kasih pak, sangat membantu sekali penjelasannya
Terima kasih kembali 😊
37:30 izin koreksi pak, itu random forestnya belum diceklis pruning sama prepruningnya, jadi akurasinya bisa terlalu overfitting, dan bisa terlihat dari jumlah cabang pada random forest terlalu banyak dibandingkan decision tree.
Terimakasih banyak atas ilmunya pak, saya jadi lebih paham lagi tentang machine learning berbasis tree.
Ahh.. siap.. terima kasih koreksinya ya
Terima Kasih Pak.
Berguna.
Alhamdulillaah. Terima kasih kembali
Videonya sangat jelas 👍, Untuk optimasi decision tree dengan algoritma genetika, bagaimana penerapannya di rapidminer ? 🙏
wah, pertanyaannya bagus sekali.. Untuk optimasi algoritma ML dengan Algoritma Genetika, bisa pakai operator "Optimize Parameter (Evolutionary)" di Rapidminer. mudah2an saya bisa buatkan tutorialnya nanti, karena playlist video ini masih untuk kegiatan perkuliahan di kampus. Terima kasih feedbacknya
@@KuliahInformatika Terima kasih pak, setelah saya membaca beberapa jurnal, ada yang menggunakan "Optimize Selection" dan "Optimize by Generation" jika boleh bertanya, perbedaan ketiganya apa ya pak ?
@@aguskrisna2668 keduanya itu operator untuk melakukan feature engineering (rekayasa atribut/ kolom). Kalo yg "selection" itu dia melakukan seleksi atribut dan membuang atribut yang tidak berguna (memiliki pengaruh kecil thd klasifikasi), sedangkan yang "generation" itu dia membuat atribut baru dari atribut yang sudah ada menggunakan rumus matematika tertentu misalnya perkalian dua buah atribut, atau perpangkatan suatu atribut, atau rata2 dari sejumlah atribut, dsb.
mohon maaf pak pada menit 34:40 bapak hanya mengaktifkan apply pruning dan apply prepruning pada parameter operator Decision Tree, sedangkan pada parameter random forest tidak, dan bapak mejelaskan kembali hasil result accuracy pada random forest bahwa bapak menerapkan pruning di parameter operator Random Forest di menit 37:40,, jadi saya masih bingung pak wkwk terimakasih
Oh iya mas, di menit 37:40 itu saya keliru ngomongnya.. hehe, mohon maaf. yang bener itu tadi random forest tidak pakai pruning. Sebenarny di menit 34:40 juga saya lupa itu, mestinya random forest saya kasih pruning juga, hehe.. terima kasih atas feedbacknya mas 😄
MasyaaAllah sangat bermanfaat pak,
boleh request algortima machine learning support vector machine (svm) pak?
makasih
Insya Allah mbak.. Setelah ini saya masih akan membahas algoritma Naive Bayes dan Neural Networks. Mudah2an setelah itu bisa membahas tentang SVM. Terima kasih feedbacknya.
Assalamualaikum pak dan terimakasih atas videonya, tolong request pak menggunakan metode svm .
Terimakasih pak , sukses dan sehat terus pak
Wa'alaikumussalaam. Terima kasih atas feedbacknya. Mudah2an dalam 1 atau dua pekan ke depan bisa saya buatkan ya videonya 🙏
@@KuliahInformatika Wah udah dibalas , maaf sebelumnya pak apakah ada kontak yang bisa dihubungi buat tanya" pak. Makasih pak
@@axe5457 bisa ke email saya: muhammad.fachrie@staff.uty.ac.id
Terima kasih pak🙏
terima kasih pak atas videonya.
izin request yang data mining Association/asosiasi pak, seperti fp-growth pak 🙏🙏
OK siap, insya Allah nanti ada. terima kasih atas masukannya
@@KuliahInformatika izin bertanya pak. maaf melenceng dari topik 🙏, topik skripsi saya berhubungan dengan datamining pak. Kalau misalnya studi kasusnya di kantor camat apa bisa ya pak?
@@annissaherman3454 studi kasus bisa dari mana saja mbak, asalkan data yang digunakan memang layak untuk di-mining. Tidak masalah apakah itu kantor desa, kantor kelurahan, atau RT RW sekalipun, asalkan datanya dalam jumlah yang cukup dan layak ditambang, bisa.
Setelah beberapa jam nonton, baru nyadar sepintas mirip ust. Mansur. cara ngomongnya juga
😅😅
Luar biasa penjelasannya mudah dipahami. Jdi tertarik belajar machine learning ni.. apakah aplikasi yang dipakai ini, hanya untuk memodelkan cara kerja machine learning? Ataukah ini sudah bisa dipakai untuk mengaplikasikan machine learning?
Ya, rapidminer bisa dipakai untuk memodelkan ML juga
Bisa juga untuk mengaplikasikan machine learning secara stand alone
Terima kasih Pak
sama2 mas.
mantap penjelasannya, Apakah ada kelas online Pak ?
@@ronggowidhiarto1265 mohon maaf, saya sampai saat ini belum membuka kelas online 🙏
terimakasih atas ilmu yang diberikan pak, cocok untuk saya yang masih awam dibanding menggunakan python. karena bisa menjelaskan soal bagaimana data itu di train dan di test.
izin bertanya pak, pada dasarnya/konsep dari decision tree maupun random forest itu berarti sama ya pak algoritmanya
Ya, decision tree dan random forest itu konsepnya mirip. Bedanya hanya di jumlah tree-nya saja. Kalau decision tree, hanya ada 1 tree, sedangkan di random forest ada banyak tree dan keputusan klasifikasinya diperoleh dari suara terbanyak (majority voting) dari semua tree yang ada.
pak playlist untuk belajar ai ada? sy ingin belajar terurut dimulai dr mana?
Pak izin tanya itu di random forest pruning dan pre-pruning gak di centang ya? Apakah boleh kalau dicengang? Setelah saya baca katanya di random forest jangan di centang pruningnya
Terimakasih
Sama2 🙏
Pak izin bertanya..
untuk mengukur akurasi, apakah perlu menggunakan cross validation atau cukup dengan confussion Matrix saja?
Tergantung jumlah data. Jika jumlah data tergolong kecil, maka gunakan cross validation (direkomendasikan dengan 10-fold), tapi jika jumlah data cukup besar, bisa pakai train-test split biasa. Baik cross validation, maupun train-test split bisa menghasilkan confusion matrix
Mohon izin bertanya pak, mengenai data testing itu diambil dari mana ya pak? karena saya mengelolah data dari kaggle🙏🏻
data testing diambil dari bagian dataset yang kita punya. Jadi begini, misal kita punya dataset dengan jumlah 1000 record, data tsb kita bagi dua, misalnya dengan porsi 70 : 30, yg 70% dipakai sbg data training, yang 30% untuk data testing
izin tanya pak, untuk data training kan data full ya pak? kemudian apakah data testing ini hanya 50% dari data training? seperti itukah pak?
dan pertanyaan kedua, apakah data testing tidak boleh sama dengan data training? jadi diawal di pisah gitu datanya misal saya ada 100 data, 70data intuk training dan 30 data utk testing? terimakasih pak
di awal harus dipisah dulu datanya mbak. misalnya 70% utk data latih, 30% utk data uji. Bisa juga 80:20.
terimakasih bpk sdh berbagi ilmu...ngomong2 bpk sy mau tanya, kalau misal kan saya mau bikin game untuk pendidikan nih, pakai unity engine, trus sy mau bikin game yg bisa ada ML nya. jd ketika dia dimasukkan berbagai input oleh siswa game ini bisa memprediksi karakter yg sesuai untuk siswa, juga bisa memberikan nilai diakhir gitu pak...bisa gak yh? apakah ada cara (programnya bahasa C++) supaya ML bisa dihubungkan ke Engine Unity? apakah aplikasi RapidMiner ini opensource? soalnya mau buat projek akhir skripsi kuliah
bisa. Anda bisa menambahkan kode program untuk menangani machine learningnya di dalam Unity. Sepertinya Unity menggunakan bahasa C#. Anda mungkin bisa menggunakan library ML.NET untuk C#. Silakan cek: dotnet.microsoft.com/en-us/apps/machinelearning-ai/ml-dotnet
@@KuliahInformatika wah terimakasih pak dosen atas jawabannya sangat membantu sekali, sdh sy subscribe
Pa izin bertanya, operator performance itu untuk uji validitas dan realibilitas kan pa?
Bukan, operator performance untuk menguji model klasifikasi dan menghasilkan nilai akurasi
@@KuliahInformatika izin bertanya kembali pa, untuk split/cross validation itu dilakukan sebelum processing data atau sesudah ya pa?
izin bertanya pak, algoritma decision tree yang bapak presentasikan di video itu menggunakan algoritma apa ya pak? C.45 atau bukan?
Iya, yang saya demokan itu C4.5
Assalamualaikum pak, apakah decission tree sama dengan algoritma c4.5?
Wa'alaikumussalaam. C4.5 adalah salah satu teknik dari Decision Tree. Teknik lain dari decision tree misalnya J4.5, ID3, dan CART.
Pakk permisi mau bertanya, semoga dijawab. Saya punya data percepatan sensor getaran untuk klasifikasi kasar halus normal hasil 3D Printing, lebih baik menggunakan metode fuzzy mamdani, sugeno atau decision tree ya?
Saya cenderung pada decision tree jika masalah tersebut adalah klasifikasi. Hanya saja nanti atribut2 yang digunakan pada dataset harus tepat dan representatif terhadap kondisi kasar, halus, dan normal dari hasil print 3D tersebut. Meski demikian, fuzzy mamdani juga bisa digunakan, namun perlu usaha untuk membangun basis pengetahuannya.
jadi saya punya fuzzy inputnya = percepatan, kecepatan, suhu. dan fuzzy outputnya = roughness(kekasaran) hasil cetakan. Jadi tidak masalah saya ambil metode fuzzy sugeno dan mamdani ya pak? @@KuliahInformatika
Malam pak, mau nanya apa yang harus di lakukan kalau proses manual sama pakai rapidnya berbeda? Maksudnya bentuk pohon keputusannya berbeda antara proses manual dengan rapid
sebetulnya tidak masalah ketika manual kita berbeda dengan yang di pohon. banyak sebabnya: mungkin komposisi data training kita beda dgn komposisi yang ada di rapidminer (pengacakannya beda), bisa jadi rumus yang kita pakai ada yang keliru, atau bisa juga karena proses splitting cabangnya beda antara kita dan rapidminer. Rapidminer sudah memiliki prosedur yang optimal untuk menghasilkan model ML. Jadi intinya, ga perlu risau kalo hasil kita beda dgn rapidminer, karena mmg bisa jadi ada settingan yang beda antara kita dengan rapidminer.
@@KuliahInformatika terima kasih banyak pak sudah membantu menjawab, saya pikir sangat berpengaruh jika proses manual dengan pakai tools berbeda
Pak, maaf mau tanya, apakah aplikasi ini apakah bisa menampilkan presentase akurasi menggunakan metode certainty factor pak ? maaf saya masih kurang paham pak.
Certainty Factor pada Sistem pakar ya? sejauh yang saya tahu, rapidminer tidak mendukung untuk sistem pakar dengan metode Certainty Factor.
Pak izin bertanya,
Kenapa pada pohon keputusan itu yang muncul cuman satu atribute saja?
Berarti cuma satu atribut itu saja yang memiliki pengaruh terhadap klasifikasi datanya
Pak mau tanya, smga dibantu 🙏
Pak klo untuk mencari rata2 penggunaan bbm perbulan menggunakan algoritma decision tree, ituu biasanya pke label apa ya pak soalnya ini mau mncri rata2 penggunaannya sja, apakah bisa tdk pakai label?
Kalau hanya mencari nilai rata2, tidak perlu pakai algoritma data mining, cukup pakai operator 'Aggregate' di Rapidminer. Cara penggunaannya bisa dicek di video saya ini: ruclips.net/video/T8c0VoPUWQ8/видео.html
Assalamualaikum pak. Judul saya ttg implementasi decision tree utk klasifikasi status Gizi pada lansia berbasis web. Itu klw codingnya bisa gak pakai BHS PHP pak?
Wa'alaikumussalaam. Algoritma itu bisa diterapkan pada bahasa pemrograman apapun :)
Pak mohon ijin mau tanya,bagaimana cara buat diagram pohon dari analisis chaid yang di mana untuk menggambarkan secara umum dari indikator yang di pake dalam penelitian.
tinggal koneksikan saja konektor 'mod' pada operator CHAID ke konektor 'res' di ujung kanan canvas
pak mau bertanya, untuk mendapatkan label yes atau no -nya itu bagaimana pak? ada ada langkah lain untuk menentukan label tersebut?
Itu manusia yang memberi labelnya sesuai fakta di lapangan. Jadi perlu pengetahuan ketika ingin melabeli suatu data di dalam dataset.
izin bertanya pak, untuk pengklasifikasian apakah featuresnya harus lebih dari 1?
Tidak harus, tapi umumnya kinerjanya akan lebih baik jika featurenya lebih dari 1.
Maaf pak mau bertanya, untuk angka angka yang ada di tangkainya itu darimana nggih? Apakah dari confidence nya?
Itu sebenarnya hasil observasi trial error dari rapidminer. Jadi rapidminer memiliki mekanisme sendiri dalam menentukan titik potong nilai untuk membuat cabang.
Nilai di edge nya itu bukan confidence
Halo pak
Kalo misal pada node 1.1 entropy nya nilainya 0 semua trus
gainnya juga semua sama di angka 0.6358546 misalnya
Perhitungan selanjutnya gmna ya pak
Mohon bantuannya pak 🙏
Pilih salah satu atribut saja yg akan dipakai.
@@KuliahInformatika ob baik pak terimakasih banyak 🙏
pak maaf izin tanya, adakah cara untuk membuat label tersebut jika menggunakan rapidminer?
Membuat label itu kita lakukan sendiri secara manual
Izin bertanya, Pak.
Untuk mendapatkan rule yang ada di pohon keputusannya bagaimana ya, Pak?
Dan untuk menghitung data testing di rapidminernya bagaimana ya, Pak? Karena di bagian hasil hanya data training saja. Terimakasih sebelumnya🙏
Rule itu diperoleh dari hasil learning dari dataset. Untuk menampilkan pohonnya, koneksikan konektor "mod" dari operator "Apply Model" ke result, lalu untuk menampilkan data uji hasil klasifikasi, koneksikan "exa" dari operator "Apply Model" ke result.
Terimakasih atas jawabannya, pak🙏
@@KuliahInformatika Mohon maaf pak, tapi di operator 'apply model' tidak ada konektor 'exa' lalu bagaimana ya pak untuk melihat hasil data testingnya, terimakasih sebelumnya
@@rekhafarikha8651 oh iya, maaf, saya keliru. konektor 'exa' itu ada di operator 'Performance', jadi 'Apply Model' dihubungkan ke 'Performance', nanti dari performance tarik konektor 'exa'
@@KuliahInformatika Maksudnya konektor 'lab' dari apply model dihubungkan ke konektor 'lab' performance, lalu konektor 'exa' performance dihubungkan ke 'result' pak? saya sudah seperti itu tetapi hasil ujinya hanya satu saja. apakah memang 1 saja, hasilnya pak? jika iya, apakah itu data training atau data testing ya, pak? karena dari 92 hanya teruji 28 saja.
jin tanya pak, rapidminer versi berapa pak? sbgian tools yang di video ga ada di apk rapidminer sya
Punya saya versi 9.10. Kalau pakai yg versi terbaru memang ada yang berbeda. Tapi kita bisa tambahkan operator lain lewat menu Extension
Pak.. Mau tanya penentuan atribut apa saja yg digunakan pada training data dasarnya bagaimana?
Maaf, saya kurang paham dengan kalimat pertanyaannya :)
Maaf sy ulangi lagi. Misal kita ambil data dr siswa. Atribut data nya kan misal umur, nilai, dll. Penentuan atributnya itu berdasarkan apa.?
pak mohon maaf, untuk menginstall aplikasi rapidminernya ada link nya tidak ya pak ? atau saran dari bapak🙏
sukses selalu & terimakasih
Sudah saya buatkan videonya di bagian pertama. Silakan cek ruclips.net/video/wyUoq8luvFU/видео.html
Hallo pak mau nanya, saya telah mendapatkan pohon keputusannya, tapi saya bingung cara menjelaskan treenya bang, kira" cara jelaskannya ginmmna bang
Contoh atribut umur knp paling berpengaruh, dan seterusnya sampai dpt keputusannya🙏
Nah, urusan pengaruh itu berarti mulai masuk ke aspek matematis. Singkatnya gini, ada ukuran yang disebut "Information Gain" (IG) atau ada juga yang namanya "Gain Ratio" (GR). Semakin besar nilai IG atau GR dari suatu atribut, maka semakin besar pengaruhnya dalam menentukan klasifikasi data.
Izin bertanya pak. Untuk menghasilkan rule yang IF - THEN itu bagaimana ya? Dan bagaimana cara membaca pohon keputusannya di description tree, terimakasih, sebelumnya
rule IF-THEN itu cukup dengan membaca pohon keputusannya saja, ditelusuri dari atas. misalkan pada pohon keputusan di menit 28:15, kita bisa buat rule seperti ini:
1. IF age > 34.5 AND gender='female' THEN output='no'
2. IF age > 34.5 AND gender='male' AND (payment='cash' OR payment='cheque) THEN output='no'
3. IF age > 34.5 AND gender='male' AND payment='credit card' THEN output='yes'
4. dst..
jadi cukup ditelusuri saja pohonnya mulai dari level paling atas sampai ke bawah. semoga berhasil :)
Salam hormat pak, terima kasih sudah berbagi, berkah di surga, Pak, ijin bertanya jika kita hanya punya 1 data set training tanpa data set testing gimana ya pak? bagaimana cara membuat data testingnya? terima kasih
Kita bisa ambil saja sebagian data dari data training untuk dijadikan sebagai data testing. Di rapidminer, bisa pakai operatot SPLIT. Data training kita set 80% misalnya, 20% lagi dipakai untuk data testing
izin nanya pak, saya punya 3 atribut juga tpi yg kebaca cuma 2 ibaratnya age & gender doang atau age & payment method doang
cara agar semua atribut nya kebaca pas di result tree nya gmna pak?
Itu artinya hanya dua atribut itu saja yang memiliki pengaruh terhadap hasil klasifikasi.
pakk, saya lagi skripsi mau ambil analisis sentimen, kira kira utk algoritma yg cocok itu apa ya pakk, semoga dijawab🥹
Umumnya, penelitian terkait banyak memakai SVM atau Naive Bayes.
Pak pembahasan confusion matix divideo yang mana ya?
Belum ada mbak video yang khusus bahas confusion matrix, mohon maaf.
Pak klo data nya kebanyakan angka, karena untuk menguji apakah tindakan yang diambil untuk penurunan defect benar atau tidak
Bisa juga diselesaikan pakai Decision Tree, dengan algoritma C4.5 yang bisa menangani data numerik
pak rapidminer itu bisa digunakan untuk visualisasi juga atau tidak ya pak ? Terimakasih :)
Bisa, setelah model dijalankan, kita bisa lakukan visualisasi datanya. Nanti di sidebar kiri ada opsi utk visualization (setelah model dijalankan dan menampilkan result)
untuk algoritma random forest apa bisa dibuat untuk prediksi pak ?
@@KuliahInformatika
Mohon izin bertanya pak, dimenit 10.25 pada bagian age dan gender kn ada simbol kuning itu artinya apa yh?
Oh, itu tanda warning, biasanya ada sesuatu yang kurang sesuai. Tapi di video itu saya gak sempat cek apa pesan warningnya 🙏
selamat siang ka, mohon informasi dan petunjuknya untuk mencari nilai AUC pada decision tree pada aplikasi rapidminer bagaimana ya??
pakai operator "Performance (Classification)", nanti pada panel parameter (klik dulu operator performance nya) ada pilihan2 untuk menampilkan metric evaluasi yang diinginkan.
Pak rapidminer sama oranger data mining bagus mana?
Hehehe.. tergantung sih, sebenarnya kalau dari fleksibilitas, enakan Orange. Operatornya lebih kaya. Tapi saya pribadi lebih suka antarmuka Rapidminer. FYI: sebelum pakai Rapidminer, saya dulu pengguna Orange (dulu namanya Orange Canvas). Orange itu basicnya Python, kalau Rapidminer basicnya Java.
ka, untuk menampilkan kurva ROC pada latihan ini bagaimana ya?
Wah, maaf baru sempat balas komennya. Untuk ROC bisa pakai operator "Compare ROC", atau jika mau pakai AUC bisa pakai operator "Performance (Binominal Classification)"
siang ka fahry maaf nih video sangat oke, tp kenapa hasil decision tree pada hasil uji saya labelnya tidak muncul tapi cuma prediksinya aja yang muncul bisa info kan ka? penyebabnya
Labelnya tidak muncul, tetapi hasil prediksinya muncul 😃 mungkin maksudnya data uji yang sudah diklasifikasi tidak muncul ya?
apakah sama dengan isolation forest
Mirip, tapi tujuan penggunaannya berbeda. Random Forest dipakai untuk klasifikasi/ prediksi, sedangkan isolation forest untuk deteksi anomali/ data yang aneh.
hallo pak
saya mau nanya, saya mengalami masalah pas saya mengeksekusinya,langkah"nya sudah benar tetapi pas saya klik proses beberapa atribut tidak muncul pak,bahkan atribut target yang saya pilih tidak muncul tetapi muncul atribut yang lain,🙏
mohon bantuan sarannya mengenai masalah yang salah alami pak🙏
Coba capture workflownya, lalu kirim ke muhammad.fachrie@staff.uty.ac.id
Pak kalau pake dataset sendiri itu cara masukin dataset nya bagaimana ?
bisa. tutorialnya bisa dilihat di sini: ruclips.net/video/pRmTbOdPdBc/видео.html
Insya Allah utk video-video machine learning berikutnya, saya akan pakai data sendiri. ditunggu ya 😊
Pak maaf kalo aplikasi rapidminernya download nya di mana? Terima kasih sebelumnya
cek link ini: my.rapidminer.com/nexus/account/index.html#downloads
Pak izin bertanya
Data saya kena akurasi nya dibawah 50% terus ya pak?
Nah itu banyak sebabnya: datasetnya apakah memadai atau tidak, atributnya representatif untuk klasifikasi atau tidak, pengaturan parameter decision tree sudah tepat atau belum, dsb.
selamat siang pak, tabel keputusanya dari mana yah pak, jika ada tabel keputusan seperti yang bapak praktekan, apakah bisa dikirim pak , terima kasih
Tabel keputusan yang mana ya? Atau mungkin maksudnya pohon keputusan? Kalau iya, itu didapatkan dari proses learning, mempelajari pola dari dataset yang saya sajikan di video.
Mas mau tanya, rapidmainer punya saya kalau import Data setelah klik finish kok tidak bisa kesimpan ya? selalu muncul tulisan "cannot store object at ...." bagaimana cara mengatasinya ya? terimakasih
import data di sini maksudnya membaca data kan? pakainya operator apa?
@@KuliahInformatika Bukan mas, jadi bagian inport data ke repository yang mau dibuat Decision Treenya
@@rafinurhidayat9668 mohon maaf saya lupa membalas komennya. Apakah masalahnya sudah selesai?
@@KuliahInformatika sudah mas, terimakasih
Kenapa rootnya harus age? kenapa ga gender saja jdi kita tahu gender apa saja yg akan menjadi future costumer dan gainnya caranya gimana
Nah, itu hasil perhitungan statistik pakai information gain (IG). Nilai IG ini menentukan atribut mana yang paling signifikan dalam membedakan mana future customer dan mana yang bukan. Tapi mohon maaf, di video ini saya memang belum membahas rinci perhitungannya 😁
@@KuliahInformatika iyaa pak saya baru belajar dan stuck di situ 🥲 masih bingung di bagian perhitungannya
Pak itu data uji sama latih sama ga?
Berbeda. Data latih dan data uji tidak boleh sama. Gampangnya, kalau punya dataset, 70% dipake sebagai data latih, sisanya yang 30% untuk data uji.
masih gak paham itu data uji itu isinya apa, dan yang di uji apa, terus kalo cuma punya satu data pake split data itu untuk apa?
Coba nonton dulu video no. 1 nya 😁 ruclips.net/video/mEwoAV5_dcA/видео.html
@@KuliahInformatika terimakasih banyak pak
kalo 1 dataset memakai 3 classifier cara di rapidminernya bagaimana ya ?
3 classifier itu mau dibandingkan atau mau di-voting? Caranya berbeda.
@@KuliahInformatika mau diibandingkan mas hasilnya apakah di channel ini ada tutorialnya ?
@@arfiantopandu9910 oh, tutorialnya ga ada sih. Tapi kalau mau seperti itu, dari dataset koneksikan ke operator "Multiply", nanti setelah itu kita bisa pakai dataset itu untuk banyak classifier. coba tonton tutorialnya di sini: ruclips.net/video/k6W_IUIyyLY/видео.html&pp=ygUTbXVsdGlwbHkgcmFwaWRtaW5lcg%3D%3D
pak tolong buatkan versi algoritma SVM plisss
C.45 sama decision tree itu sama ga pa???
Iya. C4.5 itu adalah salah satu algoritma dalam decision tree. jadi decision tree itu ada banyak algoritmanya: ID3, C4.5, C5.0, CART, dll
Kak, sebelum decision tree itu saya di minta 1 file dataset dijadikan 25% data training dan 75% nya data testing terlebih dahulu, apakah ada tutorialnya? terimakasih
oya, yang itu belum saya masukkan ke tutorial. Tapi gampang kok, pakai operator "SPLIT DATA", dataset dihubungkan ke opertator Split Data, klik 2 kali operator Split Data, lalu, klik tombol "Entry Data" 2 kali (bagian bawah), kemudian nanti keluar 2 field isian, bagian atas isi dengan 0.75, bagian bawah 0.25, lalu klik OK atau Apply. Setelah itu, hubungkan konektor atas dari operator Split Data ke operator "Decision Tree", kemudian konektor bagian bawahd ari Split Data hubungkan ke operator "Apply Model". Kira2 begitu. Mudah2an membantu 🙂
@@KuliahInformatika Baik Kak Terimakasih, nanti akan saya coba untuk di tugas saya, Terimakasih Kak
@@KuliahInformatika Maaf Kak mengganggu, ini saat di operator apply model tidak bisa, ada notif merah wrong begitu, kira kira apa yang salah ya? Terimakasih Kak
@@dsrama1310 coba diklik tombol warningnya (gambar tanda seru), di situ kita bisa baca apa errornya
@@KuliahInformatika Expected model but received example set, seperti itu Kak, atau file data set nya yang kurang tepat?
Maaf pak, saya ingin tutorial cara web scriping menggunakan metode ini
materi web scrapping berada di luar scope Decision Tree. tapi saya belum punya video dengan topik tersebut.
Kalau nampilin kurva roc gimana ya?
Ada di operator Performance Classification. Klik operatornya, lalu di panel parameter di sebelah kanan, centang saja pilihan ROC
untuk membuat retrivenya gimana ya mas?
retrieve model maksudnya? kalau mau seperti itu, model Decision Tree hasil training disimpan dulu dengan operator "Store Model", kemudian bisa diretrieve di file yang baru untuk mengklasifikasikan data baru yang belum terklasifikasi
@@KuliahInformatika maaf mau tanya lg mas, klau cara implementasikan confusion matrix di rapidminer itu menggunakan Performance bkn ya?
@@wildann492 iya, betul
@@KuliahInformatika sipp membantu skali makasih mas, dan maaf mau tanya lg mas utk menggunakan feature selection pso di rapidminer bisa ga ya?
@@wildann492 bisa, ada operatornya, namanya "Optimize by PSO" kalo saya ndak salah.
Pak, saya boleh izin les privat 1x pertemuan untuk ujian saya?
Silakan DM via email: muhammad.fachrie@staff.uty.ac.id
@@KuliahInformatika baik pak
Bapak, bisa minta link download rapidminernya k🙏🏻
Silakan: altair.com/altair-rapidminer
ini mnenggunkan aplikasi apa??
Ini pakai aplikasi rapidminer. Bisa didownload gratis melalui www.rapidminer.com
@@KuliahInformatika Terimkasih infonya
data saya engga bisa di input
missing label di decision tree
Datasetnya diset dulu labelnya, pakai operator Set Role. Ada video tutorialnya di channel ini
Bener-bener gak ada coding ini?
@@oktragam ngga ada. Rapidminer cukup drag n drop
pak ada no wa
untuk komunikasi bisa via email: muhammad.fachrie@staff.uty.ac.id
Maaf pak izin bertanya, untuk nilai parameters yg digunakan dalam decision tree pada rapidminer itu ada ketentuan nya atau tidak ya pak?
Nilai pada apply pruning dan apply prepruning
Maaf baru sempat membalas. Pada dasarnya nilainya itu dicoba-coba (trial-error), jadi tidak ada patokan baku dalam penentuan nilainya.
@@KuliahInformatika pak, bagaimana jika ada perbedaan antara hasil gain ratio yg d peroleh dari rapidminer dgn perhitungan menggunakan Excel?
@@vinafitriyanti21 pasti ada perbedaan. Kenapa? Karena dari proses split data pasti ada yang tidak sama antara di rapidminer dengan di excel kita. Tidak apa2, yang penting perhitungan kita memang sudah benar
izin bertanya pak metode klasifikasi yang cocok untuk data yang isinya categorical dan numerik apa ya pak?
Naive Bayes bisa, kNN bisa, C4.5 bisa.