Data Preparation: Pembersihan Data dari Missing dan Noise, serta Pemilihan Atribut yang Relevan

Поделиться
HTML-код
  • Опубликовано: 6 янв 2025

Комментарии • 59

  • @hasbifirmansyah10
    @hasbifirmansyah10 Год назад +1

    Ketika kuliah gak mudeng mudeng, eh setelah lulus sekian lama dengan mengamati tiap detail penjelasannya dengan pelan pelan baru mudeng Pak 😂😂

  • @nikomangrustini7553
    @nikomangrustini7553 Год назад +1

    Ijin bertanya pak, apakah bisa dibuatkan tutorial preprocessing menggunakan google colabs pak?

    • @RomiSatriaWahono
      @RomiSatriaWahono  Год назад +1

      googling saja mbak, banyak kok, konsep preprocessing itu sama, hanya praktiknya agak beda di tiap tools ..

  • @fandyfirmansyah6707
    @fandyfirmansyah6707 10 месяцев назад

    Izin bertanya pak bagaimana cara Kita tentukan data yang kita punya ini harus kita Reduction baik itu feature selection atau ekstrasi

    • @RomiSatriaWahono
      @RomiSatriaWahono  10 месяцев назад

      pahami konsep data preprocessing yg sudah aku jelaskan

  • @wiwieksuristiyanti7776
    @wiwieksuristiyanti7776 3 года назад

    Terima kasih, Pak Romi... Barokallah selalu buat Pak Romi...

  • @denisutaji2094
    @denisutaji2094 4 года назад

    sangat mencaerahkan, terima kasih Prof.

  • @sitihotijah8129
    @sitihotijah8129 2 года назад

    Pak mau tanya, feature selection untuk cluster bisa menggunakan yg mana ya?
    Saya sdh coba pakai forward selection dengan kmeans dan menggunakan cluster distance performance tp eror
    Mohon pencerahannya

    • @RomiSatriaWahono
      @RomiSatriaWahono  2 года назад

      errornya apa dicek dan dipecahkan sesuai dengan pesan errornya

  • @SUPRIYANTO-od6gt
    @SUPRIYANTO-od6gt 3 года назад

    ijin download materi bapak romi, terima kasih atas ilmunya

  • @SekolahOtodidak
    @SekolahOtodidak 4 года назад

    Terima kasih pak. Untuk buku belajar data mining berbahasa indonesia mulai dari pemula ke mahir, mohon rekomendasinya.

    • @RomiSatriaWahono
      @RomiSatriaWahono  4 года назад

      pakai buku textbooks bahasa inggris saja mqs ... lebih solid dan sistematis... dan juga diupdate terus setiap 3-4 tahun sekali

  • @dukun4310
    @dukun4310 2 года назад

    terima kasih pak Romi, apakah algoritma deep learning seperti ccn dan lstm bisa di impelmentasikan pada aplikasi rapidminer ini.?

  • @efiddwiagustono1254
    @efiddwiagustono1254 3 года назад +1

    pak romi, apakah PCA hanya bisa digunakan untuk data numeric saja? saya coba dengan data nominal ada notif "regular attributes must be of type numeric"

  • @muhammadrusdianto7697
    @muhammadrusdianto7697 4 года назад +3

    Mantaap.. ini nih yg saya tunggu2. Thanks prof. 🙏
    Ditunggu seri selanjutnya.

    • @RomiSatriaWahono
      @RomiSatriaWahono  4 года назад +1

      siap lanjut mas

    • @muhammadrusdianto7697
      @muhammadrusdianto7697 4 года назад +2

      @@RomiSatriaWahono Prof.. file data examination download dimana ya? (1:01:40) gak ada di file romi-dataset.zip dari web romisatriawahono.net/dm/.

  • @KebijaksanaanSejati
    @KebijaksanaanSejati 4 года назад

    Alhamdulilah yg ditunggu sudah muncul mantap Pak Romi

  • @kautsarmuhammad6519
    @kautsarmuhammad6519 4 года назад

    Masih belum ngerti pak untuk istilah over fitting kenapa kurang direkomendasikan. Bisa kasih analogi gak pak?

    • @RomiSatriaWahono
      @RomiSatriaWahono  4 года назад

      dibaca lagi slideku ya mas ... dan didengarkan ulang youtubenya ....

  • @rizalpurnama3535
    @rizalpurnama3535 4 года назад

    Pak mau tanya, sy kan mau nyoba Asosiasi pake fp-grwoth.
    Data transaksi saya seperti ini :
    Nota01 || Sabun
    Nota01 || Handuk
    Nota02 || Handuk
    Nota02 || Sikat
    Saya mau rubah datanya jadi kyak contoh dataset transaksi dari pak Romi, jadi kyak gini .
    Nota. || Sabun || Handuk || Sikat
    Nota01 || 1 || 1 || 0
    Nota02 || 0 || 1 || 1
    Caranya gmn pak, pake operator apa?
    Soalnya sy coba cari d google dan RUclips kesulitan ga bisa Nemu.

    • @RomiSatriaWahono
      @RomiSatriaWahono  4 года назад

      lihat di youtubeku yg sebelumnya deh ... udah aku bahas .. itu tipe data dibuat binominal saja mas ...

  • @payobelajar
    @payobelajar 4 года назад

    terima kasih ilmunya pak romi sangat bermanfaat, izin download materi ya

  • @rizalpurnama3535
    @rizalpurnama3535 4 года назад

    Maap mau tanya lagi pak..
    Pak saya kan mau mining data transaksi untuk mencari hubungan antar barangnya dengan FP-GROWTH.
    Ada 1000 item barang atau ada 1000 kolom di dataset Saya.
    Masalahnya adalah pas kita import dataset, semua type atribut default.nya polynomial, dan Saya kan harus ngerubah ke binominal.
    Pertanyaanya sy ngerubah type atributnya itu emng satu" sesuai sama tutorial pak Romi atau ada cara yang lebih cepat ?
    Kalo ada, pake operator apa pak?
    Sy sudah cari operator Change type Polynomial to Binominal g ada .
    Berhubung ini kolomnya ada banyak bgt, dan butuh makan waktu klo ngerubah satu persatu.

    • @RomiSatriaWahono
      @RomiSatriaWahono  4 года назад

      lha datanya sebenarnya gimana bentuknya? dia bener2 polynominal?

    • @rizalpurnama3535
      @rizalpurnama3535 4 года назад

      @@RomiSatriaWahono datanya mentahnya emng polynomial Pak, contohnya ga cuma 0 dan 1 tapi ada juga 2, 3 dst..
      Klo untuk datanya itu bisa sy preprocessing dulu, tapi untuk penentuan tipe atributnya yng sy bingung,
      Gmn cara ganti ke binominal sekaligus.

    • @RomiSatriaWahono
      @RomiSatriaWahono  4 года назад

      data binominal itu 0 dan 1 atau beli dan tidak .... jangan2 salah data, fp growth itu data transaksi beli dan tidak lho ...

  • @freskarolansa9126
    @freskarolansa9126 3 года назад

    Pak ijin bertanya..Setelah model Kita hasilkan dengan menggunakan Rapidminer apakah bisa Kita deploy ke website atau ke mobile Pak? Mohon penjelasan Pak 🙏
    Terima kasih

    • @RomiSatriaWahono
      @RomiSatriaWahono  3 года назад

      search dengan rapidminer model deployment .. banyak library dan API yg bisa baca model yg dihasilkan rapidminer

  • @suyatnompd6369
    @suyatnompd6369 4 года назад

    Mantap Pak Romi ini yang saya tunggu-tunggu..

  • @christofelgrant6798
    @christofelgrant6798 3 года назад

    halo pak romi, ijin bertanya? apakah ada jawaban dari ketiga soal ujian yang ada di slide?

    • @RomiSatriaWahono
      @RomiSatriaWahono  3 года назад

      coba dijawab dulu ... kirim ke aku via telegram saja hasilnya nanti kita diskusi ...

  • @sukrisno-6331
    @sukrisno-6331 4 года назад

    Izin download ilmunya lagi Pak Romi

  • @ardiantanjung7246
    @ardiantanjung7246 3 года назад

    Terima kasih pak, semoga ada pembahasan text mining^^

    • @RomiSatriaWahono
      @RomiSatriaWahono  3 года назад

      saya bahas di ujung materi lain sepertinya ... coba ditelusuri saja

    • @ardiantanjung7246
      @ardiantanjung7246 3 года назад

      @@RomiSatriaWahono oh setelah saya liat definisi text mining, di wiki. ternyata sudah include (dijelaskan) dalam video ini. terima kasih pak ^^

    • @ardiantanjung7246
      @ardiantanjung7246 3 года назад

      @@RomiSatriaWahono saya mampu mengerjakan tugas 1 ^_^ dalam waktu 1 jam haha

  • @rionorman
    @rionorman 4 года назад

    Pak Romi,
    Saya tanya, terkadang ada data yang memiliki ciri yang sama namun berbeda pada label.
    Misalkan
    No X Y Z Label
    ----------------------------------------
    1. a c e Y
    2. a c e N
    3. a c e N
    apa yang harus dilakukan terhadap data tersebut? Apakah yang nomor 1 dirubah labelnya jadi N karena dominan N pada ciri tersebut?
    Terima Kasih Pak

    • @RomiSatriaWahono
      @RomiSatriaWahono  4 года назад

      hmmmm harusnya dibiarkan saja ... nanri algoritma yg akan memfilter sendiri kondisi itu ....

    • @rionorman
      @rionorman 4 года назад

      @@RomiSatriaWahono baik terima kasih Pak

  • @ydherdn
    @ydherdn 4 года назад

    Terima kasih pa, ijin download Slide nya .. sukses selalu

  • @rionorman
    @rionorman 4 года назад

    Pak Romi,
    Mau tanya lagi, kalo ada 10 feature/ciri apakah semuanya harus digunakan?
    Boleh dipilih beberapa saja?
    Metode apa yang digunakan untuk memilihnya?
    Terima kasih

  • @awosono
    @awosono 3 года назад

    Izin bertanya pak, untuk Data Analyst apakah pembelajarannya hampir sama seperti Data Scientinst kebetulan saya lulusan Ekonomi dan sangat tertarik untuk mempelajari Data Analyst. Terima Kasih

    • @RomiSatriaWahono
      @RomiSatriaWahono  3 года назад

      Banyak naming yg digunakan utk menyebut jobdesc yg dekat, monggi disimak yg 7 tren profesi computing

  • @rizalpurnama3535
    @rizalpurnama3535 4 года назад

    Terimakasih pak Romi atas ilmunya..😊
    Mau tanya pak, itu Folder examination.nya bisa didownload dmn ya pak?
    Soalnya di folder romi-dataset.RAR yng sy download g ada.🙏🏻🙏🏻