Terimakasih banyak atas penjelasannya pak, tapi saya ingin bertanya pada menit ke 51:00 kenapa yang digunakan sebagai parameter untuk mengukur akurasi adalah variabel y_pred? sedangkan baris sebelumnya menggunakan variabel pred untuk melakukan prediction
Mohon maaf, di sini kami memang melakukan kesalahan. Seharusnya proses evaluasi menggunakan variabel prediksi yang relevan. Kalau model menampung hasil prediksi pada variabel pred, maka proses evaluasi juga dikenakan pada variabel pred. Sekali lagi kami mohon maaf ya atas kekeliruan ini. Semoga tidak menyesatkan. Kami jadikan comment ini sebagai pinned message ya, supaya teman2 yang lain bisa turut menyimak dengan lebih mudah. Terima kasih untuk konfirmasi yang sudah dilakukan :)
Terima kasih. Kalau tertarik untuk belajar lebih lanjut, silakan untuk memanfaatkan path data science yang sudah kami rancang. Path data science ini bisa diakses melalui halaman muka dari channel Indonesia Belajar ini 😊🙏
Terima kasih min sudah bikin konten ini, lagi belajar phyon untuk S2, tidak ada background IT sama sekali, trus liat video ini jadi terharuu, lebih jelas neranginnya daripada dosen saya, akhirnya dikit2 pahamm,. Lanjutkan min bikin konten bermanfaat !
Bilamana membutuhkan proses belajar yang lebih sistematis, di channel Indonesia Belajar ini kami juga menawarkan learning path data science. Kesemua video juga bisa diakses secara gratis. Semoga bisa bermanfaat untuk mendukung perjalanan studi mu 😊☕🙏
baguss bangett, semoga sukses teruss pakk akan saya share ke temen2 jurusan saya supaya lebih mengenal tentang Machine Learning, terus berkarya kak, kami menunggu tutorial selanjutnya
Terima kasih ya untuk bantuannya menginformasikan keberadaan dari channel Indonesia Belajar ini ke teman-teman yang lain. Semoga setiap materi pembelajaran yang kami hasilkan ini bisa memberikan manfaat :)
Semoga bermanfaat ya. Saat ini seri workshop nya memang belum lanjut lagi karena sedang mempersiapkan video pembelajaran untuk membangun pondasi data science dulu :)
Semoga bermanfaat ya. Channel Indonesia Belajar ini memang sedang kami fokuskan untuk membahas berbagai topik seputar data science. Pembahasan mulai dari statistika, probabilitas, pengenalan Data Frame, dan juga visualisasi data. Semester depan kami akan menggarap playlist khusus yang berfokus pada machine learning dengan Scikit Learn.
Kalau tertarik dengan topik data science, di channel Indonesia Belajar ini kami menawarkan banyak sekali materi belajar Data Science, termasuk juga beberapa sesi podcast yang menghadirkan banyak data scientist 😊☕
Terima kasih pk.. smoga tambah berkah.. sma markdown nya yg paling atas lupa di jelasin ya pk.. hehe tpi dh mantab nih pk.. skli lagi trimakasih bnyak..
Amin.... Terima kasih untuk doanya. Ikuti terus playlist ini, materi selanjutnya yang sedang dipersiapkan terkait topik visualisasi data dengan plot.ly :)
Kalau tertarik dengan data visualisation, di Channel Indonesia Belajar ini kami menawarkan satu playlist khusus yang membahas visualisasi data dengan Matplotlib secara terstruktur. Mana tahu bisa bermanfaat :)
Mau nanya, kenapa di saya saat ingin melakukan corelasi antar kolom tidak bisa secara otomatis ya? Terdapat error ( kolom spesies berupa objek), jadi harus utak- atik cari cara lain buat nampilin corelasi. Saya menggunakan Jupiter notebook dari vs code tidak bisa melakukan corelasi secara otomatis pada dataset yg terdapat kolom objek ?🙏🏻
Untuk dataset, kebetulan kami saat ini mengandalkan public dataset karena memang mencoba menghindari permasalahan terkait data privacy. Nanti kami coba cari2 public dataset terkait sales ya :)
Pada menit 33:39 itu kolerasi paling kuat ditentukan apa y? Apakah dengan data yang plotnya lebih banyak yang berkumpul dan berdekatan atau seperti apa y min? Maaf saya msh newbie banget tntng data analyst...
Semoga materi pembelajaran dalam video ini dapat memberikan manfaat. Bagikan juga ke teman-teman yang lain ya supaya makin banyak orang yang dapat menikmati manfaatnya :)
Utk kasus data set yg berisi info dr pembacaan sensor yg real time dan kontinyu, kemudian kita mncba forcast data tsb ke depannya seperti apa, tools atau caranya seperti apa ?. Terima kasih
Untuk data dari sensor umumnya akan menyertakan time stamp dengan interval waktu tertentu. Ini akan membentuk data deret waktu atau biasa dikenal sebagai time series data. Terdapat beberapa teknik yang bisa digunakan untuk melakukan time series analysis, salah satunya adalah ARIMA. Teknik ini cukup banyak diterapkan untuk melakukan forecasting.
Di channel Indonesia Belajar ini kami juga menawarkan satu playlist yang secara khusus membahas Machine Learning dari dasar dengan penjelasan yang cukup komprehensif tetapi tetap sederhana, semoga bisa membantu 😊🙏
Mungkin ini sedikit oot pak, tapi dari dulu ada rasa mengganjal. Saat kita sudah melatih ML kita dengan data train kemudian melanjutkan pengetesan dengan data test, kemudian ML digunakan untuk aplikasi/data yg mana pak? Krn data train biasanya menggunakan 75% dari dataset dan data tes menggunakan 25%. Apakah digunakan untuk dataset lain tp dengan kemiripan yg sama dengan dataset yg kita gunakan utk training dan testing?
Dalam implementasi ML, langkah crusial ada pada pengumpulan data untuk melakukan training dan testing. Data tersebut dikumpulkan berdasarkan kasus yang kita miliki. Selanjutnya, dari dataset yang telah kita kumpulkan, barulah kita melakukan proses training model agar model ML tersebut menjadi cerdas dan bisa memecahkan permasalahan yang sedang kita hadapi.
Terima kasih jawabannya pak, akan saya ikutin terus seri ini dan ditunggu update videonya. Dari berbagai kursus yang saya ikutin ttg data science dan ML baru di sini yang menjelaskan dengan detail.
Saya mau tanya kak fungsi dari code ini untuk apa ya? Terima kasih menit ke 41:33 k_range = list(range(1,26)) score = [] for k in range: model_knn=KNeighborsClassifier(n_neighbors=k) # konfigurasi algoritma
Kalau boleh tahu, apakah sebenarnya pernah menggunakan Python? Dan apakah familiar dengan istilah Pythonic atau Idiomatic Python? Kebetulan di sini saya memanfaatkan struktur data list. Kami juga pernah membahas list secara khusus di sini: ruclips.net/video/3Og1xO15HhQ/видео.html
4:10 gak berhasil melakukan perintah "jupyter lab", dia bilang bash: jupyter: command not found ....Selama ini saya masuk via anaconda navigator. Saya lihat hasilnya sama.Apa ada bedanya ya?
Maaf pak saya baru belajar python, Izin Mau Bertanya pada menit ke 51:00 saya mengalami error seperti ini --------------------------------------------------------------------------- TypeError Traceback (most recent call last) in 3 for model in models: 4 y_pred = model.predict(x_test) ----> 5 accuracy = accuracy_score(y_test, y_pred) 6 accuracy_scores.append(accuracy) 7 TypeError: 'list' object is not callable itu kenapa ya pak ?
Pengolahan data berbasis script seperti pada Python dan R memungkinkan kita untuk melakukan audit terhadap proses pengolahan data yang dilakukan. Selain itu proses dokumentasi pun jadi jauh lebih mudah serta memungkinkan untuk melakukan replikasi proses.
Makasih pak atas sharing nya. saya ingin bertanya : 1. Cara efektif menentukan berapa persen data untuk di split jadi data test dan data train? 2. Seberapa besar pengaruh random state, misal saya pilih random state 0, dibandingkan dengan 10, dst. 3. Dalam pemilihan nilai K yang ada di video dipilih nilai k=3, padahal accuracy scorenya kecil pak. apakah itu hanya contoh? kemudian jika didapat bbrp nilai k yang menghasilkan score sama lebih baik kita milih k yg paling sedikit atau bagaimana ya? Terimakasih pak, mohon dijawab hehe
Presentase pembagian training dan testing dataset sebenarnya bergantung pada kondisi dataset nya, tapi sebagian menggunakan prinsip 70:30 untuk training:testing. Terkait random state, ini lebih untuk keperluan replikasi. Kita menginginkan suatu proses acak tetapi kita juga butuh agar proses tersebut bisa direplikasi. Solusinya adalah dengan menerapkan random state atau umum dikenal dengan random seed number.
mau tanya pak, untuk perintah correlation Matrix . class/ target nya kenapa tidak masuk ke matrix, klo misal taget/ class numerik apakh masuk matrik lansung?
pak tolong buatkan mind map belajar dari awal. untuk bidang machine learning, di letakkan halaman beranda nya. youtube. biar orang awan seperti saya dan yg lainya. tidak lompat2 belajarnya. berhubung junlah videonya sudah banyak🙏. terima kasih
Mohon maaf untuk kualitas audio yang kurang optimal. Semoga tidak mengurangi manfaat dari materi yang disampaikan. Pada beberapa video yang kami hasilkan akhir2 ini, kualitas audionya jauh lebih baik :)
terimakasih banyak pak atas penjelasannya, saya mengalami error untuk melihat korelasi nya ValueError: could not convert string to float: 'Iris-setosa'. bagaimana ya pak untuk fix nya?
Dilihat dari pesan error nya, berarti terjadi upaya untuk melakukan konversi data string ke float yang tidak berhasil. Bisa jadi karena nilai yang ingin dikonversi tersebut bukan nilai yang valid. Semisal, kita tidak bisa mengkonversi string "Budi" ke float 😊☕
Kebetulan di channel Indonesia Belajar ini kami belum ada materi pengenalan pemrograman dengan Python. Tetapi, bagi teman2 yang sudah pernah mempelajari pemrograman sebelumnya (dengan bahasa pemrograman apapun selalin Python) dan tertarik untuk mulai mempelajari Python, kami sangat menyarankan untuk mempelajari playlist Pythonic lalu diikuti dengan playlist HackerRank. Semoga bermanfaat :)
@@arifrahmanto6940Oh kalau gitu bisa lanjut ke playlist Pandas, lalu ke Matplotlib, lalu lanjut lagi ke SciKit Learn untuk mempelajari Machine Learning dengan Python :)
Betul mas. Semoga bisa bermanfaat ya. Oh ya, sebenarnya untuk path data science, kami juga sudah buatkan path nya. Bisa diakses pada halaman muka channel Indonesia Belajar 😊🙏
selamat sore pak untuk mau memasuki seri ini harus ikuti tutorial yang mana dulu ya pak ? saya baru bergabung pak, saat ini saya baru menyelesaikan playlist statistika dasar, untuk bahasa python nya saya juga sudah pelajari, terimakasih...
Kalau sudah familiar dengan Python, bisa langsung mempelajari Python Pandas dulu saja :) Path nya lebih kurang seperti ini: - Statistika & Probabilitas Dasar - Statistika inferensi (kalau memang into dengan statistika) - Pythonic (menulis Python Code dengan Idiomatic) - Python Pandas (pengolahan data) - Python Matplotlib (visualisasi data) - Python Scikit-Learn (machine learning)
Ijin bertanya mas, saya punya dataset yang terbagi menjadi 3 bagian yaitu training, validation, dan testing, untuk proses evaluasi model yg saya buat itu menggunakan dataset testing bukan ya?
Untuk setup dengan 3 dataset (training, validation testing), maka proses training akan menggunakan training dataset. Untuk parameter tuning kita akan menggunakan validation dataset. Dan untuk evaluasi performa dari model yang dihasilkan, kita gunakan testing dataset :)
Parameters tuning ini lebih banyak diterapkan pada Deep Learning sih. Kira2 seperti ini gambarannya, saya ambil contoh kasus dengan KNN ya. Pada KNN itu khan kita dapat menentukan berapa jumlah neighbour yang akan diperhitungkan dalam melakukan prediksi. Pertanyaannya adalah, berapa jumlah neighbours yang paling ideal? Untuk tiap kasus tentunya akan sangat variatif sekali. Nah untuk mencari tahu nilai parameter ideal tersebut, kita bisa manfaatkan validation dataset, dan prosesnya dikenal sebagai parameter tuning. Kira2 seperti itu gambaran sederhananya :)
Terimakasih Pak untuk pembelajarannya, namun saya memiliki kendala pak. Untuk analisis komparasi akurasi tiap model, saya tidak bisa run code dikarenakan ada error ('tuple' object is not callable) dan juga ('list' object is not callable). Apakah ada penjelasan terkait error tersebut, pak? terimakasih
misi pak, knp pas saya run bagian Accuracy comparision for various models malah error 'list' object is not callable.. padahal semua syntaxnya sama, cuman saya bedain untuk X_test saya ganti jd x_test
Untuk dataset yang mengandung missing values, kita mesti lakukan penanganan terlebih dahulu. Mekanisme nya bisa macam2. Kami sempat bahas ini di salah satu video yang secara khusus membahas missing values pada dataset. Silakan untuk menyimak video tersebut. Semoga bermanfaat :)
@@belajaridn bang saat saya menginstal git , dia meminta konfigurasi dari text editor pada kotak untuk memilih text editor disitu tidak ada pycharm apa saya harus menginstal VSC atau tidak usah
Untuk menghitung jumlah duplikasi data kok yg tampil datanya 2 yang teratas ini kolom 34 dan 37, bukannya yg duplikasi juga sama dengan kolom 101 dan 102? tp yg tampil hanya 3 kolom, harusnya kan sama 4 kolom yakni 34, 37, 101, dan 142 SepalLengthCm SepalWidthCm PetalLengthCm PetalWidthCm Species 34 4.9 3.1 1.5 0.1 Iris-setosa 37 4.9 3.1 1.5 0.1 Iris-setosa
Assalamualaikum wr wb dan selamat malam. Saya ingin bertanya pak, dalam exploratory data analysis apakah wajib kita mengetahui distribusi probabilitas dari dataset kita contohnya seperti distribusi gausian bernouli dll.? Mohon pencerahannya pak.
@@MAfrizalSeptiansyah Kalau analisis kita mau mendasarkan pada central limit theorem, maka n>=30. Tetapi ini tentunya akan sangat bergantung pada kasus yang kita hadapi.
@@MAfrizalSeptiansyah Maaf, kami terlewat meresponse pertanyaan ini. Jawabannya adalah tergantung pada datasetnya. Tetapi kita bisa memulai langkah awal kita dengan mengambil asumsi bahwa dataset kita berdistribusi normal.
Kebetulan kami tidak menggunakan Windows. Kami pernah buatkan panduan instalasi dan cara menjalankan Jupyter Notebook di Linux, berikut adalah panduannya: ruclips.net/video/kki8mVdARQ0/видео.html
untuk instalasi anaconda di linux ubuntu sudah sucses tp kenapa tidak bisa keluar navigator anaconda. yakni untuk masuk code 'source ~/.bashrc' sudah sampe disini tidak bisa lanjut..mohon bantuannya
Alternatif lain kita bisa menggunakan full path untuk akses. Semisal kita butuh untuk akses Jupyter Notebook, maka kita bisa ketikkan command berikut: ~/anacponda3/bin/jupyter notebook
@@belajaridn docs.anaconda.com/anaconda/install/linux/ sesuai petunjuk yg ada di link ini. setelah sampai 'source ~/.bashrc' tidak bisa lanjut ke command selanjut untuk memunculkan navigator anaconda.
Mas, kenapa saya ga bisa import seaborn ya, selalu error di bagian itu. Kayaknya ada masalah di package bawaan anacondanya deh. Saya cari pencerahan di github ga ketemu, solusi yang pasti.
@@belajaridn tapi sepertinya untuk python 3.9 masih banyak 3rd party yang belum support ya mas. Disini scikit-learn nya dijelaskan belum full release untuk python 3.9 : github.com/scikit-learn/scikit-learn/issues/18621
Ini biasanya dikarenakan path nya belum terdaftar di environmental variables nya Windows. Coba bukan Anaconda prompt saja pada start menu. Nanti bukanya dengan klik kanan dan pilih run as administrator.
Hallo pak, untuk tahapan clustering itu apakah perlu pca/normalisasi? studi kasus yang dipakai adalah data hotspot yang dimana dari dalam data tersebut akan diambil total terjadinya peristiwa hotspot dalam 5 tahun terakhir (pertahun) dari setiap kabupatennya, dalam kasus tersebut terjadi angka jomplang, mohon solusinya pak. Jujur saya sendiri masih sedikit bingung untuk penerapannya, Terma kasih banyak pak 🙏
Untuk clustering agak sedikit berbeda karena termasuk unsupervised learning, sedangkan studi kasus yang kami bahas sejauh ini masih di supervised learning.
@@belajaridn iya pak, untuk video bapak lebih ke supervised learning, jika perbandingan datanya 0-700 lebih baik menggunakan min max/pca pak? Saya bertanya ini karena sedang stuck dan bingung, apakah clustering saya sudah benar atau belum selain itupun Untuk membuktikan akurasi pada clustering biasanya menggunakan apa ya pak?
@@ekkirizkiramadhan3553 kebetulan krn video diatas adalah supervised learning dan pertanyaan agan tentang unsupervised, maka admin tidak mungkin menjawabnya dan mungkin akan dijawab bila sudah ada video ttg unsupervised
pak, saat melakukan git dengan perintah jupyter lab "command not found", tolong pencerahannya, *saya sudah install jupyter melalui anaconda prompt terlebih dahulu
Halo, kak. mau tanya, utk formula untuk memunculkan pie chart sudah saya coba bberapa kali tetappi masih invalid syntax. padahal sudah sama formula seperti di viideo. Sudah saya cari tau problemnya dan sy ulang formulanya jg msh terjadi kesalahan. Kira2 kenapa ya kak? Terimakasih
Penjelasan detail terkait penggunaan Matplotlib untuk visualisasi data termasuk pie chart bisa dipelajari juga di playlist khusus bertopik Matplotlib yang tersedia di channel Indonesia Belajar ini.
@@lashort4067 syukurlah kalau memang bermanfaat. Bagikan juga ke teman-teman yang lain ya supaya makin banyak orang yang dapat menikmati manfaatnya. Dataset titanic juga cukup menarik bagi kami, hanya saja kami masih perlu menggodok materi apa saja yang sekiranya cocok untuk dibahas dengan dataset ini :)
Makasih Kak untuk videonya. Untuk modul python yang berisi model-model ML, apakah model-model tersebut algoritmnya sudah optimum dalam memberikan hasil? Terimakasih :)
Model2 yang disertakan dalam Scikit Learn adalah model2 yang cukup umum digunakan untuk menunjang research mas. Dan karena Scikit Learn sendiri bersifat Open Source, maka ada banyak orang yg terus berkontribusi meningkatkan performa nya :)
Alhamdulillah kalau memang sudah berhasil, terus semangat ya untuk mempelajari topik data dengan Python. Kami juga memiliki satu playlist khusus yang membahas topik Python Pandas dan juga Matplotlib.
Pak mau tanya , apakah model ini bisa kami langsung gunakan untuk jenis data yang lain? Misal saya pakai untuk explorasi data penjualan atau penelitian? Mohon penjelasan nya
Tahapan umum dari EDA atau Exploratory Data Analysis nya lebih kurang akan mirip seperti ini. Tetapi prediction model yang akan diterapkan tentunya mesti memperhatikan Karakteristik dari datanya. Kebetulan di channel Indonesia Belajar ini kami juga menawarkan seri belajar Machine Learning di mana kami mencoba memperkenalkan sejumlah model Machine Learning yang umum digunakan.
Untuk data image, kita mesti explorasi dengan Computer Vision dan biasanya juga mengarah ke penerapan Deep Artificial Neural Networks atau kadang dikenal sebagai Deep Learning 😊🙏☕
Oh ya ada kesalahan pada video kami di saat pembandingan performa model. Semestinya variable yang digunakan untuk menampung hasil prediksi adalah y_pred dan bukannya pred. Revisi sudah kami lakukan pada file Notebook di repository kami.
maaf ka, kenapa saya git clone di git bash jadinya gini "fatal: could not create work tree dir 'kaggle_explorations': Permission denied" tolong bantuannya ka, terima kasih
Kalau permission denied berarti ada permasalahan hak akses dari User yang dirimu gunakan untuk menjalankan git di komputer :) Pastikan untuk melakukan clone di home directory milik user yang dirimu gunakan dan bukan di sembarang directory :)
Untuk data science saat ini ada dua tools yang umum digunakan: R dan Python. Keduanya menjadi standard di Kaagle (komunitas data science terbesar saat ini).
Korelasi itu hubungan atau keterkaitan antar variable. Sebagai contoh untuk kasus property atau perumahan. Variabel harga rumah dan variabel luas rumah bisa dibilang berkorelasi; di mana kenaikan nilai untuk variabel luas rumah tentunya akan diikuti dengan kenaikan nilai pada variabel harga rumah. Dalam hal ini korelasinya adalah korelasi positif.
@@gladyneberlianalifzago3457 Nilai dari korelasi itu antara -1 sampai dengan 1. Nilai -1 mengindikasikan korelasi negatif yang sangat kuat, nilai 1 mengindikasikan korelasi positif yang sangat kuat, dan nilai 0 mengindikasikan tidak ada korelasi sama sekali.
Terimakasih banyak atas penjelasannya pak, tapi saya ingin bertanya pada menit ke 51:00 kenapa yang digunakan sebagai parameter untuk mengukur akurasi adalah variabel y_pred? sedangkan baris sebelumnya menggunakan variabel pred untuk melakukan prediction
Mohon maaf, di sini kami memang melakukan kesalahan. Seharusnya proses evaluasi menggunakan variabel prediksi yang relevan.
Kalau model menampung hasil prediksi pada variabel pred, maka proses evaluasi juga dikenakan pada variabel pred. Sekali lagi kami mohon maaf ya atas kekeliruan ini. Semoga tidak menyesatkan.
Kami jadikan comment ini sebagai pinned message ya, supaya teman2 yang lain bisa turut menyimak dengan lebih mudah.
Terima kasih untuk konfirmasi yang sudah dilakukan :)
Terimakasih kembali pak 🙏
yang variabel pred yang mana ya? saya belum paham.
File notebook yang di Github sudah saya update dan sudah tidak lagi ditemui kesalahan.
yang kusuka Dari channel ini adalah penjelasan dan suaranya sangat jelas... tidak ada back sound yang menganggu
Terima kasih untuk apresiasinya 😊☕🙏
Modul pembelajarannya mantaap sekalii. Saya yg baru pertama kali belajar ini, sgt terbantu oleh modul yg diberikan
Terima kasih. Kalau tertarik untuk belajar lebih lanjut, silakan untuk memanfaatkan path data science yang sudah kami rancang. Path data science ini bisa diakses melalui halaman muka dari channel Indonesia Belajar ini 😊🙏
Semangat buat video. You are the hero indonesia need
Terima kasih :)
Tetap semangat memberikan ilmu buat anak-anak Indonesia Pak. Tuhan memberkati.
Siap, mohon dukungannya selalu :)
channel underrated, harusnya yg kaya gini2 yg viral
He3 gak apa mas, pelan2 saja.
Mohon bantuannya untuk membagikan channel Indonesia Belajar ini ke teman-teman yang lain ya :)
Setuju banget!
Terima kasih min sudah bikin konten ini, lagi belajar phyon untuk S2, tidak ada background IT sama sekali, trus liat video ini jadi terharuu, lebih jelas neranginnya daripada dosen saya, akhirnya dikit2 pahamm,. Lanjutkan min bikin konten bermanfaat !
Bilamana membutuhkan proses belajar yang lebih sistematis, di channel Indonesia Belajar ini kami juga menawarkan learning path data science. Kesemua video juga bisa diakses secara gratis. Semoga bisa bermanfaat untuk mendukung perjalanan studi mu 😊☕🙏
baguss bangett, semoga sukses teruss pakk
akan saya share ke temen2 jurusan saya supaya lebih mengenal tentang Machine Learning,
terus berkarya kak, kami menunggu tutorial selanjutnya
Terima kasih ya untuk bantuannya menginformasikan keberadaan dari channel Indonesia Belajar ini ke teman-teman yang lain. Semoga setiap materi pembelajaran yang kami hasilkan ini bisa memberikan manfaat :)
ternyata ada yang versi indonesianya. thank youu kaaa
auto subscribe
Semoga bermanfaat ya. Saat ini seri workshop nya memang belum lanjut lagi karena sedang mempersiapkan video pembelajaran untuk membangun pondasi data science dulu :)
@@belajaridn okaydeh siaappp kaaa. ditunggu videonya kaaa :D
terimakasih sudah berbagi pak, semangat!
Senang bisa membantu :)
Bagikan juga ke teman-teman yang lain ya, supaya makin banyak orang yang dapat menikmati manfaatnya.
Siap Belajarrrrrr
Tetap semangat masbro :)
astaga, nemu versi Indonesia
bagus pula
TERIMA KASIH ADMIN:)))
Semoga bermanfaat ya. Channel Indonesia Belajar ini memang sedang kami fokuskan untuk membahas berbagai topik seputar data science. Pembahasan mulai dari statistika, probabilitas, pengenalan Data Frame, dan juga visualisasi data. Semester depan kami akan menggarap playlist khusus yang berfokus pada machine learning dengan Scikit Learn.
@@belajaridn semangat miin!
mantap penjelasannya...
Terima kasih, semoga bermanfaat ya :)
Terimakasih banyak
Sama-sama, semoga bermanfaat :)
Mantapp jiwaaa channelnya, auto subscribe
Kalau tertarik dengan topik data science, di channel Indonesia Belajar ini kami menawarkan banyak sekali materi belajar Data Science, termasuk juga beberapa sesi podcast yang menghadirkan banyak data scientist 😊☕
@@belajaridn keren channelnya, lengkap bgt, baru belajar data, nemu channel ini bahagia sekalee, terimakasih sudah mau berbagi 🙇🙇
Sama-sama, senang bisa menghasilkan materi ajar berkualitas 😊🙏☕
Mantap
Semoga memberikan manfaat :)
terima kasih sudah berbagi
Terima kasih pk.. smoga tambah berkah.. sma markdown nya yg paling atas lupa di jelasin ya pk.. hehe tpi dh mantab nih pk.. skli lagi trimakasih bnyak..
Amin.... Terima kasih untuk doanya. Ikuti terus playlist ini, materi selanjutnya yang sedang dipersiapkan terkait topik visualisasi data dengan plot.ly :)
Time stamp
Data visualisation: 20:50 - 34:45
Kalau tertarik dengan data visualisation, di Channel Indonesia Belajar ini kami menawarkan satu playlist khusus yang membahas visualisasi data dengan Matplotlib secara terstruktur. Mana tahu bisa bermanfaat :)
@@belajaridn wah makasih mas. Saya tertarik belajar data dari chanell ini
Silakan mas, semoga materi yang disampaikan bisa bermanfaat 😊☕🙏
auto subscribe!
Semoga video2 pembelajaran yang kami hasilkan bisa bermanfaat ya :)
bagus gan terusin hehehe klu bs yg lbh kompleks mas masalahnya biar seru
di tunggu tutorial machine learning selanjutnya pak :D
Siap... Bantu share ke teman-teman yang lain juga ya.. :)
Terima kasih mas :)
Sama-sama, semoga bermanfaat ya :)
Makasih pak
Sama-sama, semoga bermanfaat ya... :)
Ditunggu video selanjutnya pak
@@tioriswanto1449 siap :)
Mau nanya, kenapa di saya saat ingin melakukan corelasi antar kolom tidak bisa secara otomatis ya?
Terdapat error ( kolom spesies berupa objek), jadi harus utak- atik cari cara lain buat nampilin corelasi.
Saya menggunakan Jupiter notebook dari vs code tidak bisa melakukan corelasi secara otomatis pada dataset yg terdapat kolom objek ?🙏🏻
kereeeen, tapi bisa request gak contoh datasetnya lebih ke data Retail sales, biar ke bayang aja gitu implementasinya bagaimana Jika dalam real nya
Untuk dataset, kebetulan kami saat ini mengandalkan public dataset karena memang mencoba menghindari permasalahan terkait data privacy. Nanti kami coba cari2 public dataset terkait sales ya :)
@@belajaridn oke mas, di kaggle banyak sih sample dataset yg bisa di download , lengkap udah csv udash rapih gag perlu cleaning ,, mkasih masss
Pada menit 33:39 itu kolerasi paling kuat ditentukan apa y? Apakah dengan data yang plotnya lebih banyak yang berkumpul dan berdekatan atau seperti apa y min? Maaf saya msh newbie banget tntng data analyst...
ka, terimakasih ilmunya...saya ikuti dari awal, dan ada kendala di bagian poin [16] Correlation Matrix.
mohon pencerahannya
Ditunggu Upload Text miningnya Bang, Kebetulan skripsi saya ttg analisis sentimen
Semoga materi pembelajaran dalam video ini dapat memberikan manfaat. Bagikan juga ke teman-teman yang lain ya supaya makin banyak orang yang dapat menikmati manfaatnya :)
Utk kasus data set yg berisi info dr pembacaan sensor yg real time dan kontinyu, kemudian kita mncba forcast data tsb ke depannya seperti apa, tools atau caranya seperti apa ?. Terima kasih
Untuk data dari sensor umumnya akan menyertakan time stamp dengan interval waktu tertentu. Ini akan membentuk data deret waktu atau biasa dikenal sebagai time series data. Terdapat beberapa teknik yang bisa digunakan untuk melakukan time series analysis, salah satunya adalah ARIMA. Teknik ini cukup banyak diterapkan untuk melakukan forecasting.
Kpn dan pd kasus apa kita harus memilih model algoritma ML yaitu antara supervised dan unsupervised?
Di channel Indonesia Belajar ini kami juga menawarkan satu playlist yang secara khusus membahas Machine Learning dari dasar dengan penjelasan yang cukup komprehensif tetapi tetap sederhana, semoga bisa membantu 😊🙏
Mungkin ini sedikit oot pak, tapi dari dulu ada rasa mengganjal. Saat kita sudah melatih ML kita dengan data train kemudian melanjutkan pengetesan dengan data test, kemudian ML digunakan untuk aplikasi/data yg mana pak? Krn data train biasanya menggunakan 75% dari dataset dan data tes menggunakan 25%. Apakah digunakan untuk dataset lain tp dengan kemiripan yg sama dengan dataset yg kita gunakan utk training dan testing?
Dalam implementasi ML, langkah crusial ada pada pengumpulan data untuk melakukan training dan testing. Data tersebut dikumpulkan berdasarkan kasus yang kita miliki. Selanjutnya, dari dataset yang telah kita kumpulkan, barulah kita melakukan proses training model agar model ML tersebut menjadi cerdas dan bisa memecahkan permasalahan yang sedang kita hadapi.
Terima kasih jawabannya pak, akan saya ikutin terus seri ini dan ditunggu update videonya. Dari berbagai kursus yang saya ikutin ttg data science dan ML baru di sini yang menjelaskan dengan detail.
Syukurlah kalau memang bisa bermanfaat. Kami jadi makin semangat nih :)
Saya mau tanya kak fungsi dari code ini untuk apa ya? Terima kasih menit ke 41:33
k_range = list(range(1,26))
score = []
for k in range:
model_knn=KNeighborsClassifier(n_neighbors=k) # konfigurasi algoritma
Kalau boleh tahu, apakah sebenarnya pernah menggunakan Python? Dan apakah familiar dengan istilah Pythonic atau Idiomatic Python?
Kebetulan di sini saya memanfaatkan struktur data list. Kami juga pernah membahas list secara khusus di sini: ruclips.net/video/3Og1xO15HhQ/видео.html
4:10 gak berhasil melakukan perintah "jupyter lab", dia bilang bash: jupyter: command not found
....Selama ini saya masuk via anaconda navigator. Saya lihat hasilnya sama.Apa ada bedanya ya?
Sama saja sih, bisa via Anaconda navigator juga :)
Maaf pak saya baru belajar python, Izin Mau Bertanya pada menit ke 51:00 saya mengalami error seperti ini
---------------------------------------------------------------------------
TypeError Traceback (most recent call last)
in
3 for model in models:
4 y_pred = model.predict(x_test)
----> 5 accuracy = accuracy_score(y_test, y_pred)
6 accuracy_scores.append(accuracy)
7
TypeError: 'list' object is not callable
itu kenapa ya pak ?
Di sini memang terdapat kekeliruan pada video. Silakan untuk melihat pinned comment.
Kelebihan dan kekurangan EDA menggunakan phyton dibandingkan SPSS apa saja ya Kak? mohon pencerahannya
Pengolahan data berbasis script seperti pada Python dan R memungkinkan kita untuk melakukan audit terhadap proses pengolahan data yang dilakukan. Selain itu proses dokumentasi pun jadi jauh lebih mudah serta memungkinkan untuk melakukan replikasi proses.
@@belajaridn Terimakasi pencerahannya. Sukses selalu Kakk
@@hafniamaliajuniarti6847 Sama2, semoga bermanfaat ya :)
Makasih pak atas sharing nya. saya ingin bertanya :
1. Cara efektif menentukan berapa persen data untuk di split jadi data test dan data train?
2. Seberapa besar pengaruh random state, misal saya pilih random state 0, dibandingkan dengan 10, dst.
3. Dalam pemilihan nilai K yang ada di video dipilih nilai k=3, padahal accuracy scorenya kecil pak. apakah itu hanya contoh? kemudian jika didapat bbrp nilai k yang menghasilkan score sama lebih baik kita milih k yg paling sedikit atau bagaimana ya?
Terimakasih pak, mohon dijawab hehe
Presentase pembagian training dan testing dataset sebenarnya bergantung pada kondisi dataset nya, tapi sebagian menggunakan prinsip 70:30 untuk training:testing.
Terkait random state, ini lebih untuk keperluan replikasi. Kita menginginkan suatu proses acak tetapi kita juga butuh agar proses tersebut bisa direplikasi. Solusinya adalah dengan menerapkan random state atau umum dikenal dengan random seed number.
Pemilihan nilai K pada video ini hanya sekadar contoh saja :)
mau tanya pak, untuk perintah correlation Matrix . class/ target nya kenapa tidak masuk ke matrix, klo misal taget/ class numerik apakh masuk matrik lansung?
Target prediction nya bisa juga disertakan dalam correlation matrix bilamana dibutuhkan.
@@belajaridn terima kasih pak
pak tolong buatkan mind map belajar dari awal. untuk bidang machine learning, di letakkan halaman beranda nya. youtube. biar orang awan seperti saya dan yg lainya. tidak lompat2 belajarnya. berhubung junlah videonya sudah banyak🙏. terima kasih
Bisa mengikuti path data science mas, di channel Indonesia Belajar ini materi dimulai dari statistika deskriptif 😊☕🙏
@@belajaridn siap terima kasih pak
Baguus tapi suaranya kecil, semoga bisa diperbaiki
Mohon maaf untuk kualitas audio yang kurang optimal. Semoga tidak mengurangi manfaat dari materi yang disampaikan.
Pada beberapa video yang kami hasilkan akhir2 ini, kualitas audionya jauh lebih baik :)
terimakasih banyak pak atas penjelasannya, saya mengalami error untuk melihat korelasi nya ValueError: could not convert string to float: 'Iris-setosa'. bagaimana ya pak untuk fix nya?
Dilihat dari pesan error nya, berarti terjadi upaya untuk melakukan konversi data string ke float yang tidak berhasil. Bisa jadi karena nilai yang ingin dikonversi tersebut bukan nilai yang valid. Semisal, kita tidak bisa mengkonversi string "Budi" ke float 😊☕
Min klo mau belajar python secara bertahap di chanel ini bisa dari playlist mana dulu ya urutannya?
Kebetulan di channel Indonesia Belajar ini kami belum ada materi pengenalan pemrograman dengan Python. Tetapi, bagi teman2 yang sudah pernah mempelajari pemrograman sebelumnya (dengan bahasa pemrograman apapun selalin Python) dan tertarik untuk mulai mempelajari Python, kami sangat menyarankan untuk mempelajari playlist Pythonic lalu diikuti dengan playlist HackerRank. Semoga bermanfaat :)
@@belajaridn setelah hackerrank min? Kebetulan saya sudah ada basic python
@@arifrahmanto6940Oh kalau gitu bisa lanjut ke playlist Pandas, lalu ke Matplotlib, lalu lanjut lagi ke SciKit Learn untuk mempelajari Machine Learning dengan Python :)
@@belajaridn Saya rekap ya min, berarti secara urutan :
Pythonic -> HackerRank -> Pandas -> Matplotlib -> SciKit Learn
begitu ya?
Betul mas. Semoga bisa bermanfaat ya. Oh ya, sebenarnya untuk path data science, kami juga sudah buatkan path nya. Bisa diakses pada halaman muka channel Indonesia Belajar 😊🙏
selamat sore pak untuk mau memasuki seri ini harus ikuti tutorial yang mana dulu ya pak ? saya baru bergabung pak, saat ini saya baru menyelesaikan playlist statistika dasar, untuk bahasa python nya saya juga sudah pelajari, terimakasih...
Kalau sudah familiar dengan Python, bisa langsung mempelajari Python Pandas dulu saja :)
Path nya lebih kurang seperti ini:
- Statistika & Probabilitas Dasar
- Statistika inferensi (kalau memang into dengan statistika)
- Pythonic (menulis Python Code dengan Idiomatic)
- Python Pandas (pengolahan data)
- Python Matplotlib (visualisasi data)
- Python Scikit-Learn (machine learning)
@@belajaridn baik pak terimakasih pak
Sama-sama, tetap semangat belajar ya :)
Ijin bertanya mas, saya punya dataset yang terbagi menjadi 3 bagian yaitu training, validation, dan testing, untuk proses evaluasi model yg saya buat itu menggunakan dataset testing bukan ya?
Untuk setup dengan 3 dataset (training, validation testing), maka proses training akan menggunakan training dataset. Untuk parameter tuning kita akan menggunakan validation dataset. Dan untuk evaluasi performa dari model yang dihasilkan, kita gunakan testing dataset :)
@@belajaridn untuk prameter tuning itu kinerjanya gmn ya mas? Saya masih bingung bagian ini
Parameters tuning ini lebih banyak diterapkan pada Deep Learning sih. Kira2 seperti ini gambarannya, saya ambil contoh kasus dengan KNN ya. Pada KNN itu khan kita dapat menentukan berapa jumlah neighbour yang akan diperhitungkan dalam melakukan prediksi. Pertanyaannya adalah, berapa jumlah neighbours yang paling ideal? Untuk tiap kasus tentunya akan sangat variatif sekali. Nah untuk mencari tahu nilai parameter ideal tersebut, kita bisa manfaatkan validation dataset, dan prosesnya dikenal sebagai parameter tuning. Kira2 seperti itu gambaran sederhananya :)
@@belajaridn Oh begitu ya mas, terimakasih jawabannya sangat membantu 👍
@@newsinfosport7039 Sama-sama, senang bisa membantu :)
Terimakasih Pak untuk pembelajarannya, namun saya memiliki kendala pak. Untuk analisis komparasi akurasi tiap model, saya tidak bisa run code dikarenakan ada error ('tuple' object is not callable) dan juga ('list' object is not callable). Apakah ada penjelasan terkait error tersebut, pak? terimakasih
ini video 4 tahun lalu bang,mungkin udh ada perubahan di code?kurang tau jga si
@@shizume12 trus bagaimana bang sudah ada solusinya?
tanya kak, saya gabisa pake .corr karena species yang masih string
terus saya drop. apa ada solusi lain?
numpang tanya pak! apa yang harus saya pelajari sebelum belajar Machine Learning. terimakasih
Dasar statistika inferensi dan juga pemrograman Python bisa jadi pondasi yang baik untuk melangkah ke area Machine Learning dan juga Data Science :)
misi pak, knp pas saya run bagian Accuracy comparision for various models malah error 'list' object is not callable.. padahal semua syntaxnya sama, cuman saya bedain untuk X_test saya ganti jd x_test
Coba kalau disamakan persis apakah error nya masih muncul?
@@belajaridn saya coba copas pun sama ajh pak
Pak kan jika ingin ngerun split data, dataset kita tidak boleh ada yg null ya, cara merubah agar tidak null gimana ya?
Untuk dataset yang mengandung missing values, kita mesti lakukan penanganan terlebih dahulu. Mekanisme nya bisa macam2. Kami sempat bahas ini di salah satu video yang secara khusus membahas missing values pada dataset. Silakan untuk menyimak video tersebut. Semoga bermanfaat :)
terimaksih, sangat bermanfaat.
ada ig nya gak pak ?
Sama-sama, senang bisa membantu. Untuk IG kami kurang aktif, lebih aktif di Twitter.
pakk mau nanya " drop() got an unexpected keyword argument 'implace' " ini kenapa ya
Karena tidak ada parameter implace mas, yang ada inplace.
@@belajaridn ohh iya typo pak wkwk, terimakasih pa telah menjawab
Sama-sama :)
Bang tolong buat tutorianya dengan windows dong bang
Jupyter Notebook bisa dijalankan baik di Windows, Mac OS, dan Linux :) Kebetulan saya sudah meninggalkan Windows sejak 2013.
Pak , kenapa saya tidak bisa memanggil jupiter lab dari hit Bash? Keterangan nya "command not found" . Terima kasih
Apakah Anaconda sudah terinstall?
Coba lakukan pemanggilan command jupyter lab melalui Anaconda. Oh ya kalau boleh tahu OS apa yang digunakan?
@@belajaridn saya sudah menginstal anaconda di laptop saya.saya menggunakan windows . Terima kasih
Kalau menggunakan Windows, coba akses Anaconda prompt. Dari situ, coba ketikan jupyter lab.
Pak belajar pada part satu satu ini apa harus menggunakan Jupiter lab saja atau bisa menggunakan Jupiter notebook juga?
Bisa menggunakan Jupyter Notebook juga :)
@@belajaridn bang saat saya menginstal git , dia meminta konfigurasi dari text editor pada kotak untuk memilih text editor disitu tidak ada pycharm apa saya harus menginstal VSC atau tidak usah
Ini di Windows? Kalau di Windows bisa pakai notepad saja. Kalau di Linux bisa pakai Vim atau NeoVim.
@@belajaridn yaa kak, ini di windows tapi saya belum menginstall notepad++ yang ada cuma notepad text editor
Bisa gunakan notepad saja.
Untuk menghitung jumlah duplikasi data kok yg tampil datanya 2 yang teratas ini kolom 34 dan 37, bukannya yg duplikasi juga sama dengan kolom 101 dan 102? tp yg tampil hanya 3 kolom, harusnya kan sama 4 kolom yakni 34, 37, 101, dan 142
SepalLengthCm SepalWidthCm PetalLengthCm PetalWidthCm Species
34 4.9 3.1 1.5 0.1 Iris-setosa
37 4.9 3.1 1.5 0.1 Iris-setosa
Assalamualaikum wr wb dan selamat malam. Saya ingin bertanya pak, dalam exploratory data analysis apakah wajib kita mengetahui distribusi probabilitas dari dataset kita contohnya seperti distribusi gausian bernouli dll.?
Mohon pencerahannya pak.
Tergantung kebutuhan, karena pada umumnya akan diasumsikan distribusinya normal distribution.
Diasumsikan distribusi normal jika data > 30.?
@@MAfrizalSeptiansyah Kalau analisis kita mau mendasarkan pada central limit theorem, maka n>=30. Tetapi ini tentunya akan sangat bergantung pada kasus yang kita hadapi.
@@belajaridn
Jadi, lebih baik kalo kita asumsikan data kita berdistribusi normal apapun kasusnya.?
@@MAfrizalSeptiansyah Maaf, kami terlewat meresponse pertanyaan ini. Jawabannya adalah tergantung pada datasetnya. Tetapi kita bisa memulai langkah awal kita dengan mengambil asumsi bahwa dataset kita berdistribusi normal.
cara panggil jupyter di git bash untuk W10 bagaimana ya? terima kasih
Kebetulan kami tidak menggunakan Windows. Kami pernah buatkan panduan instalasi dan cara menjalankan Jupyter Notebook di Linux, berikut adalah panduannya: ruclips.net/video/kki8mVdARQ0/видео.html
@@belajaridn ada alternatif lain ga Mas? kebetulan saya baru belajar dan belum berani pindah ke Linux
Di Windows kalau tidak salah ada Anaconda prompt, mestinya bisa diakses menggunakan itu.
alhamdulilah udah solve
Alhamdulillah 😊👍
Terus semangat dalam belajar dan mengembangkan kompetensi diri ya 😊
untuk instalasi anaconda di linux ubuntu sudah sucses tp kenapa tidak bisa keluar navigator anaconda. yakni untuk masuk code 'source ~/.bashrc' sudah sampe disini tidak bisa lanjut..mohon bantuannya
Alternatif lain kita bisa menggunakan full path untuk akses. Semisal kita butuh untuk akses Jupyter Notebook, maka kita bisa ketikkan command berikut:
~/anacponda3/bin/jupyter notebook
@@belajaridn terimakasih, tp untuk menampilkan jupyterlabnya blm bisa
Kalau boleh tahu, command apa yang digunakan?
@@belajaridn docs.anaconda.com/anaconda/install/linux/ sesuai petunjuk yg ada di link ini. setelah sampai 'source ~/.bashrc' tidak bisa lanjut ke command selanjut untuk memunculkan navigator anaconda.
Bisa perlihatkan isi dari file ~/.bashrc? Khususnya terkait path ke directory Anaconda.
disini tulisannya 'jupyter' is not recognized as an internal or external command, operable program or batch file.
Ini OS nya apa ya?
@@belajaridn kalau windows 10 gimana kak ?
Kebetulan kami sudah 8 tahun tidak pernah menggunakan Windows. Coba mengacu ke dokumentasi dari Anaconda saja.
@@belajaridn itu pengerjaannya pake OS apa kak?
Kami menggunakan Linux. Untuk sesi workshop ini kami menggunakan Manjaro Linux.
Mas, kenapa saya ga bisa import seaborn ya, selalu error di bagian itu. Kayaknya ada masalah di package bawaan anacondanya deh. Saya cari pencerahan di github ga ketemu, solusi yang pasti.
Apakah Seaborn sudah terinstal?
@@belajaridn Sudah mas. Tapi udah solved, akhirnya saya uninstall condanya, install python 3.9.1, pake pip aja.
Syukurlah kalau sudah berhasil. Alternatif lain bisa menggunakan Google Colab.
@@belajaridn tapi sepertinya untuk python 3.9 masih banyak 3rd party yang belum support ya mas. Disini scikit-learn nya dijelaskan belum full release untuk python 3.9 : github.com/scikit-learn/scikit-learn/issues/18621
@@agiefmuftahid3070 Betul, ada baiknya menetap di Python 3.8 dulu saja.
pak, mau nanya kenapa saya tidak bisa cloning di git bash ya, katanya tidak support gitu
Hhmmm aneh juga ya. Kami baru saja coba untuk melakukan cloning di komputer kami dan berhasil.
Kalau boleh tahu, command yang diketikkan seperti apa?
Saya mau tanya, kalau keluar "bash: jupyter: command not found" bagaimana ya? OS saya masih Win 8.1
Ini biasanya dikarenakan path nya belum terdaftar di environmental variables nya Windows. Coba bukan Anaconda prompt saja pada start menu. Nanti bukanya dengan klik kanan dan pilih run as administrator.
Oke, terima kasih Pak👍
Sama-sama :)
Hallo pak, untuk tahapan clustering itu apakah perlu pca/normalisasi? studi kasus yang dipakai adalah data hotspot yang dimana dari dalam data tersebut akan diambil total terjadinya peristiwa hotspot dalam 5 tahun terakhir (pertahun) dari setiap kabupatennya, dalam kasus tersebut terjadi angka jomplang, mohon solusinya pak. Jujur saya sendiri masih sedikit bingung untuk penerapannya, Terma kasih banyak pak 🙏
Untuk clustering agak sedikit berbeda karena termasuk unsupervised learning, sedangkan studi kasus yang kami bahas sejauh ini masih di supervised learning.
@@belajaridn iya pak, untuk video bapak lebih ke supervised learning, jika perbandingan datanya 0-700 lebih baik menggunakan min max/pca pak? Saya bertanya ini karena sedang stuck dan bingung, apakah clustering saya sudah benar atau belum selain itupun Untuk membuktikan akurasi pada clustering biasanya menggunakan apa ya pak?
@@ekkirizkiramadhan3553 kebetulan krn video diatas adalah supervised learning dan pertanyaan agan tentang unsupervised, maka admin tidak mungkin menjawabnya dan mungkin akan dijawab bila sudah ada video ttg unsupervised
pak, saat melakukan git dengan perintah jupyter lab "command not found", tolong pencerahannya,
*saya sudah install jupyter melalui anaconda prompt terlebih dahulu
Coba ganti dengan perintah jupyter notebook
Tetap command not found pak, apakah ada cara lain, untuk memulai jupyter lab tanpa lewat gitbash?
Memulai Jupyter nya bukan lewat gitbash. Dirimu di Windows? Kalau di Windows coba buka Anaconda navigator. Bisa mulai Jupyter dari sana.
@@belajaridn terima kasih pak atas pembelajarannya, sangat membantu. mungkin kedepannya saya bakal sering tanya" wkkwwk
@@dodho0 Sama-sama masbro, kami juga senang kalau video pembelajaran yang kami buat memang bermanfaat dan membantu proses belajar :)
Kak mau nanya , aku kan pakai windows kok ga bisa manggil jupyter lab nya
Kalau di Windows mestinya dipanggil via Anaconda prompt.
pak, kalau pengguna windows apakah perlu menginstall git?
Kalau butuh untuk clone materi dari repository yang digunakan dalam panduan ini, tentunya akan memerlukan Git.
@@belajaridn ohiya sudah saya install git nya
@@belajaridn ohiya sudah saya install git nya
cara membuka layar biru keyak di 2:48 gmana ya?
Itu terminal Linux. Kalau di Windows bisa menggunakan powershell
Bagaimana ya cara meningkatkan akurasi score?
Salah satu langkah yang umum dilakukan adalah dengan menambah data training.
@@belajaridn data training itu maksudnya menambah kolom atau perbanyak data(rows)?
Perbanyak rows nya. Tapi pastikan datanya juga representatif dengan domain yang sedang digarap.
@@belajaridn ok, terima kasih bangg
Sama-sama, semoga terbantu ya :)
Halo, kak.
mau tanya, utk formula untuk memunculkan pie chart sudah saya coba bberapa kali tetappi masih invalid syntax. padahal sudah sama formula seperti di viideo. Sudah saya cari tau problemnya dan sy ulang formulanya jg msh terjadi kesalahan. Kira2 kenapa ya kak?
Terimakasih
Penjelasan detail terkait penggunaan Matplotlib untuk visualisasi data termasuk pie chart bisa dipelajari juga di playlist khusus bertopik Matplotlib yang tersedia di channel Indonesia Belajar ini.
@@belajaridn baik kk terimakasih
Sama-sama, di channel Indonesia Belajar ini ada banyak sekali materi belajar seputar Data Science dan Machine Learning, semoga bisa bermanfaat 😊🙏
kalo kita jalanin tutorial ini di collab bisa gk? kan datasetnya ada di library vegaset.
Bisa masbro :)
Ok...
@@lashort4067 semoga materi workshop nya bermanfaat ya :)
Bermanfaat sekali.... Ditunggu tutorial selanjutnya dengan dataset yg berbeda. Kalo boleh request sih, dataset kaggle yang Titanic disaster. Kayaknya rame hehehe
@@lashort4067 syukurlah kalau memang bermanfaat. Bagikan juga ke teman-teman yang lain ya supaya makin banyak orang yang dapat menikmati manfaatnya.
Dataset titanic juga cukup menarik bagi kami, hanya saja kami masih perlu menggodok materi apa saja yang sekiranya cocok untuk dibahas dengan dataset ini :)
Makasih Kak untuk videonya. Untuk modul python yang berisi model-model ML, apakah model-model tersebut algoritmnya sudah optimum dalam memberikan hasil? Terimakasih :)
Model2 yang disertakan dalam Scikit Learn adalah model2 yang cukup umum digunakan untuk menunjang research mas. Dan karena Scikit Learn sendiri bersifat Open Source, maka ada banyak orang yg terus berkontribusi meningkatkan performa nya :)
Makasih Kak untuk penjelasannya, sangat membantu :)
Sama-sama, senang bisa membantu :)
mau tanya, kalau di pandas itu bisa menggunakan metode apa aja ya ?
Ada banyak sekali mas, daftar lengkapnya bisa diakses di sini:
pandas.pydata.org/docs/getting_started/index.html#getting-started
izin mau tanya punya saya di windows keluar tulisan kaya begini
bash: cd: Iris_Data_Classification_and_EDA: Permission denied
Untuk di sistem operasi Windows, mungkin bisa coba membuka terminal dengan melakukan klik kanan lalu pilih run as administrator.
@@belajaridn maksudnya git bash nya yg di run as administratror, atau cmd nya kang boedy? maaf baru belajar pemrogramman
Sebenarnya sejak 2013 saya sudah tidak lagi menggunakan Windows, ini jadi meraba2. Ternyata pakai Linux memang lebih sederhana :D
@@belajaridn alhamdulillah udah bisa kang boed, sy pake nya miniconda jadi hrs install dulu jupyterlab nya.. nuhun kang :)
Alhamdulillah kalau memang sudah berhasil, terus semangat ya untuk mempelajari topik data dengan Python. Kami juga memiliki satu playlist khusus yang membahas topik Python Pandas dan juga Matplotlib.
apa sih kegunaan testing score?
Untuk mengukur performa dari model Machine Learning yang kita train :)
untuk yang kaggle pandas apakah ada?
Kami pernah membahas Python Pandas dalam playlist Kaggle ini dan kami juga membuatkan playlist tersendiri yang secara khusus membahas Python Pandas.
Bang ko untuk algoritma naive bayes ga ada ya?
Bertahap masbro :)
Pak mau tanya , apakah model ini bisa kami langsung gunakan untuk jenis data yang lain?
Misal saya pakai untuk explorasi data penjualan atau penelitian?
Mohon penjelasan nya
Tahapan umum dari EDA atau Exploratory Data Analysis nya lebih kurang akan mirip seperti ini. Tetapi prediction model yang akan diterapkan tentunya mesti memperhatikan Karakteristik dari datanya. Kebetulan di channel Indonesia Belajar ini kami juga menawarkan seri belajar Machine Learning di mana kami mencoba memperkenalkan sejumlah model Machine Learning yang umum digunakan.
kalau semisal datasetnya berupa gambar bukan dr csv file, bagaimana kita dapat melakukan EDA ya pak? apakah ada tutorial nya?
Untuk data image, kita mesti explorasi dengan Computer Vision dan biasanya juga mengarah ke penerapan Deep Artificial Neural Networks atau kadang dikenal sebagai Deep Learning 😊🙏☕
itu bener prediksi setiap modelnya sama semua bang?
Setiap model umumnya akan menghasilkan prediksi yang berbeda mas. Terkadang perbedaannya cukup signifikan.
Oh ya ada kesalahan pada video kami di saat pembandingan performa model. Semestinya variable yang digunakan untuk menampung hasil prediksi adalah y_pred dan bukannya pred.
Revisi sudah kami lakukan pada file Notebook di repository kami.
float 64 dan float 32 maksudnya apa pak?
Ini menandakan tipe data floating point 64 bits dan 32 bits mas :)
maaf ka, kenapa saya git clone di git bash jadinya gini "fatal: could not create work tree dir 'kaggle_explorations': Permission denied" tolong bantuannya ka, terima kasih
Kalau permission denied berarti ada permasalahan hak akses dari User yang dirimu gunakan untuk menjalankan git di komputer :)
Pastikan untuk melakukan clone di home directory milik user yang dirimu gunakan dan bukan di sembarang directory :)
@@belajaridn sudah ka, terima kasih banyak tutorialnya
Sama-sama, semoga bermanfaat ya :)
31:43
Bang kok saya ga bisa login dari git ke jupyter lab yaaa?
Gaa muncul web nyaa gitu
Kenapa ga pakai spss..?
Untuk data science saat ini ada dua tools yang umum digunakan: R dan Python. Keduanya menjadi standard di Kaagle (komunitas data science terbesar saat ini).
@@belajaridn git clone di windows gimana yah,,
Install git dulu di Windows, lalu gunakan git bash.
@@belajaridn makasih pak udah bisa
@@codewdew sama-sama :)
Browser saya gk bisa buka kaggle knapa ya?
Koneksi internet nya berjalan dengan baik kah?
Iya ada tulisan your browser not supported gtu
@@ronnyfahrudin Web browser apa yang dirimu gunakan? Ini akses ke kaggle.com?
@@belajaridn ucbrowser
@@ronnyfahrudin Ada baiknya gunakan Chrome, Firefox, Brave, atau Safari.
kak saya masih belum paham sama korelasi ya, maksut dari korelasi itu gimana ya termiakasih
Korelasi itu hubungan atau keterkaitan antar variable.
Sebagai contoh untuk kasus property atau perumahan.
Variabel harga rumah dan variabel luas rumah bisa dibilang berkorelasi; di mana kenaikan nilai untuk variabel luas rumah tentunya akan diikuti dengan kenaikan nilai pada variabel harga rumah. Dalam hal ini korelasinya adalah korelasi positif.
@@belajaridn oh, berarti semakin positif value korelasi semain besar nialinya kak
@@gladyneberlianalifzago3457 Nilai dari korelasi itu antara -1 sampai dengan 1.
Nilai -1 mengindikasikan korelasi negatif yang sangat kuat, nilai 1 mengindikasikan korelasi positif yang sangat kuat, dan nilai 0 mengindikasikan tidak ada korelasi sama sekali.
anaconda buat laptop ram 4 agak berat ya huhuhuh... :')
Ini running di sistem operasi apa ya? Kalau di BunsenLabs Linux sih masih oke di RAM 4GB.
bisa kok mas, saya ram 4 lancar2 make jupyter di anaconda
Ubuntu desktop 4 GB lancar ko mas
Kak aq bisa private online sama anda ?
Kebetulan saya tidak membuka kelas private dikarenakan kesibukan saya mengajar di program sarjana dan pascasarjana.