Data Science itu ilmu tentang apa sih?
Menurut pengertian dari Data Robot, Data Science adalah ilmu yang menggabungkan sebuah kemahiran di bidang ilmu tertentu dengan keahlian pemrograman, matematika, dan statistik. Mereka menggunakan algoritma machine learning yang berguna dalam mengolah teks, gambar, video, audio dalam bentuk artificial intelligence. Ini nantinya akan menghasilkan data bagi manusia untuk mengambil kebijakan atau menyusun strategi.
Still confused? Let’s use an analogy of Data Science…..
Oke supaya lebih mudah untuk menjelaskan apa itu Data Science, ada analogi menarik dari akun @nmonarizqa di Twitter. Dia membuat analogi kalo proses di data Ssience itu seperti proses memasak. Namun, sebagai disclaimer, ini adalah analogi sederhana yang gak menggambarkan detail pekerjaan di bidang Data Science secara keseluruhan. Namun, tetap bagus buat gambaran umum yang masih dasar.
Seorang data scientist tuh ibaratnya kayak koki yang mengelola bahan mentah (data), menjadi makanan (produk analisa data). Nah, selain enak cita rasanya, makanan juga harus memiliki nutrisi, dong, (value informasi).
Sebelum masak, si koki harus tahu dulu dong mau masak apa, nasi goreng, soto ayam, rawon, atau stea. Kalo udah tahu mau masak apa, si koki baru bisa deh menentukan bahan makanannya. Oh mau masak nasi goreng, berarti harus nyiapin nasi, telor, ayam, kecap manis, kecap asin, dsb.
Sama kayak data scientist, mereka harus tahu dulu, apa sih problemnya, kalo udah tau kan jadi enak tuh mau pake telemetri atau data apa yang harus ada.
Oke kita lanjut bahasan tentang Data Science….
Masih menggunakan analogi yang sama, si koki sering tuh bikin eksperimen, misalkan kalo nasi goreng terus ada campuran potongan alpukat, enak gak ya? Atau variasi olahan telor tuh apa aja, sih?
Kalo di Data Science, ini namanya proses data cleaning + wrangling + exploration. Di proses ini, tentukan basic statistic (mean, median, dkk) pada sebuah data, terus buat visualisasinya dan lakukan identifikasi data.
Terus si koki bakalan nentuin mau kira-kira supaya enak, bumbu A dicampur dengan B, cocok gak ya? Terus mau goreng nasinya pake spatula yang mana. Nah, ini sama dengan menerapkan metode di Data Science. Mau pake yang supervised atau unsupervised, atau deep learning?
Habis itu, pas sambil masak, juga si koki juga mencipipi rasa bumbunya gimana, udah pas atau belum, kalo belum bisa harus ada penambahan berarti. Di Data Science juga begitu, kalo habis training data, misalnya ternyata datanya kurang akurat, teliti deh butuhnya apa, misal labeled data kurang, hyperparameter, terus dire-train.
Tadaaa…sudah selesai masakannya!
Kalo sudah proses masak memasaknya selesai, terus tugasnya koki adalah menyajikan nasi goreng yang mengunggah selera di atas sebuah piring. Di dunia data, ini disebut dengan visualisasi data dengan tujuan untuk menyajikan hasil analisa data yang jelas.
Intinya sih, Data Science adalah pekerjaan yang mengubah data menjadi informasi dengan menggunakan tools matematika + statistika + coding, dan hasilnya adalah prediksi/informasi/visualisasi, dll.
Semoga analogi koki masak ini bisa memudahkan kita semua mengenai hal-hal dasar dari Data Science, ya!