• Data

    Science

    Data Science

    Pada course ini berisi silabus yang membahas tentang Data Science. Silabus yang disediakan yaitu Introduction Data Science, Data Analytics, dan Data Visualization. Materi yang dibahas pada course ini bertujuan untuk memberi pengenalan tentang data science dan juga cara mengolah data dengan analisis dan visualisasi. Dengan mempelajari course ini, peserta diharapkan mampu memiliki kemampuan dasar sebagai seorang data scientist ataupun data analyst untuk terjun ke industri terkait.

    1. Peserta mampu memahami dasar-dasar Data Science dan penerapannya.
    2. Peserta mampu melakukan analisis data dengan teknik-teknik yang telah dijelaskan untuk mendapatkan informasi pengetahuan dari data.
    3. Peserta mampu membuat visualisasi sesuai dengan kebutuhan dan jenis data.

    Data science adalah bidang multi-disiplin yang menggunakan metode, proses, algoritma, dan sistem ilmiah untuk mengekstrak pengetahuan dan informasi dari data terstruktur dan tidak terstruktur. Data science merupakan konsep untuk menyatukan statistik, analisis data, pembelajaran mesin (machine learning), pengetahuan dasar (domain knowledge) dan metode terkaitnya untuk memahami dan menganalisis fenomena aktual dengan data. Bidang data science ini menjadi salah satu bidang yang cukup terkenal saat ini karena kemampuannya untuk membantu mengolah data menjadi informasi dan pengetahuan yang bermanfaat dan sangat dibutuhkan. Di dalam proses data science, secara umum proses yang dilakukan adalah pengumpulan data, analisis, visualisasi modeling, dan evaluasi.

    Klik Disini

    Data merupakan syarat utama untuk melakukan data mining. Tanpa adanya data, data mining tidak dapat dilakukan. Data biasanya disusun atas objek atau observasi. Kumpulan objek yang mewakili suatu entitas disebut dengan set data. Kumpulan dari set data disebut dengan database. Setiap objek dari suatu set data disebut dengan contoh, samples, examples, instances, titik data, atau tuples. Set data biasanya direpresentasikan berupa baris dan kolom. Baris menyatakan objek dari set data dan kolom menyatakan atribut/fitur dari set data. Atribut-atribut itulah yang menjelaskan suatu objek pada set data.

    Klik Disini

    Pada aplikasi data mining, seperti teknik klastering, outliers analysis, dan klasifikasi menggunakan algoritma K-Nearest Neighbors, diperlukan suatu cara untuk menilai seberapa mirip suatu objek terhadap objek lain. Ukuran kesamaan (similarity) dan ketidaksamaan (dissimilarity) disebut juga sebagai ukuran kedekatan (measures of proximity). Similarity dan dissimilarity ini saling berhubungan. Ukuran kesamaan pada dua objek i dan j, akan diberikan nilai 0 jika objek tersebut tidak mirip sama sekali dan nilai 1 menunjukkan bahwa dua objek adalah sama [1].

    Klik Disini

    Visualisasi data adalah proses memperoleh, menginterpretasi dan membandingkan data dengan tujuan untuk mengkomunikasikan dengan jelas ide yang komplek, identifikasi dan menganalisis pola yang berguna.

    Klik Disini

    Data preprocessing adalah teknik awal data mining untuk mengubah raw data (data mentah) menjadi format dan informasi yang lebih efisien dan bermanfaat. Format pada raw data yang diambil dari berbagai macam sumber seringkali mengalami error, missing value, dan tidak konsisten. 

    Klik Disini

    Atribut adalah bagian data, yang mewakili karakteristik atau feature dari objek data. Atribut, dimensi, feature, dan variabel sering digunakan secara bergantian dalam literatur. Istilah dimensi ini umumnya digunakan dalam literatur data warehouse. 

    Klik Disini