Data Science

    Ilmu data atau data science ini ialah ilmu yang berfokus pada sebuah data yang bervolume besar. dengan Teknik pengelolaan modern dengan cara menemukan titik titik terang untuk menemukan informasi yang dimana hasil tersebut akan diperlukan bisnis ataupun menjadi informasi data yang bermafaat. Data science ini mempunyai topik dengan ruang lingkup yang sangat luas. hal ini dikarenakan data science gabungan dari bidang ilmu komputer ,bisnis, matematika, statistic dan problem-solving. data science merupakan cabang dari ilmu Big data.


    Big data ini  yaitu sebuah data yang besar namun tidak dapat diolah karena data ini sangat banyak dan kompleks sehingga perangkat lunak pemrosesan data tradisional tidak dapat mengelolanya. lalu mempunyai simbol-simbol dengan huruf V .dapat dikatakan bahwa dimensi data diantaranya  3V, 4V, 5V, 10V, 14V, dan 17V.  3V ini terdiri dari Varienty,Velocity dan Volume. lalu 10Vs yaitu Volume, Variety, Velocity, Veracity, Validity, Value, Variability, Venue, Vocabulary, dan Vagueness.



Data Warehouse

    Data Warehouse ialah kumpulan data dari sebuah Gudang data bisa dibayangkan seperti barang-barang yang membutuhkan sebuah Gudang untuk tempat simpan ini pun terjadi pada data data perusahaan ataupun eksistensi yang mempunyai banyak data. dengan banyaknya data , data warehouse ini mempunyai pemrosesan yaitu dari Extract, Transform dan Load (ETL)

Extract          : Ekstraksi/penyaringan data.
Transform     : Pemetaan dari skema sumber ke skema datawarehouse serta preparasi data
Load              : Memasukkan data ke target akhir.

  

Perbedaan dari Big Data dan Data Warehouse

  • Big data sendiri tidak memelurkan query dari SQL namun untuk data warehouse sendiri memerlukan query dari SQL untuk mengambil data
  • Big data dapat memelurkan data yang berstruktur atapun tidak beda halnya dengan Data warehouse yang hanya menemima data yang berstruktur
  • Big data melakukan pemrosesan data dengan file yang terdistribusi, namun untuk data warehouse tidak melakukan pemrosessan data dengan file yang terdistribusi


Nama : Naufal Adjie Nadhir Ar Rachman 
NIM : 6706210012