TEKNOLOGI

Klasifikasi Big Data dan Berbagai Sumbernya

Big data dapat diklasifikasikan berdasarkan karakteristik atau sifat tertentu dari data tersebut. Berikut adalah tiga klasifikasi utama big data:

  1. Berdasarkan 3Vs:

    a. Volume: Mengacu pada jumlah besar data yang dihasilkan dan dikumpulkan. Volume data big data bisa mencapai terabyte, petabyte, atau bahkan lebih.

    b. Velocity: Mengacu pada kecepatan dengan data dihasilkan, diproses, dan diteruskan. Data big data sering kali berasal dari sumber yang mengalir dengan cepat atau bahkan real-time.

    c. Variety: Mengacu pada ragam jenis data yang ada. Big data dapat mencakup data terstruktur (seperti data dalam tabel atau database), data semi-terstruktur (seperti dokumen XML atau JSON), dan data tanpa terstruktur (seperti teks, gambar, atau video).

  2. Berdasarkan Sumber Data:

    a. Data Internal: Data yang dihasilkan oleh dan tersimpan di dalam organisasi atau perusahaan. Ini termasuk data transaksi, data pelanggan, data operasional, dan data lain yang dihasilkan dari aktivitas internal.

    b. Data Eksternal: Data yang berasal dari sumber di luar organisasi atau perusahaan. Ini dapat mencakup data dari sumber pihak ketiga, data publik, data sosial media, dan data dari berbagai layanan atau aplikasi online.

  3. Berdasarkan Tingkat Kepresisian (Veracity):

    a. Data yang Akurat: Data yang memiliki kualitas tinggi dan akurat. Ini adalah data yang dapat diandalkan untuk pengambilan keputusan yang kritis.

    b. Data yang Tidak Akurat: Data yang mungkin memiliki kesalahan, duplikasi, atau informasi yang tidak valid. Data semacam ini memerlukan langkah-langkah untuk membersihkan dan mengatasi masalah kualitasnya sebelum dapat digunakan secara efektif.

Klasifikasi ini membantu dalam memahami dan mengelompokkan big data berdasarkan sifat dan karakteristiknya. Penting untuk mempertimbangkan klasifikasi ini saat merancang strategi pengelolaan, penyimpanan, dan analisis data besar untuk memaksimalkan manfaat yang dapat diambil dari big data.

Sumber Data Big Data

Sumber data yang dapat disebut big data sangat beragam, dan mereka terus berkembang seiring dengan kemajuan teknologi dan keterlibatan digital kita. Berikut adalah beberapa contoh sumber data yang merupakan kontributor utama terhadap big data:

  1. Data Pengguna Internet: Informasi dari situs web, platform media sosial, blog, forum, dan aplikasi online yang dikonsumsi dan dihasilkan oleh pengguna internet.

  2. Data Sensor: Data yang dikumpulkan dari berbagai sensor fisik seperti sensor cuaca, sensor lingkungan, sensor kendaraan, dan perangkat Internet of Things (IoT).

  3. Data Transaksi: Data yang dihasilkan dari berbagai transaksi bisnis, termasuk transaksi keuangan, pembelian online, pembayaran kartu kredit, dan sejenisnya.

  4. Data Log: Data log aktivitas dari server, jaringan, dan sistem IT lainnya, yang mencatat aktivitas pengguna dan kinerja sistem.

  5. Data Multimedia: Data dalam bentuk gambar, video, dan audio yang dihasilkan dari berbagai sumber, termasuk media sosial, kamera pengawas, dan platform berbagi video.

  6. Data Geospasial: Data yang berkaitan dengan informasi geografis, termasuk peta, koordinat GPS, dan data lokasi lainnya.

  7. Data Telematika: Data yang dihasilkan dari perangkat telematika, seperti data dari kendaraan bermotor, yang mencatat informasi tentang perilaku pengemudi dan kinerja kendaraan.

  8. Data Genom: Data yang dihasilkan dari sekuensing genomik, yang membantu dalam penelitian ilmiah, kesehatan, dan analisis genetika.

  9. Data Penelitian: Data yang dihasilkan dari eksperimen ilmiah, survei, dan penelitian lainnya, baik dari bidang ilmu sosial, ilmu alam, atau bidang lainnya.

  10. Data Publik: Data yang berasal dari sumber publik, seperti data pemerintah, data kota, dan data terbuka (open data).

  11. Data Jejak Digital: Data yang dihasilkan dari aktivitas online, termasuk jejak pencarian, preferensi, dan perilaku pengguna dalam lingkungan digital.

  12. Data Layanan Kesehatan: Data dari catatan medis elektronik, perangkat kesehatan pintar, dan aplikasi kesehatan yang mencatat informasi medis dan kesehatan.

  13. Data Sosial-Ekonomi: Data demografis, data pendapatan, data sosial, dan data ekonomi yang dihasilkan dari berbagai sumber seperti survei pemerintah dan lembaga statistik.

  14. Data Industri: Data yang dihasilkan dari peralatan industri, mesin, dan proses produksi, termasuk data dari pabrik dan fasilitas manufaktur.

  15. Data Finansial: Data dari pasar keuangan, perdagangan saham, dan transaksi keuangan yang mencatat aktivitas dan performa pasar keuangan.

Itu hanya beberapa contoh sumber data yang menyumbang pada big data. Seiring berjalannya waktu, teknologi baru dan aplikasi data yang inovatif akan terus menciptakan sumber data baru dan lebih kompleks.