Selasa, 11 Desember 2018

Python-Hierarchical Data Format

Bila anda yang menangani big data, pasti akan berkutat pada data yang sangat besar, bagaimana menyimpan data tersebut agar efektif? Yaitu format HDF (Hierarchical Data Format) yang sekarang sudah mencapai versi ke 5 yaitu HDF5 yang mempunyai perbedaan yang cukup signifikan dari sebelumnya.
Struktur HDF5 terdiri 2 tipe utama yaitu
Dataset yaitu multidimensional array
Group yaitu berisi data yang terstruktur
https://en.wikipedia.org/wiki/Hierarchical_Data_Format
Beberapa benefit penggunaan HDF5  https://www.hdfgroup.org/
  1. Heterogeneous Data
  2. Easy Sharing
  3. Cross Platform
  4. Fast I/O
  5. Big Data
  6. Keep Metadata with Data
Nah Python mempunyai interfacing yaitu http://www.h5py.org/, untuk dokumentasinya http://docs.h5py.org/en/stable/index.html
Format h5py tersebut sangat efektif sekali daripada menggunakan format JSON dan YAML

Tidak ada komentar: