Satu format pertukaran data baharu yang dipanggil 6NF telah muncul, direka khusus untuk gudang data dan sistem pelaporan. Format ini bertujuan untuk menggantikan format hierarki yang kompleks seperti XBRL , XML , JSON , dan YAML dengan struktur yang lebih rata dan mesra pangkalan data. Walau bagaimanapun, format ini telah mencetuskan perbincangan yang ketara dalam komuniti teknikal mengenai pilihan reka bentuk dan aplikasi praktikalnya.
Ciri Utama Format 6NF:
- Struktur rata mesra pangkalan data (tiada objek/tatasusunan bersarang)
- Keserasian bitemporal dengan cap masa valid_from dan recorded_at
- Piawaian masa UTC dengan akhiran 'Z' (contoh: 2023-01-01T12:00:00Z)
- UUIDv7 berkod Base32 Crockford untuk pengecam
- Notasi snake_case untuk pengecam
- Kata kunci peka huruf besar kecil (HURUF BESAR) dan pengecam (huruf kecil)
- Pengekodan UTF-8
Kebimbangan ketepatan cap masa memecahbelahkan pendapat
Format 6NF memerlukan semua data untuk memasukkan kedua-dua cap masa valid_from dan recorded_at dalam format UTC . Pendekatan bitemporal ini telah menjana perdebatan dalam kalangan pembangun tentang sama ada ketepatan sedemikian sentiasa diperlukan. Ada yang berpendapat bahawa banyak senario perniagaan hanya memerlukan ketepatan peringkat tarikh dan bukannya cap masa yang tepat.
Dalam pengalaman saya valid_from sentiasa merupakan tarikh (tiada masa, tiada zon masa). Itulah cara ia dilaporkan dalam dokumen (contohnya tempoh kesahan kontrak).
Perbincangan ini mendedahkan perpecahan antara mereka yang melihat ketepatan cap masa sebagai penting untuk menangkap semua senario data yang mungkin, dan mereka yang percaya ia menambah kerumitan yang tidak perlu untuk banyak kes penggunaan biasa. Pengkritik menunjukkan bahawa tarikh mula bekerja, tempoh kesahan kontrak, dan peristiwa perniagaan yang serupa biasanya beroperasi pada ketepatan harian dan bukannya setiap jam.
Tarikh akhir yang hilang mewujudkan persoalan pelaksanaan
Kebimbangan teknikal yang ketara telah muncul mengenai pengendalian kesahan temporal oleh format tersebut. Format 6NF merangkumi cap masa valid_from tetapi tidak mempunyai medan valid_to yang sepadan. Pilihan reka bentuk ini telah menimbulkan persoalan tentang bagaimana sistem mengendalikan kemas kini data, pemadaman, dan tempoh kesahan.
Ahli komuniti menyatakan bahawa pangkalan data bitemporal biasanya menggunakan selang separuh terbuka untuk kedua-dua masa sistem dan masa sah. Ketiadaan cap masa akhir bermakna walaupun rekod boleh dikemas kini, ia tidak boleh dipadamkan atau dinyatakan tidak sah lagi dengan mudah setelah ia wujud. Had ini boleh menjadi masalah untuk aplikasi dunia sebenar di mana data perlu dialih keluar atau ditandakan sebagai tidak lagi sah.
Elemen Sintaks Format:
ENTITY
- Mentakrifkan entiti data utama dengan UUIDREFERENCE
- Mencipta data rujukan dengan pengecamATTRIBUTE_OF
- Menghubungkan atribut kepada entiti dengan cap masaATTRIBUTE_REF_OF
- Merujuk atribut antara entitiSTRUCT_OF
- Mengumpulkan berbilang atribut dengan konteks temporal yang dikongsiRELATIONSHIP
- Mentakrifkan sambungan antara entiti
Falsafah normalisasi bertemu dengan trend data moden
Penekanan format ini pada normalisasi bentuk normal keenam bertentangan dengan trend industri semasa ke arah struktur data yang tidak dinormalisasi dan bersarang. Produk gudang data moden semakin menambah sokongan untuk memproses data JSON bersarang secara langsung, dan bukannya meratakan ia ke dalam jadual yang dinormalisasi.
Pencipta mengakui ketegangan ini, menjelaskan bahawa format tersebut menangani kitaran normalisasi dan denormalisasi yang mahal yang berlaku apabila data bergerak antara sistem. Matlamatnya adalah untuk memindahkan data dalam bentuk yang sudah dinormalisasi untuk menghapuskan langkah transformasi yang mahal ini. Walau bagaimanapun, ada yang mempersoalkan sama ada pendekatan ini sejajar dengan cara organisasi sebenarnya mengendalikan set data separa berstruktur mereka yang semakin kompleks.
Format 6NF mewakili percubaan menarik untuk merapatkan prinsip reka bentuk pangkalan data tradisional dengan keperluan pertukaran data moden. Walaupun ia menawarkan faedah yang berpotensi untuk kes penggunaan tertentu, perbincangan komuniti menyerlahkan persoalan penting tentang ketepatan cap masa, pengendalian data temporal, dan sama ada format yang dinormalisasi boleh bersaing dengan berkesan dengan fleksibiliti pendekatan separa berstruktur moden.
Rujukan: 6NF File Format