Formato delle date e ore in una serie storica
Uno degli aspetti più interessanti della data analytics è che salta sempre fuori qualcosa di nuovo da imparare. L'ultima scoperta (scrivo sempre da "novizio" della materia, non dimenticarlo per favore) è che anche le date (giorni, settimane, mesi e trimestri) hanno un loro standard.
Il problema mi si è posto quando ho iniziato a scrivere le specifiche di aggregazione di alcuni dati che, da puntuali (sono raccolti ad ogni transazione, anche più volte al minuto), devono essere aggregati a livello giornaliero, settimanale ecc. per successive analisi:
- esiste un modo "più corretto" di indicare la data di un giorno? giornomeseanno, annomesegiorno? o mesegiornoanno?
- una settimana come si indica? e, ancora prima, come si calcola il numero della settimana in un anno?
- e il giorno della settimana? "lunedì" per i colleghi italiani ha chiaramente un senso (è il giorno più deprimente della settimana), ma per un collega indiano?
Cercando una risposta a queste domande mi sono imbattuto nella norma ISO 8601 "Data elements and interchange formats - Information interchange - Representation of dates and times", nata proprio per definire uno standard comune, internazionale, per la rappresentazione di date e orari. L'obiettivo della norma è proprio quello di evitare ambiguità: 12.03.23 può essere il 12 marzo 2023 in Italia e il 3 dicembre 2023 negli Stati Uniti d'America. Se devi fissare un appuntamento con un amico americano può essere un problema :)
Quindi, la prossima volta che devi definire il formato di una data, o di un'orario, può essere utile consultare la norma ISO 8601: su Wikipedia trovi dei cenni utili, mentre la norma può essere acquistata sul sito dell'International Organization for Standardization.
Mi auguro possa esserti utile
Commenti
Posta un commento