Données structurées et non structurées¶
Donnée
Une donnée est une valeur décrivant un objet, une personne, un événement digne d’intérêt pour celui qui choisit de la conserver.
Les données structurées sont les données qui utilisent un format prédifini. Par exemple un fichier organisé sous forme de colonnes et de lignes est une donnée structurée. Par contre, ce texte : "Bonjour, je m'appelle John, John mcnugget" n'est pas une donnée structurée.
Descripteurs et métadonnées¶
Plusieurs descripteurs peuvent être utiles pour décrire un même objet (par exemple des descripteurs permettant de caractériser un contact : nom, prénom, adresse et numéro de téléphone).
À tout fichier sont associées des métadonnées qui permettent d’en décrire le contenu. Ces métadonnées varient selon le type de fichier (date et coordonnées de géolocalisation d’une photographie, auteur et titre d’un fichier texte, etc.).
Principaux formats¶
Le format CSV (Comma-Separated Value)¶
Dans un fichier csv, les descripteurs vont correspondre aux noms des colonnes.
On représente souvent présente souvent sous forme de tables dont les colonnes représentent les descripteurs et les lignes représentent les données.
Dans un fichier au format CSV les données sont présentées dans un fichier texte et séparées en général par des points virgules ou des virgules, voire par des tabulations.
On peut ouvrir ce type de fichier avec un tableur comme LibreOffice Calc ou Excel.
JSON et XML¶
Il existe des formats adaptés au transfert de données sur le Web. On peut citer principalement JSON et XML.
Voici un exemple de données encodées en JSON :
{
"prenom": "John",
"nom": "mcnugget",
"nbLogin": 4,
"animaux": [
{
"nom": "Aligato",
"type": "Chat"
}
]
}
Les mêmes données mais en XML :