Indice dei contenuti
Metadati significato e categorie: come funzionano e a cosa servono?
I metadati, spesso definiti come “dati su dati”, nel linguaggio informatico indicano un sistema strutturato di informazioni sui dati che hanno lo scopo di descrivere il contenuto, la struttura e l’ambito a cui appartiene un documento informatico al fine di favorire una migliore gestione, consultazione e conservazione nel tempo dello stesso.
Qual è il significato di metadati? A fornire una risposta è l’Accademia della Crusca: il termine metadati deriva dall’inglese metadata che a sua volta trae origine dal prefisso meta-, dal greco antico μετὰ, che significa “oltre, dopo, per mezzo”, e dal plurale neutro latino data, ossia “i dati”.
La parola “metadati” compare per la prima volta in un articolo pubblicato il 15 aprile 1996 sul Corriere della Sera e firmato da Donato Speroni in cui l’autore descrive un nuovo strumento di informazione predisposto dal Fondo monetario internazionale: “Attenzione, la lavagna elettronica (Bbs, in computerese) non conterrà numeri, ma i cosiddetti metadati, cioè le notizie sui criteri con cui le statistiche sono redatte, sulla libertà di accesso alle informazioni da parte di tutti gli utenti, sulla autonomia dell’informazione statistica dal potere politico”.
Il 29 marzo di tre anni più tardi, in un articolo apparso su Repubblica, Paolo Conti utilizzerà il termine metadati in quella che oggi è l’accezione prevalente, ovvero quella informatica: “Xml, un linguaggio che amplia di fatto le potenzialità delle pagine web includendo riferimenti (che vengono chiamati “metadati”) a informazioni”.
Per meglio comprendere che cosa sono i metadati, prendiamo ad esempio le schede bibliografiche che compongono il catalogo di una biblioteca nella sua versione informatica. Ogni singola scheda contiene informazioni circa il contenuto, la posizione di un libro e le modalità di accesso alla risorsa, vale a dire le informazioni riguardanti più dati che si riferiscono a una specifica opera. I metadati minimi (definiti dal DPCM 13/11/2014 n° 8) attribuiti al documento informatico al momento della sua creazione non sono però gli unici che definiscono l’identità: infatti, un metadato, come ad esempio un ID, ossia un codice identificativo univoco, può essere aggiunto all’insieme delle informazioni in un secondo momento allo scopo di monitorare le modifiche, gli accessi e le modalità di conservazione dell’oggetto digitale.
Ricapitolando, la funzione principale dell’attività di metadazione è quella di consentire il raggiungimento dei seguenti obiettivi:
- Ricerca: identificare un documento informatico a partire da un insieme di risorse;
- Localizzazione: individuare l’ubicazione della risorsa all’interno di un sistema organizzato (ad esempio: una biblioteca) e facilitare l’operazione di recupero della stessa;
- Selezione: possibilità di analizzare, valutare e filtrare una serie di documenti;
- Interoperabilità semantica: consentire la ricerca in differenti ambiti disciplinari attraverso una serie di equivalenze fra descrittori;
- Gestione risorse: gestire le raccolte di documenti grazie all’intermediazione di banche dati e cataloghi;
- Disponibilità: ottenere informazioni sull’effettiva disponibilità del documento.
Inoltre, le informazioni associate a un documento possono essere organizzate in tre macrocategorie:
- Metadati descrittivi: descrivono il documento informatico e servono all’identificazione e al recupero degli oggetti digitali a cui sono associati per facilitarne la ricerca e il recupero. Alcuni esempi di metadati descrittivi sono:
- Handle;
- PURL (Persistent Uniform Resource Locator);
- Dublin Core;
- MARC;
- Meta Tag HTML;
- ISO 19115;
2. Metadati amministrativi e gestionali: forniscono informazioni sulle modalità di archiviazione e manutenzione degli oggetti digitali e sono indispensabili per una corretta esecuzione delle relative attività. Questo tipo di metadati documentano i processi tecnici associati alla conservazione a lungo termine, forniscono indicazioni sulle condizioni e i diritti di accesso agli oggetti digitali, certificano autenticità e integrità del contenuto. Due esempi di MAG (Metadati Amministrativi Gestionali) sono:
- Preservation Metadata for digital Collections della National Library of Australia;
- Metadata for digital preservation CEDARS;
3. Metadati strutturali: servono per descrivere la struttura interna dei documenti (ad esempio: introduzione, capitoli, indice di un libro) e gestire le relazioni fra le varie parti componenti degli oggetti digitali. I metadati strutturali, inoltre, forniscono informazioni che permettono di identificare e localizzare il documento all’interno di un sistema di conservazione. Ne sono esempio:
- SGML;
- XML;
- Encoded Archival Description (EAD);
- Electronic Binding;
- Digital Library Federation MOA2.
Metadati: perché sono fondamentali per la SEO?
All’interno di una strategia SEO (Search Engine Optimization), se correttamente utilizzati, i metadati -o meta tag o tag meta, cioè i metadati utilizzati nell’HTML (HyperText Markup Language) – giocano un ruolo chiave perché permettono una corretta classificazione delle informazioni e contribuiscono a un migliore posizionamento in SERP (Search Engine Results Page), attirando più utenti verso il proprio sito web.
I metadati sono parte integrante di quello che l’informatico britannico Timothy John Berners-Lee ha definito “web semantico”, ovvero la trasformazione del World Wide Web in un ambiente dove i documenti pubblicati (ad esempio: pagine HTML, file e immagini) sono associati a informazioni e dati che ne specificano il contesto semantico e semplificano l’interrogazione e l’interpretazione tramite i motori di ricerca. Ciò, oltre a favorire la costruzione di reti di relazioni e connessioni tra documenti, sulla base di logiche più molto più complesse del semplice hyperlink, permette agli utenti di effettuare una ricerca delle informazioni più efficace grazie alla presenza nel documento di parole chiave.
Uno degli standard più accreditati per la gestione dei metadati è quello elaborato dalla Dublin Core Metadata Innovation (DCMI) che suggerisce l’uso di quindici diversi elementi da inserire nella sezione head – vale a dire l’area dedicata all’intestazione (header)- del codice HTML:
- Title (Titolo): il nome attribuito alla pagina;
- Creator (Autore): l’autore responsabile del contenuto della pagina che può essere una persona oppure un’organizzazione;
- Subject (Soggetto): l’argomento trattato o il contesto di riferimento che può essere descritto attraverso parole o frasi chiave;
- Description (Descrizione): breve descrizione del contenuto della pagina;
- Publisher (Editore): è l’editore responsabile della pubblicazione della risorsa e si occupa anche di rendere disponibile la risorsa. Anche in questo caso può essere una persona oppure un’organizzazione;
- Contributor (Autore di contributo): chi ha contribuito in qualche modo alla realizzazione della risorsa. Esempio di autore includono una persona o un’organizzazione;
- Date (Data): data di creazione, di pubblicazione, o di revisione;
- Type (Tipo): il tipo di risorsa o il tipo di contenuto;
- Format (Formato): il formato della pagina web;
- Identifier (Identificatore): identificatore della pagina (ad esempio: l’URL o il codice ISBN);
- Source (Fonte): l’eventuale risorsa da cui la pagina web corrente è derivata;
- Language (Lingua): il contesto linguistico di riferimento della risorsa;
- Relation (Relazione): eventuali risorse collegate;
- Coverage (Copertura): scopo della pagina web che normalmente include la localizzazione spaziale, ovvero il nome o le coordinate geografiche di un luogo, e il periodo temporale;
- Rights Management (Gestione dei diritti): informazioni sui diritti d’utilizzo della risorsa che comprende gli Intellectual Property Rights e il copyright.
È importante prestare particolare attenzione al Metadata Title e al Metadata Description. Il tag <title >, presente all’interno del tag <head > nel codice HTML, deve essere breve, descrittivo e unico per ogni pagina, riportare le informazioni basilari per la SEO, contenere la keyword principale, che deve essere posizionata all’inizio del titolo, e descrivere accuratamente il contenuto della pagina sia agli utenti che ai motori di ricerca. Gli errori da evitare in questo caso sono soprattutto due: riempire il titolo di parole chiave e usare titoli eccessivamente lunghi che, oltre a non essere utili per l’utente, vengono tagliati nello snippet Google, risultando incompleti e incomprensibili.
Il meta tag Description, invece, è importante perché il motore di ricerca potrebbe usarlo nello snippet per descrivere il contenuto della pagina che compare nella SERP. Diciamo “potrebbe” perché Google, in alternativa, può scegliere di utilizzare una sezione rilevante del testo visibile della tua pagina se questo corrisponde alla query di ricerca di un utente. Nel caso in cui Google non dovesse trovare una buona sezione di testo da usare nello snippet entra in gioco la meta tag Description che, quindi, è sempre utile aggiungere a ogni pagina. Anche in questo caso valgono le stesse regole del meta tag Title: scrivere una descrizione unica e accurata, che possa informare e interessare gli utenti, non esagerare con le parole chiave e, inoltre, non copiare e incollare il contenuto del documento dentro la meta tag Description.
Google fornisce una lista ufficiale dei meta tag da utilizzare per far sapere al motore di ricerca chi siamo e cosa facciamo, tuttavia questo non basta: la corretta gestione dei metadati richiede tempo e competenze specifiche. La soluzione è affidarsi a un’agenzia di Content marketing che per conto dei suoi clienti si occupa dell’ideazione, della produzione, dell’ottimizzazione e della distribuzione dei contenuti per il web e i media digitali.