PDF con tag e accessibilità

Capita, come in tante altre occasioni, di sentir dire in modo un po’ approssimativo che “i PDF taggati sono accessibili”. Bè, non è vero, è come dire che una pagina HTML siccome è in HTML è accessibile. Magari, verrebbe da dire.

Certamente un PDF dotato di una struttura a tag è il primo passo necessario verso l’accessibilità. Ma, proprio come accade con le pagine Web, è soltanto un pezzetto del puzzle.

Il formato PDF dispone di un proprio set di tag standard, un po’ come fosse una DTD (è soltanto una semplificazione, non prendetela alla lettera), e dispone di vari elementi, adatti a descrivere il significato semantico dei contenuti a cui si applicano. Gli elementi disponibili sono (dall’help di Acrobat):

Elementi contenitore

Gli elementi contenitore rappresentano il livello più alto e offrono un raggruppamento gerarchico agli altri elementi di livello blocco.

<Document>
L’elemento principale nella struttura ad albero tag di un documento.
<Part>
Rappresenta una suddivisione ampia del documento e può raggruppare unità di contenuto di dimensioni inferiori, ad esempio elementi reparto, articolo o sezione.
<Div>
È un elemento di livello blocco generico o un gruppo di elementi di livello blocco.
<Art>
È un corpo del testo indipendente e viene considerato un resoconto singolo.
<Sect>
Si tratta di un tipo di elemento contenitore generico, paragonabile a Reparto (DIV Class=“Sect”) in codice HTML; in genere è un componente di un elemento parte o articolo.

Elementi titolo e paragrafo

Sono elementi di blocco che includono specifici livelli di titoli e paragrafi di testo generici <P>. Un elemento <H> può presentarsi come primo child di un livello div superiore. Per le situazioni in cui non esistono sezioni annidate sono disponibili sei livelli di titolo <H1><H6> generici.

Elementi etichetta ed elenco

Gli elementi etichetta ed elenco sono elementi di livello blocco utilizzati per conferire una struttura agli elenchi.

<L>
Una qualsiasi sequenza di voci dal significato o da un altro tipo di pertinenza simile. È possibile che gli elementi secondari diretti siano elementi voce di elenco.
<LI>
Qualsiasi voce inclusa in un elenco. È possibile che presenti un elemento etichetta (facoltativo) e corpo elenco (obbligatorio) come elemento secondario.
<LBL>
Etichetta. Un punto elenco, un nome o un numero di identificazione per distinguere un elemento dagli altri all’interno dello stesso elenco.
<LBody>
Elemento corpo elenco. Il contenuto descrittivo di una voce di elenco.

Elementi testo speciale

Gli elementi di testo speciale identificano parti del testo non utilizzate come paragrafo generico (P).

<BlockQuote>
Elemento virgolette blocco. Uno o più paragrafi attribuiti ad un autore diverso da quello del testo immediatamente circostante.
<Caption>
Elemento didascalia. Una breve parte di testo che descrive una tabella o una figura.
<Index>
Elemento indice. Una sequenza di voci contenenti testo identificativo ed elementi di riferimento che indicano la ricorrenza di tale testo nel corpo principale del documento.
<TOC>
Elemento sommario. Un elemento contenente un elenco strutturato di voci ed etichette che identificano le voci e dotato di una struttura gerarchica separata.
<TOCI>
Elemento voce di sommario. Un elemento contenuto in un elenco associato ad un elemento sommario.

Elementi tabella

Gli elementi tabella conferiscono struttura alle tabelle.

<Table>
Elemento tabella. Una disposizione bidimensionale di celle di testo o di dati contente elementi riga di tabella come elementi secondari, nonché un elemento didascalia come primo o ultimo elemento secondario (facoltativo).
<TR>
Elemento riga di tabella. Una riga di intestazioni o dati in una tabella. È possibile che contenga elementi di cella di tipo intestazione di tabella e dati di tabella.
<TD>
Elemento di cella dati di tabella. Una cella di tabella contenente dati diversi dal tipo intestazione.
<TH>
Elemento di cella intestazione di tabella. Una cella di tabella contenente un’intestazione o dei dati che descrivono una o più righe oppure colonne di una tabella.

Elementi di livello in linea

Gli elementi di livello in linea identificano una porzione di testo caratterizzata da una formattazione o un comportamento specifico. Sono distinti dagli elementi di livello blocco. È possibile che gli elementi di livello in linea contengano o siano inclusi in elementi di livello blocco.

<BibEntry>
Citazione bibliografica. Una descrizione che riporta la fonte originale delle informazioni menzionate nel testo.
<BlockQuote>
Una parte di testo in linea attribuita ad un autore diverso da quello del testo circostante. È un elemento distinto da virgolette blocco, che a differenza del testo in linea includono uno o più paragrafi per intero.
<Span>
Un segmento di testo in linea qualsiasi. In genere, viene utilizzato per delimitare del testo associato ad un gruppo di proprietà di stile.

Elementi di livello in linea speciali

Sono simili agli elementi in linea; descrivono una parte di testo in linea caratterizzata da una formattazione o un comportamento speciale.

<Code>
Elemento voce codice. Codice di programmazione informatica incorporato in un documento.
<Figure>
Elemento voce figura. Una rappresentazione visiva o un elemento di grafica associato al testo cui si riferisce.
<Form>
Elemento voce modulo. Un’annotazione modulo PDF compilabile o già compilata.
<Formula>
Elemento voce formula. Una formula matematica.
<Link>
Elemento voce collegamento. Un collegamento ipertestuale incorporato in un documento. L’oggetto di destinazione può essere all’interno dello stesso documento, in un altro file PDF oppure su un sito Web.
<Note>
Elemento voce nota. Documentazione o testo esplicativo, ad esempio una nota a piè di pagina o di chiusura, a cui viene fatto riferimento all’interno del corpo del testo principale.
<Reference>
Elemento voce riferimenti. Una citazione di testo o dati non inclusi nel documento.

Tutti questi elementi sono disponibili nella scheda Tag di Acrobat Pro, che permette di applicarli ai vari elementi del documento o di modificare i tag assegnati. In questo modo il file PDF godrà di diversi vantaggi, poiché i tag standard rendono disponibili a software e periferiche di supporto un gruppo basilare di elementi strutturali e semantici per l’interpretazione della struttura del documento e la presentazione del relativo contenuto in un formato significativo per l’utente.
Inoltre, la conversione a altri formati sarà senza dubbio più precisa ed efficace.
Questa è l’architettura dei tag base PDF, ovvero la “grammatica formale pubblicata”, per dirla con le parole dei requisiti della Stanca. Quindi, i file PDF dovrebbero essere perlomeno conformi al requisito 1 del decreto relativo, e anche il 17 poiché si riferisce a “oggetti di programmazione”, come il plugin Acrobat o il Reader stand-alone.
È importante notare le parole “architettura dei tag base”. Perché? L’architettura dei tag PDF può essere estesa, e un PDF può contenere qualsiasi gruppo di tag utilizzato da una data applicazione di authoring.
È possibile che un file PDF presenti tag XML acquisiti da uno schema XML (anche quando il tag viene prodotto a partire da un file XHTML, ricordiamolo). È necessario che tutti i tag personalizzati definiti dall’utente, quali i nomi di tag generati da un’applicazione di authoring (un word processor, un programma di impaginazione) a partire dagli stili di paragrafo (requisito 1 dell’allegato A al decreto 30 aprile 2008, “Regole tecniche disciplinanti l’accessibilità agli strumenti didattici e formativi a favore degli alunni disabili”) dispongano di una mappa ruolo per correlare ciascun tag personalizzato ad un tag standard.

La mappa ruolo è un riferimento che consente al software di supporto di interpretare correttamente i tag personalizzati: è per questo che nella finestra di dialogo Proprietà ritocco, che mostra le proprietà del tag applicato all’elemento selezionato sono disponibili due schede: Contenuto e Tag. Nessuno ci fa caso, così si vedono in giro documenti PDF con tag dove un titolo di Livello 1 è posizionato in un contenitore di tipo Paragrafo. Quando questo accade, uno screen reader, per esempio, non riuscirà a “intercettare” i titoli. Si può dire accessibile un PDF così? No, secondo me no.

la scheda Tag in Acrobat Pro

Che dire, sempre più difficile : -)

Annunci

7 pensieri su “PDF con tag e accessibilità

  1. Una riflessione: guardando i tag questi sono molto simili a quelli di (X)HTML però con delle differenze.
    Ma perchè non ci si dirige verso un linguaggio di marcatura veramente Standard? Usabile per PDF, pagine web etc.
    A volerlo forse…

  2. I motivi sono diversi, compresi quelli di mercato (vedi lotta fra il formato XML di Microsoft e l’odf di Oasis, per esempio). Secondo me però non è questa la cosa importante, è facile passare da un markup a un altro se il formato è pubblico. Inoltre, le necessità di un markup per il web sono molto diverse da quelle di un markup per la stampa, per esempio. La DTD HTML la conosci, prova a dare un occhio a una DTD altrettanto conosciuta e collaudata come DocBook (http://www.docbook.org/).
    Poi, se usi Dreamweaver e vuoi divertirti, scarica la DocBook Tag Library dalla sezione XML del sito del mio amico il fotissimo Foti e prova…(http://www.massimocorner.com/)

  3. Pingback: Accessibilità dei PDF? Ora non ci sono più scuse | Semplicemente

  4. Pingback: PDF accessibili e Open Source | biroblu

  5. Pingback: PDF accessibili e ruoli dei tag | biroblu

Rispondi

Inserisci i tuoi dati qui sotto o clicca su un'icona per effettuare l'accesso:

Logo WordPress.com

Stai commentando usando il tuo account WordPress.com. Chiudi sessione / Modifica )

Foto Twitter

Stai commentando usando il tuo account Twitter. Chiudi sessione / Modifica )

Foto di Facebook

Stai commentando usando il tuo account Facebook. Chiudi sessione / Modifica )

Google+ photo

Stai commentando usando il tuo account Google+. Chiudi sessione / Modifica )

Connessione a %s...