PDF con tag e accessibilità

Capita, come in tante altre occasioni, di sentir dire in modo un po’ approssimativo che “i PDF taggati sono accessibili”. Bè, non è vero, è come dire che una pagina HTML siccome è in HTML è accessibile. Magari, verrebbe da dire.

Certamente un PDF dotato di una struttura a tag è il primo passo necessario verso l’accessibilità. Ma, proprio come accade con le pagine Web, è soltanto un pezzetto del puzzle.

Il formato PDF dispone di un proprio set di tag standard, un po’ come fosse una DTD (è soltanto una semplificazione, non prendetela alla lettera), e dispone di vari elementi, adatti a descrivere il significato semantico dei contenuti a cui si applicano. Gli elementi disponibili sono (dall’help di Acrobat):

Elementi contenitore

Gli elementi contenitore rappresentano il livello più alto e offrono un raggruppamento gerarchico agli altri elementi di livello blocco.

<Document>
L’elemento principale nella struttura ad albero tag di un documento.
<Part>
Rappresenta una suddivisione ampia del documento e può raggruppare unità di contenuto di dimensioni inferiori, ad esempio elementi reparto, articolo o sezione.
<Div>
È un elemento di livello blocco generico o un gruppo di elementi di livello blocco.
<Art>
È un corpo del testo indipendente e viene considerato un resoconto singolo.
<Sect>
Si tratta di un tipo di elemento contenitore generico, paragonabile a Reparto (DIV Class=“Sect”) in codice HTML; in genere è un componente di un elemento parte o articolo.

Elementi titolo e paragrafo

Sono elementi di blocco che includono specifici livelli di titoli e paragrafi di testo generici <P>. Un elemento <H> può presentarsi come primo child di un livello div superiore. Per le situazioni in cui non esistono sezioni annidate sono disponibili sei livelli di titolo <H1><H6> generici.

Elementi etichetta ed elenco

Gli elementi etichetta ed elenco sono elementi di livello blocco utilizzati per conferire una struttura agli elenchi.

<L>
Una qualsiasi sequenza di voci dal significato o da un altro tipo di pertinenza simile. È possibile che gli elementi secondari diretti siano elementi voce di elenco.
<LI>
Qualsiasi voce inclusa in un elenco. È possibile che presenti un elemento etichetta (facoltativo) e corpo elenco (obbligatorio) come elemento secondario.
<LBL>
Etichetta. Un punto elenco, un nome o un numero di identificazione per distinguere un elemento dagli altri all’interno dello stesso elenco.
<LBody>
Elemento corpo elenco. Il contenuto descrittivo di una voce di elenco.

Elementi testo speciale

Gli elementi di testo speciale identificano parti del testo non utilizzate come paragrafo generico (P).

<BlockQuote>
Elemento virgolette blocco. Uno o più paragrafi attribuiti ad un autore diverso da quello del testo immediatamente circostante.
<Caption>
Elemento didascalia. Una breve parte di testo che descrive una tabella o una figura.
<Index>
Elemento indice. Una sequenza di voci contenenti testo identificativo ed elementi di riferimento che indicano la ricorrenza di tale testo nel corpo principale del documento.
<TOC>
Elemento sommario. Un elemento contenente un elenco strutturato di voci ed etichette che identificano le voci e dotato di una struttura gerarchica separata.
<TOCI>
Elemento voce di sommario. Un elemento contenuto in un elenco associato ad un elemento sommario.

Elementi tabella

Gli elementi tabella conferiscono struttura alle tabelle.

<Table>
Elemento tabella. Una disposizione bidimensionale di celle di testo o di dati contente elementi riga di tabella come elementi secondari, nonché un elemento didascalia come primo o ultimo elemento secondario (facoltativo).
<TR>
Elemento riga di tabella. Una riga di intestazioni o dati in una tabella. È possibile che contenga elementi di cella di tipo intestazione di tabella e dati di tabella.
<TD>
Elemento di cella dati di tabella. Una cella di tabella contenente dati diversi dal tipo intestazione.
<TH>
Elemento di cella intestazione di tabella. Una cella di tabella contenente un’intestazione o dei dati che descrivono una o più righe oppure colonne di una tabella.

Elementi di livello in linea

Gli elementi di livello in linea identificano una porzione di testo caratterizzata da una formattazione o un comportamento specifico. Sono distinti dagli elementi di livello blocco. È possibile che gli elementi di livello in linea contengano o siano inclusi in elementi di livello blocco.

<BibEntry>
Citazione bibliografica. Una descrizione che riporta la fonte originale delle informazioni menzionate nel testo.
<BlockQuote>
Una parte di testo in linea attribuita ad un autore diverso da quello del testo circostante. È un elemento distinto da virgolette blocco, che a differenza del testo in linea includono uno o più paragrafi per intero.
<Span>
Un segmento di testo in linea qualsiasi. In genere, viene utilizzato per delimitare del testo associato ad un gruppo di proprietà di stile.

Elementi di livello in linea speciali

Sono simili agli elementi in linea; descrivono una parte di testo in linea caratterizzata da una formattazione o un comportamento speciale.

<Code>
Elemento voce codice. Codice di programmazione informatica incorporato in un documento.
<Figure>
Elemento voce figura. Una rappresentazione visiva o un elemento di grafica associato al testo cui si riferisce.
<Form>
Elemento voce modulo. Un’annotazione modulo PDF compilabile o già compilata.
<Formula>
Elemento voce formula. Una formula matematica.
<Link>
Elemento voce collegamento. Un collegamento ipertestuale incorporato in un documento. L’oggetto di destinazione può essere all’interno dello stesso documento, in un altro file PDF oppure su un sito Web.
<Note>
Elemento voce nota. Documentazione o testo esplicativo, ad esempio una nota a piè di pagina o di chiusura, a cui viene fatto riferimento all’interno del corpo del testo principale.
<Reference>
Elemento voce riferimenti. Una citazione di testo o dati non inclusi nel documento.

Tutti questi elementi sono disponibili nella scheda Tag di Acrobat Pro, che permette di applicarli ai vari elementi del documento o di modificare i tag assegnati. In questo modo il file PDF godrà di diversi vantaggi, poiché i tag standard rendono disponibili a software e periferiche di supporto un gruppo basilare di elementi strutturali e semantici per l’interpretazione della struttura del documento e la presentazione del relativo contenuto in un formato significativo per l’utente.
Inoltre, la conversione a altri formati sarà senza dubbio più precisa ed efficace.
Questa è l’architettura dei tag base PDF, ovvero la “grammatica formale pubblicata”, per dirla con le parole dei requisiti della Stanca. Quindi, i file PDF dovrebbero essere perlomeno conformi al requisito 1 del decreto relativo, mentre il 17 sempre citato a questo proposito secondo me c’entra poco, poiché si riferisce esplicitamente a “oggetti che utilizzino tecnologie non definite da grammatiche formali pubblicate”.
È importante notare le parole “architettura dei tag base”. Perché? L’architettura dei tag PDF può essere estesa, e un PDF può contenere qualsiasi gruppo di tag utilizzato da una data applicazione di authoring.
È possibile che un file PDF presenti tag XML acquisiti da uno schema XML (anche quando il tag viene prodotto a partire da un file XHTML, ricordiamolo). È necessario che tutti i tag personalizzati definiti dall’utente, quali i nomi di tag generati da un’applicazione di authoring (un word processor, un programma di impaginazione) a partire dagli stili di paragrafo (requisito 1 dell’allegato A al decreto 30 aprile 2008, “Regole tecniche disciplinanti l’accessibilità agli strumenti didattici e formativi a favore degli alunni disabili”) dispongano di una mappa ruolo per correlare ciascun tag personalizzato ad un tag standard.

La mappa ruolo è un riferimento che consente al software di supporto di interpretare correttamente i tag personalizzati: è per questo che nella finestra di dialogo Proprietà ritocco, che mostra le proprietà del tag applicato all’elemento selezionato sono disponibili due schede: Contenuto e Tag. Nessuno ci fa caso, così si vedono in giro documenti PDF con tag dove un titolo di Livello 1 è posizionato in un contenitore di tipo Paragrafo.

la scheda Tag in Acrobat Pro

Che dire, sempre più difficile : -)

5 novembre 2008
-

Scommettiamo sugli eBook?

(gli ebook) Non si vendono per romanzi e narrativa ma funzionano per testi di formazione. Con i libri digitali gli autori guadagnano di più. Gli editori risparmiano sui costi. E l’opportunità è anche per chi li vende. Il settore è agli inizi, ma chi primo arriva…

Inizia così un lungo articolo del numero di novembre della rivista Millionaire dedicato agli e-book. Bè, anche io e Noa Carpignano siamo stati intervistati, e ovviamente diciamo le cose più intelligenti. Peccato che non ci sia la mia foto, invece Noa compare a pag. 111.

Certo che una rivista come questa, dedicata al business, che chiude un articolo così importante (l’inchiesta del mese) riservando uno spazio anche all’accessibilità degli e-book, bè fa davvero piacere. Ormai l’hanno capito tutti che l’accessibilità rende, eccetto i Webmaster. A dire la verità, certi Webmaster.

E che dire dopo la notizia dell’accordo siglato fra Google e le associazioni di editori americani? Ne vedremo delle belle, è certo.

30 ottobre 2008
-

Editoria elettronica e accessibilità

caratteristiche di un giapponeseIn precedenza si era già detto della necessità di passare dal paradigma WYSIWYG (What You See Is What You Get) a quello WYSIWYM (What You See Is What You Mean).
Non mi sembra una grande novità affermare che per poter utilizzare, come è desiderabile, gli stessi contenuti per produrre diversi output (carta, d’accordo, ma anche Web, CD, palmari, periferiche assistive, chi più ne ha più ne metta) è necessario separare contenuti e loro struttura dalle informazioni che riguardano esclusivamente la loro presentazione. Sicuramente l’avete già sentita.

Mentre per il Web questo è addirittura scontato (con risultati di varia qualità, dall’esilarante all’ottimo, ma non è questo il punto), per l’editoria non lo è, nonostante quel concetto di separazione di contenuto e presentazione risalga alla preistoria, è uno dei concetti fondamentali spiegati da E.T. a Goldfarb nella grotta e poi trasposti nella tavola delle leggi di SGML. Cinquecento anni fa, come la Spada nella Roccia.

In realtà, tutti i grossi sistemi editoriali professionali si basano da anni su flussi di lavoro in XML. Anche i più diffusi programmi di impaginazione desktop (come Indesign o Xpress) permettono di lavorare in XML, anche Word o il Writer di OpenOffice possono farlo, ma quasi nessuno adotta queste tecniche per vari motivi: la complessità intrinseca delle operazioni (nell’editoria tradizionale che cosa sia una DTD non lo sa nessuno), la continua fretta che porta ad adottare tecniche molto più che deprecate (trattasi dello stile di impaginazione definito “appiccicone”), la mancanza di aggiornamenti del software e di formazione degli operatori, e chi più ne ha più ne metta.

Però, certo questo non vieta alla tecnologia di procedere ed aggiornarsi. E in effetti, ci sono delle ottime novità. Non adottabili forse da subito a larga scala, d’accordo, ma su cui bisogna tenere l’occhio attento.

Una riguarda i formati. Uno dei problemi più grossi che affliggono l’editoria è certamente quello dei formati con cui vengono prodotti i testi. Non soltanto per la questione “formato proprietario”, ma per come vengono gestiti dai programmi di impaginazione al momento dell’importazione.

Se anche il redattore ha preparato un ottimo file .doc con tutte le sue belle caratteristiche di accessibilità (testi alternativi, title dei link, headings per le tabelle, e così via), quando il testo viene importato in Xpress, per dirne una, ciao. Si perde tutto.

Va meglio con Indesign, anche se il processo non è ancora del tutto trasparente.

Poi arriva il momento di preparare il formato di output, PDF o XHTML che sia. Dovrebbe essere accessibile, o almeno si spera. Purtroppo, non è detto. Molte informazioni vanno perse, e bisogna rimettere mano ai file di uscita. È vero che a ogni versione ci sono dei miglioramenti, ma a oggi la necessaria trasparenza e interoperabilità non c’è. Accade automaticamente (quasi…)  soltanto in un caso, da Word a PDF.  Per il resto, c’è da mettere in preventivo una verifica e un ritocco dei file.

Però, ci sono un paio di eccitanti novità che mi sembrano nella direzione giusta.

La prima novità consiste nel formato CDF (Compound Document Formats) del W3C, attualmente in fase di Candidate Reccomendation (dal 2007). Bellissima idea. Un nuovo e versatile formato che raccoglie elementi in XHTML, SVG, SMIL, MathML e XForms per comporre documenti strutturati e accessibili. Il formato è “language-independent”, e costituisce un framework in cui integrare la famiglia dei linguaggi XML del W3C fra loro (CSS, MathML, SMIL, SVG, VoiceXML, XForms, XHTML, XSL) ma anche formati non-W3C.

Bello, ma con cosa lo uso? Tempo fa avevo visto una presentazione di un sistema editoriale clamoroso basata su CDF (il video è disponibile sul sito della Just Systems). Per chi “traffica” con l’editoria, è spaventoso vedere quello che si riesce a fare con CDF e quel sistema. Tanto tempo fa, facevo la “soubrette” a SMAU per una gloriosa azienda che si chiamava Aldus. C’era un programma allora rivoluzionario, tale Pagemaker, e io passavo il mio tempo stupendo gli astanti con effetti speciali. A un certo punto si avvicina un signore anziano, guarda e si mette a ridere. Offeso mi giro, chiedo cosa ho detto di così buffo. Mi risponde: “Sa, io sono un fotocompositore tradizionale. A me non interessa nulla, sono anziano, ma sa quanti ne falliranno dei miei concorrenti con quel sistema?”. Ecco, mi torna in mente quella situazione, era l’inizio del DTP. Succederà una cosa simile, per tanti motivi (in Italia, non ultimo la nuova finanziaria e l’art. 15).

D’accordo, ma quanto mi costa? Ecco la seconda bella novità: si possono usare alcuni editor per niente…

Just Systems, azienda il cui presidente va messo su un altarino ai piedi del quale deporre fiori e bruciare incenso, ha reso disponibile un Personal Client (quello nel video è l’Enterprise, ok, ma le funzioni principali sono le stesse) da scaricare sul sito della sua community gratuitamente.

Per ribadire il concetto, c’è anche un blog editor completo di ogni benndiddio (image editor, RSS reader, YouTube, Content Aggregator, Mashbar, Mashboard, Amazon Web Service, ecc.) Insomma dategli un occhio, c’è da restare di stucco. Pure i microformat. Personalmente, il solo Mix-N-Tag XVCD mi manda fuori di testa.

Inutile aggiungere che tutti i linguaggi del W3C prevedono l’accessibilità, vero? Ecco che immaginare un sistema editoriale completamente trasparente, accessibile, basato su standard aperti non è più fantascienza, anzi è piuttosto facile. Per bontà? No, perché conviene…

23 ottobre 2008
-

Notte Stellata sul Rodano, di Van Gogh

Notte stellata sul Rodano, di Van GoghNotte stellata sul Rodano è un celebre dipinto di Van Gogh. L’Orsa Maggiore è caratterizzata dall’asterismo chiamato Grande Carro. I nomi Dubhe, Merak, Phekda, Megrez, Alioth, Mizar (e la sua compagna Alcor) e Alkaid (spero di non aver dimenticato nessuno) hanno origini arabe, come quelli di moltissime stelle. Dubhe è stato abbreviato da Tolomeo (nella sua lista tradotta letteralmente dall’arabo) da Thahr al Dubb al Akbar, “la schiena della Grande Orsa”. Merak deriva da Al Marakk, “il fianco”, mentre Phelda è “la coscia”. Megrez viene da Al Maghrez, “la radice della coda”. Alioth è un nome derivato da Alyat, la larga coda delle pecore mediorentali. Mizar è “la cintura”, nome impropriamente datole da Sealiger per sostituire quello originale, Mirak.
Alcor è una famosissima stellina del folklore astronomico; gli arabi la chiamavano Suha, “la dimenticata”, perché è solo visibile a chi ha buona vista e c’era un proverbio per chi non andasse troppo per il sottile: “gli ho mostrato Suha e costui mi mostra la Luna”.
È molto bella l’analisi che ne fa Gianluca Masi, di Virtual Telescope, su Coelum Stream. Uno studio fra pittura e astronomia piuttosto affascinante.
Il Bellatrix è un’osservatorio sito a Ceccano (FR). Oltre a essere dotato di attrezzature di alto livello, Bellatrix ha una particolarità: è possibile utilizzarlo via Internet, prenotando a costi davvero ottimi l’attrezzatura e anche un astronomo assistente, se necessario.

L’osservazione potrà essere fatta dal proprio divano, in pantofole. Anche da chi nemmeno volendo in un osservatorio potrebbe andare, perché non può muoversi. Datemi un indirizzo IP e vi mostrerò l’universo.

Che dire, fateci un giro… è entusiasmante. Bisognerà installare sul proprio pc il software di interfaccia, pagare un piccolo prezzo all’osservatorio (il pacchetto d’ingresso in modalità assistita - ovvero, un astronomo professionista vi assisterà - costa 50 euro per 5 ore, 10 euro all’ora!).

Consigliato a tutti, grandi e piccini. Sia il Virtual Telescope sia il suo canale in streaming Web, Coelum Stream.

18 ottobre 2008
-

Capire l’accessibilità

Un articolo sul Corriere di sabato mi fa riflettere su una questione che ritengo importante. Cos’è ‘sta accessibilità, perché mi devo occupare dei disabili quando faccio i miei siti?

Discorsi già fatti, con diverse soluzioni, interpretazioni, prese di posizione. Però, manca sempre qualcosa, il problema non sembra essere tecnico, etico, sociale.

Titolo dell’articolo: “Lasciano il figlio down in auto Denunciati per abbandono”.

Ma che stronzi, credo sia il primo pensiero. Poi uno legge già indignato l’articolo, e si viene a sapere che i genitori farabutti sono due ucraini, lui medico del centro di riabilitazione dell’università di Donetsk e giornalista, lei psicologa.

È allucinante lo svolgersi della vicenda: Arthur, il figlio down della coppia, è da solo in automobile. Spiega il padre: “Ad Arthur non piace girare nei negozi, quindi è rimasto in macchina. Per noi in Ucraina è normale fare così, i ragazzi down li facciamo vivere nel modo più naturale possibile. La sicure delle portiere erano aperte, aveva acqua, cibo e coperte. Se avesse avuto bisogno di una boccata d’aria, sa come abbassare i finestrini. Perché mi avete sfondato il lunotto della macchina?”.

Arthur è in macchina da un po’, a due passi dalla fontana di Trevi mentre i genitori si dedicano allo shopping. Si avvicinano dei passanti, lo guardano dai finestrini con l’aria “salviamo il disabile”.

Chiamano altri passanti, arriva un vigile, circondano la macchina. Arthur si spaventa, si chiude dentro, e ha pure ragione avrei avuto paura anche io.

Bisogna salvare il disabile, si vede che è terrorizzato! Dall’articolo: “Il volto del giovane faceva capolino fra buste e pacchetti, lo sguardo prima preoccupato, poi terrorizzato, mentre attorno alla Mitsubishi, parcheggiata in un posto per disabili in via di Santa Maria in Via, si radunava una folla di curiosi: tutti a guardare il down abbandonato”.

Arrivano i poliziotti, chiamano l’ambulanza, il povero Arthur appare sembre più terrorizzato dentro la macchina, i vetri si appannano… idea geniale: prendiamo a sprangate il lunotto, anzi no, lo hanno sfondato a colpi di chiave inglese. Ripeto, magari è sfuggito: la macchina era aperta, Arthur si è chiuso dentro vedendo quella folla che lo circondava. Allo sfondamento gli si deve essere spezzato il cuore dalla paura. “Mi ha detto papà di non aprire a nessuno”, spiega ai suoi salvatori.

La polizia ha denunciato i genitori sostenendo che in Italia non si può lasciare sole le persone disabili (sarebbe bello sapere dove sia scritto, e che cosa ne pensano i migliaia di disabili che tutti i giorni vengono lasciati completamente da soli ovunque. Però, magari non si vede).

Per ora, hanno dovuto cercare un’officina per riparare il lunotto sfondato.

A me tutto questo ricorda tanto l’atteggiamento di tanti webmaster riguardo l’accessibilità. Nonostante l’evidenza, non riescono a pensare all’accessibilità dei siti per quello che è, per i vantaggi che comporta.

No, bisogna salvare qualcuno, sennò non ne vale la pena. Salvare qualcuno se qualcuno vede, ovviamente, sennò fa niente.

L’accessibilità sembra aver bisogno di palcoscenici per attuarsi e non importa che sia necessario o richiesto, basta che si sappia. C’è qualcosa di perverso. Sul Web poi, è ancora più perverso.

L’accessibilità sul Web ci permette di essere tutti uguali. Io, Arthur, un cieco, un sordo, un uomo. Non c’è un palcoscenico, l’accessibilità è una questione privata.

In viaggio - Una questione privata (C.S.I., 1996)

Consumano la terra in percorsi obbligati i cani alla catena
Disposti a decollarsi per un passo inerte più in là
Coprono spazi ottusi gli idoli
Clonano miliziani dai ritmi cadenzati
In sincrono

Viaggiano i viandanti viaggiano i perdenti
Viaggiano i perdenti più adatti ai mutamenti viaggia Sua Santità

Viaggiano i viandanti viaggiano i perdenti più adatti ai mutamenti
Viaggia la polvere viaggia il vento viaggia l’acqua sorgente
Viaggiano i viandanti viaggiano i perdenti più adatti ai mutamenti viaggia Sua Santità
Viaggiano ansie nuove e sempre nuove crudeltà
Cadono di vertigine…
Cadono di vertigine…
Cadono di vertigine…
Cadono di vertigine…

13 ottobre 2008
-

Aree di servizio: