Audiolibri, epub3 e… accessibilità

un attore che legge un libro

Un audiolibro è un libro parlato, la riproduzione vocale di un’opera. In genere, si tratta di un libro classico o un romanzo di grande successo che viene letto da un attore e registrato in file .mp3 o altri formati audio, ma esistono anche audiolibri realizzati appositamente per questo scopo, che includono oltre ai file audio del parlato anche file musicali, scenografie sonore e quanto necessario per rappresentare, per esempio, un’opera teatrale.

Nel nostro caso, un audio e-book sarà composto da diversi file audio organizzati in una struttura e dotato di un sistema di navigazione che ne consenta la fruizione. Esistono degli standard tecnici che si occupano di fornire riferimenti su come realizzare questi audiolibri, il più conosciuto (almeno come acronimo) dei quali è probabilmente DAISY,  Digital Accessible Information System.

Qui iniziano i miei personali dubbi riguardo l’accessibilità: sul sito del Daisy Consortium spicca la scritta “Making Information Accessible for All“. Ma un audiolibro può essere davvero considerato accessibile per tutti? Molto brutalmente, che se ne fa un sordo di un audiolibro? Accessible for all? No. Inoltre, le periferiche hardware Daisy sono veramente costose, tanto da spingere il nostrano CILP (Centro Internazionale del Libro Parlato “A. Sernagiotto” – ONLUS) a sviluppare hardware dedicato a un prezzo decisamente più abbordabile. Sarà per questo, anche, che il consorzio DAISY non è che sia così simpatico?

Comunque, i tipi di Daisy hanno lavorato con gli sviluppatori di Epub 3 per creare la sezione dedicata al rendering audio TTS delle specifiche (attualmente non supportato da alcun reader)  e al meccanismo chiamato Media Overlays che permette di evidenziare in sincrono le parti del testo in lettura e il brano audio corrispondente enfatizzando questo risultato come se fosse la soluzione di tutti i mali.

Niente di nuovo, la stessa cosa si può ottenere da anni con altri strumenti, per esempio provate a leggere un brano con Balabolka, un programma TTS (text-to-speech) gratuito e davvero ben fatto.

Se aprite un epub con Balabolka ed avviate la lettura (in questo caso l’audio proviene dalla sintesi vocale installata, e non da un attore registrato mentre recita il testo), vedrete le parti del testo in lettura evidenziate mano a mano che la lettura procede.

Balabolka in azione: il testo in lettura appare evidenziato.

Balabolka in azione: il testo in lettura appare evidenziato.

Per ottenere lo stesso risultato (l’evidenziazione) ma correlando il testo a una voce recitante (quindi una base registrata, su cui non potete intervenire per quanto riguarda tono, velocità, tipo di voce), i media overlays di epub 3 prevedono l’utilizzo di SMIL (un markup del W3C) e di altre specifiche.

Qui mi sorge un altro grosso dubbio: SMIL (Synchronized Multimedia Integration Language) è un markup collaudato la cui versione più recente (3.0)  risale al 2008. Non riesco a capire che c’entra DAISY, se devo usare SMIL. Boh? Mi risponde indirettamente Matt Garrish nel suo Accessible EPUB 3, scaricabile gratuitamente da O’Reilly (il PDF non è accessibile, ma pazienza).

If you’re coming to this guide from accessibility circles, however, you’re probably wondering why this is considered new and exciting when it sounds an awful lot like the SMIL technology that has been at the core of the DAISY talking book specifications for more than a decade. And you’re right…sort of. Overlays are not new technology, but represent a new evolution of the DAISY standard, which EPUB 3 is a successor to. What is really exciting from an accessibility perspective is the chance to move this production back to the source to get high-quality audio and text synchronized ebooks directly from publishers.

Ma era così anche prima, nessuno ha mai impedito a un publisher di usare SMIL. Boh? Che c’è di eccitante? Mai sottotitolato un video? È la stessa cosa e l’hanno fatto in tanti ben prima che nascesse Epub 3.
Il libro utilizzato nell’esempio di Balabolka è un epub in versione 3, e per vederlo in azione al completo delle sue possibilità una delle pochissime opzioni disponibili (epub 3 non è che abbia avuto questo gran successo) è aprirlo in Google Chrome con Readium. Vediamo che succede.

In Readium il brano in lettura appare evidenziato in giallo.

In Readium il brano in lettura appare evidenziato in giallo.

Ascoltando la lettura, si noterà che al brano recitato in audio corrisponde una evidenziazione in giallo del testo in Readium. Come si ottiene questo? Tramite SMIL e markup.

Osservando la struttura del file epub in Sigil le cose (forse) appaiono più chiare.

In Sigil, è facile vedere il contenuto delle due cartelle Audio e Misc: tutti i file mp3 che costituiscono la libreria audio e i corrispondenti file SMIL che stabiliscono le correlazioni. Nel codice, ciascun brano viene delineato da un tag span.

Il contenuto del file epub in Sigil.

In Sigil, è facile vedere il contenuto delle due cartelle Audio e Misc: tutti i file mp3 che costituiscono la libreria audio e i corrispondenti file SMIL che stabiliscono le correlazioni. Nel codice, ciascun brano viene delineato da un tag span.

Si capisce che è un lavoro non da poco: con uno strumento di authoring bisogna selezionare ciascuna parte del testo che si intende evidenziare, associarvi le parti del brano audio con dei puntatori e aggiornare il file html con tutti gli span corrispondenti, ciascuno con una id diversa.
I file SMIL contengono informazioni di questo tipo:

<p class="chapterTitle"> <par id="p000001"><text src="p002.xhtml#f000001"/><audio clipBegin="0:00:00.000" clipEnd="0:00:02.879" src="../Audio/02_CantodiNatale_Strofa_1_A.mp3"/></par>

E nel corrispondente file html troveremo:

<h1><span id="'p000001">Strofa Prima</span></h1>

Quindi, due approcci completamente diversi: nel primo caso la lettura viene effettuata dalla sintesi vocale, nel secondo si tratta di un laborioso lavoro di sincronizzazione fra markup e file audio.

Ma, i dubbi che ho sono: nel caso Balabolka, il software di lettura è sicuramente accessibile a tutti, nel caso di Chrome/Readium no.

È un audio e-book in Epub 3 definibile come accessibile? A oggi no, o meglio lo è soltanto teoricamente: le specifiche del markup relative all’accessibilità non sono supportate da alcun reader Readium compreso (stiamo lavorando, dicono nelle FAQ. Ok, aspettiamo), e di conseguenza come verificare?  Forse è per questo che la sezione “Best Practice” delle EPUB 3 Accessibility Guidelines per ora appare “Coming Soon”. Dovrebbero esserci novità per febbraio 2013, ok, aspettiamo.

C’è qualcosa di innovativo nell’approccio di epub3? No, in generale per l’accessibilità Epub 3 si appoggia a tecnologie del W3C e le stesse cose si possono fare da anni, utilizzando tecniche standard con risultati anche più trasparenti e senza obbligare “il lettore” ad usare specifici browser ed estensioni non accessibili.

A chi giova ciò? Francamente, a parte discorsi di marketing, non lo capisco. Tempo fa ho chiesto informazioni sul forum di IDPF nella sezione relativa all’accessibilità, domandando esplicitamente che cosa intendessero con “epub accessibility“. Si sono un po’ arrabbiati, pensando che fosse una disfida fra PDF e EPUB – disfida di cui non mi interessava nulla, però onestamente ammettendo che:

You’re kind of presenting an impossible problem, though. Either EPUB stays in the past with XHTML 1.1 and doesn’t get the benefits that will come with native audio/video, mathml, aria support, etc. or, it moves forward and has to live with some instability.

The decision was made to move forward with the web, so that does leave us in a position where we have to talk about an ideal future. I certainly appreciate this fact, as there’s a line I find myself always treading between what you can say is possible versus what is possible right now.

Ok, aspettiamo… Per ora si vede molta confusione, spero che possa servire a rendere più chiare e trasparenti le cose il convegno “eBooks: Great Expectations for Web Standards” organizzato dal W3C in partnership con IDPF e BISG. Magari ce la facciamo a farcela.

Annunci

5 pensieri su “Audiolibri, epub3 e… accessibilità

  1. Full disclaimer: sono il CTO di Smuuks, che ha realizzato l’Audio-eBook citato nell’articolo.

    Ho alcune osservazioni sull’articolo.

    1) Concordo sulla mancanza di supporto (ora) ad EPUB 3 e che, di per se’, non sia la migliore specifica possibile. Tuttavia ha il grande merito di essere immediatamente retrocompatibile con EPUB 2, a differenza di soluzioni pure-HTML5.

    2) Mi pare di poter dire che Media Overlays non sia stato originariamente pensato per supportare l’accessibilita’ (infatti in http://idpf.org/epub/30/spec/epub30-mediaoverlays.html non compare la parola “accessible/accessibility”). Quindi la critica non andrebbe rivolta al meccanismo in se’, quanto al voler “venderlo” come caratteristica che rende il libro accessibile, come mi pare la chiusa suggerisca. (Ad esempio trovo i MO un’ottima funzione per l’utente che voglia imparare una lingua straniera tramite ascolto e lettura sincroni.)

    3) Readium non nasce come ambiente destinato all’utente finale, ma al testing per gli addetti ai lavori. La penuria di lettori EPUB3 alternativi (ma qualcosa si sta muovendo proprio in questi giorni…) l’ha fatto diventare una scelta (quasi) obbligata per la fruizione di EPUB 3. BTW, Readium offre un controllo della velocita’ e del volume dell’audio riprodotto tramite Media Overlays.

    4) Della chiusa non capisco bene la frase: “È un audio e-book definibile come accessibile? No, è per definizione riservato a determinati utenti, che perlomeno devono poter udire quanto letto dall’attore. “. In che cosa differisce un Audio-eBook EPUB 3 riprodotto in Readium dallo stesso file riprodotto in Balabolka? In particolare, un lettore non udente puo’ comunque leggere il testo, esattamente con lo stesso meccanismo per cui chi non riesce a vedere un’immagine puo’ fruirla tramite la descrizione fornita dal testo alternativo in una pagina HTML.

  2. Ciao CTO Alberto.

    1. Non ho capito perché sollevi la questione HTML 5 puro, stiamo parlando di epub, no?

    2. Dalle specifiche:
    4.4 Aural Renditions and Media Overlays
    Aural renditions of content are important for accessibility and are a desirable feature for many other Users…
    …Media Overlays provide the ability to synchronize the text and audio content of a Publication, a feature already familiar to readers of DAISY Digital Talking Books.
    I DAISY Digital Talking Books fanno dell’accessibilità il loro vanto, di conseguenza mi sembra che sì, i media overlays possano essere a ragione ritenuti importanti per l’accessibilità in EPUB 3. Questo riferimento così diretto nelle specifiche porta perlomeno a poter pensare che li abbiano inseriti proprio pensando all’accessibilità, credo. Sennò perché tirare in ballo DAISY?
    Poterne disporre anche secondo me è una cosa utile, utilizzarli per definire un prodotto come “accessibile” no, non è vero.

    3. Per chi e per quale motivo Readium sia stato sviluppato viene dichiarato sul sito relativo: “The overall aim of the Readium project is to ensure that open source software for handling EPUB 3 publications is readily available, to accelerate adoption of EPUB 3 as the universal, accessible, global digital publishing format”.
    Che può essere letto “Siccome a nessuno gliene frega nulla di EPUB 3 e non c’è un e-reader che permetta di utilizzarlo, allora facciamo noi un reader e lo mettiamo a disposizione di chiunque”. Non mi pare che venga fatta alcuna distinzione riguardo agli sviluppatori o agli utenti, anzi, l’obbiettivo dichiarato è accelerare l’adozione del formato, quindi più persone usano Readium meglio è.
    Che poi nelle FAQ scrivano diversamente, non è certo un mio problema…
    Che funzioni il volume, ci mancherebbe… quello della velocità per me non funziona, riproverò. Ma mi sembra secondario.

    4. Balabolka non è in grado di riprodurre un audio e-book in epub3, la lettura viene effettuata dalla sintesi vocale. Dal punto di vista utente invece, la differenza è il reader: Balabolka (il software, intendo, la sua interfaccia) è completamente accessibile, mentre nonostante le accorate dichiarazioni di intenti l’accoppiata Chrome/Readium per ora non lo è ancora (per esempio, l’uso di iframe nell’interfaccia non è che sia proprio proprio questa gran soluzione). Non ho dubbi che fra qualche versione cambierà, che le cose andranno meglio. Però, per ora, questa soluzione non è definibile come accessibile, così come un audio e-book non lo può essere (se per accessibilità intendiamo la possibilità di fruire del contenuto da parte di tutti gli utenti, indipendentemente dalla loro condizione fisica e dalle periferiche utilizzate) perché nasce per essere ascoltato, fruito dai non vedenti. Che poi lo si possa utilizzare anche in altri modi, ci mancherebbe. La maggior parte dei non vedenti che conosco rinomina i file epub in zip, li scompatta e legge l’xhtml… ma non è che perché lo screen reader li può leggere che si può dire “accessibile”.
    Comunque hai ragione, la frase è ambigua, la correggerò. In ogni caso, il post non riguarda quel lavoro nello specifico, è un esempio utilizzato perché Cristiana mi ha invitato a scaricarlo 🙂

  3. Intanto grazie per i chiarimenti sul post.

    1) Citavo HTML5 perche’ secondo me e’ il candidato naturale, appena si vogliono supportare funzioni “avanzate” (non testo/immagini). Immagino siamo tutti d’accordo che se vogliamo solo testo, link interni e immagini, allora un qualsiasi linguaggio di markdown (neanche di markup) sarebbe piu’ che sufficiente e piu’ facilmente processabile.

    2) La frase omessa: “Overlays transcend the accessibility domain in their usefulness: the synchronization of text and audio as a tool for learning to read, for example, being of benefit in many circumstances.” credo renda chiaro il perche’ della loro presenza in EPUB 3. Sottolineo io stesso che il fatto che i MO siano nella sezione “Accessibility” dell’overview sia fuorviante. Infatti, nella pagina della specifica, come dicevo sopra, non compare la parola accessible/accessibility.

    3) Hachette e altri colossi editoriali stanno gia’ cambiando i loro workflow, per supportare EPUB 3. Ci sono un paio di progetti ben avviati di app iOS/Android che supportano (parzialmente) EPUB 3, tra cui IDEAL Group Reader. Credo siamo di fronte al classico problema non c’e’ offerta di contenuti/non c’e’ interesse a supportarla, aggravato dal fatto che a) EPUB 2 e’ piu’ che sufficiente per il 95% delle esigenze dei (pessimi) eBook come sono propinati ora, e b) EPUB 3 comunque ha alcune lacune pesanti, ben descritte da questo post di Fabrizio Venerandi (http://salvoesaurimentoscorte.wordpress.com/2012/10/05/cinque-cose-che-vorrei-da-editore-per-progettare-ebook/). Premesso questo, il problema della decompressione dei file in Readium si verifica solo sotto Windows: su Linux e su Mac OS X non c’e’ bisogno di decomprimere manualmente i file EPUB 3 per riuscire a riprodurli.

    4) Ora capisco meglio: l’attenzione era sull’accessibilita’ del software di lettura. Ma allora la critica deve essere rivolta ai (mancanti) software (accessibili) di lettura, non verso il formato letto, e dovrebbe essere parametrizzata dal tempo trascorso dall’introduzione ufficiale della specifica (EPUB 3 e’ stato rilasciato a Ottobre 2011). Ad esempio, su iPad l’app gratuita e precaricata iBooks supporta VoiceOver e supporta la descrizione vocale del controllo dell’EPUB 3 citato e dei link di navigazione tra capitoli.

  4. Non è una frase omessa, evidenziavo la parte relativa all’accessibilità. Inoltre, in Accessible EPUB 3 Matt Garrish dedica alcune pagine ai media overlay citando sempre l’accessibilità e bla bla.
    È ovvio che sto parlando della situazione attuale, nel futuro avremo EPUB 5 che cambierà tutto. Ma per ora è così…
    iBooks supporta tante cose interessanti, ma se devo comprare un Ipad per leggere un epub3… no grazie, ovvio. Se voglio approfittare del testo evidenziato, uso Balabolka e pazienza per la fine lettura.
    La decompressione dei file queste persone la fanno perché i file xhtml riescono a leggerli senza problemi, l’epub con difficoltà.

Rispondi

Inserisci i tuoi dati qui sotto o clicca su un'icona per effettuare l'accesso:

Logo WordPress.com

Stai commentando usando il tuo account WordPress.com. Chiudi sessione / Modifica )

Foto Twitter

Stai commentando usando il tuo account Twitter. Chiudi sessione / Modifica )

Foto di Facebook

Stai commentando usando il tuo account Facebook. Chiudi sessione / Modifica )

Google+ photo

Stai commentando usando il tuo account Google+. Chiudi sessione / Modifica )

Connessione a %s...