Web agencies le tragicomiche
Sottotitolo: Scano il grande Babau.
Questa è davvero bella. Come già raccontato, sto dando una mano a un mio amico affinché riesca almeno a rattoppare un grosso investimento che ha fatto in un portale con risultati mediocri.
Il portale è gestito con un CMS, che si presenta affermando: “xxxxxx genera pagine xHTML (nuova versione del linguaggio HTML) molto leggere e compatibili con le specifiche del W3C. Questa nuova evoluzione permette di creare pagine web più accessibili e fruibili.”
Bene, mi dico, che culo almeno il codice sarà a posto. Provo una semplice verifica con CSE Validator, e voilà, gli errori sono talmente tanti che il prode CSE si inchioda, è la prima volta che mi capita di vedere una cosa del genere. Riduco il numero di pagine da verificare, soltanto il primo livello. Report da 6 mega per 50 pagine, mai visto. Errori medi per pagina 110+90 warning. Alla faccia del codice W3C compliant…
Vabbè, scrivo a questi signori e dico “Scusate, ma voi affermate questo, questo e quest’altro. Inoltre, fra le varie cose da considerare ci sarebbero le richieste di Google, Yahoo Search e Live Search. Siccome avete venduto il vostro lavoro come un prodigio della scienza e della tecnica, ci piacerebbe che almeno il sito fosse conforme alle richieste esplicite dei motori di ricerca, compreso un test con Lynx e la validità del codice come richiesto da Google”.
Sapevo di toccare un nervo scoperto, ma mai mi sarei aspettato che il “software manager” (che sarà?) dell’azienda mi rispondesse una cosa veramente esilarante, per me. Lui alle mie risposte di certo non si è divertito.
Comunque, questo tizio mi dice (potete cominciare a ridere):
“xxxxxx e’ sempre stata pronta ad accogliere proposte relative a migliorie riguardo il SEO. La sua decantata pulizia del codice e’ arretrata. Sa che ormai Google legge flash? Sa che io sono stato membro della commissione per l’accessibilita’ in Italia? Conosce Scano? Ahime’, la sua filosofia e’ aria fritta.”
Cioé, mi minaccia chiedendomi se conosco Scano (ma che avrà voluto dire? Mi avrebbe aizzato contro Roberto? Roberto sarebbe venuto a picchiarmi nottetempo?) e che LUI è stato membro della commissione per l’accessibilità in Italia (cosa ovviamente non vera)? A me?
Per compassione non riporto lo scambio di email successivo, ora questo bel somaro sta tentando di farsi aggiungere in Skype da Roberto, che giustamente lo ha messo in blacklist, perché gli ho detto che Roberto l’avrebbe diffidato dall’usare il suo nome e quello di IWA ed è terrorizzato. Cioé, non si preoccupa della causa che gli farà il mio amico se non mette a posto il sito, ha paura di Scano! E dire che mi sembrava una persona così gentile e a modo, Roberto.
Ma che gente c’è in giro per il Web? Saranno mica amici dei tizi segnalati da Lauryn?E sto parlando di una grossa web agency, non di ragazzini. Mah.
La causa, se avverrà ma dubito perché ho preparato un cartoncino con la foto di Scano da mostrare a quelli dell’agenzia se non volessero ottemperare (chi mi conosce sa che lo farò), sarà decisamente interessante. Perché se tu, web agency o professionista, mi dici che il sito fatto da te è ottimizzato per i motori di ricerca e il codice prodotto è conforme agli standard ma a una semplice verifica si scopre che non è così e non rispetti nemmeno le linee guida dei motori di ricerca, i reati commessi sono diversi, dal penale al civile.
La discussione per ora si è fermata a questo punto: “Buongiorno Livio. Sono veramente rattristato che questa discussione sia andata su binari poco piacevoli. Il mio intento è quella di aiutare tutti gli utenti finali del CMS. Le sue richieste sono a livello tecnico chiare. Gradirei però avere un confronto telefonico con lei. E’ possibile? Può darmi un contatto?”, dice l’asino.
Inoltre mi chiede: “[…]Detto questo, come intende procedere? Visto che lei è il cliente, ci richiede lo standard W3C? L’accessibilità?”, dimostrando per l’ennesima volta di non avere capito nemmeno l’argomento e di confondere il codice valido con l’accessibilità. Come tanti altri “professionisti”, purtroppo.
Io rispondo:
“Proprio lei non ce la fa a capire: Google indicizza qualsiasi cosa a cui possa accedere, è pacifico. A noi non interessa una indicizzazione mediocre, come dimostrano i risultati. Vogliamo e pretendiamo la migliore indicizzazione possibile, come richiesto da progetto e come pagato.
A noi basta che le pagine siano fatte come richiede Google nella sua guida per i webmaster
(http://www.google.com/support/webmasters/bin/answer.py?answer=35769), Yahoo nella analoga guida (http://help.yahoo.com/l/us/yahoo/search/ranking/ranking-02.html) e Live Search altrettanto (http://help.live.com/help.aspx?mkt=en-us&project=wl_webmasters).
Il sito xxxxxxxxx è ben lontano dal rispettare le richieste tecniche di queste guide dei principali motori di ricerca, non c’è da discutere altro se non l’adeguamento del sito.
Questo nonostante fra le richieste di progetto ci fosse al primo posto la richiesta della migliore indicizzazione possibile.
La invito per l’ennesima volta a smettere di stupirsi e a cominciare a lavorare”.
Perché è un conto discutere di rispetto o meno di standard de facto, un altro se mi certifichi che il tuo sito sarà conforme alle richieste dei motori di ricerca e poi non è così per vari motivi, che comprendono l’ignoranza e l’incapacità.
Ricordo a tutti i webmaster, le web agencies, e a chi lavora su queste cose, che Google dice espressamente delle sue linee guida:
Live Search dice: “Use only well-formed HTML code in your pages. Make sure that all tags are closed, and that all links open the correct web page”.
Se non lo fai, ‘azzi tua… Ora vallo a spiegare ai tuoi clienti come mai hanno speso migliaia di euro, farcito i loro testi di ogni carambola letteraria, riempito le pagine con astruse formule esoteriche e nonostante tutto il loro sito nella SERP non sale. Cosa fai, chiami il babau?
p.s. Per ora non mi interessa litigare con questi tizi, preferirei che mettessero a posto il sito. Però, facendo una piccola ricerca con la frase “Questa nuova evoluzione permette di creare pagine web più accessibili e fruibili” che ho copiato/incollato il mio sito, per niente SEO optimized o con un qualsiasi tipo di pretesa, facendo una ricerca su tutto il Web appare al primo posto. Il sito di questa web agency viene dopo. Provare per credere.
C’è qualche esperto che mi sa spiegare perché? Non dovrebbe essere l’esatto contrario? Il primo motivo che mi viene in mente è che il mio sito è basato su codice valido e ben strutturato diversamente da quello dell’agenzia, ma certo ci saranno anche altri motivi, che mi sfuggono. Con la ricerca “Scano babau” poi batto ogni concorrenza, su tutti i motori di ricerca.
aggiornamento: la ricerca “Scano babau” non funziona più, lo Scano ha appena pubblicato un post intitolato “Scano babau, ovvero Lei non sa chi conosco io!” e mi ha rovinato il posizionamento su queste keyword perché lui ha un pagerank enorme.
Archiviato in Design, Markup | Comments (33)PDF con tag e accessibilità
Capita, come in tante altre occasioni, di sentir dire in modo un po’ approssimativo che “i PDF taggati sono accessibili”. Bè, non è vero, è come dire che una pagina HTML siccome è in HTML è accessibile. Magari, verrebbe da dire.
Certamente un PDF dotato di una struttura a tag è il primo passo necessario verso l’accessibilità. Ma, proprio come accade con le pagine Web, è soltanto un pezzetto del puzzle.
Il formato PDF dispone di un proprio set di tag standard, un po’ come fosse una DTD (è soltanto una semplificazione, non prendetela alla lettera), e dispone di vari elementi, adatti a descrivere il significato semantico dei contenuti a cui si applicano. Gli elementi disponibili sono (dall’help di Acrobat):
Elementi contenitore
Gli elementi contenitore rappresentano il livello più alto e offrono un raggruppamento gerarchico agli altri elementi di livello blocco.
<Document>- L’elemento principale nella struttura ad albero tag di un documento.
<Part>- Rappresenta una suddivisione ampia del documento e può raggruppare unità di contenuto di dimensioni inferiori, ad esempio elementi reparto, articolo o sezione.
<Div>- È un elemento di livello blocco generico o un gruppo di elementi di livello blocco.
<Art>- È un corpo del testo indipendente e viene considerato un resoconto singolo.
<Sect>- Si tratta di un tipo di elemento contenitore generico, paragonabile a Reparto (DIV Class=“Sect”) in codice HTML; in genere è un componente di un elemento parte o articolo.
Elementi titolo e paragrafo
Sono elementi di blocco che includono specifici livelli di titoli e paragrafi di testo generici <P>. Un elemento <H> può presentarsi come primo child di un livello div superiore. Per le situazioni in cui non esistono sezioni annidate sono disponibili sei livelli di titolo <H1>–<H6> generici.
Elementi etichetta ed elenco
Gli elementi etichetta ed elenco sono elementi di livello blocco utilizzati per conferire una struttura agli elenchi.
<L>- Una qualsiasi sequenza di voci dal significato o da un altro tipo di pertinenza simile. È possibile che gli elementi secondari diretti siano elementi voce di elenco.
<LI>- Qualsiasi voce inclusa in un elenco. È possibile che presenti un elemento etichetta (facoltativo) e corpo elenco (obbligatorio) come elemento secondario.
<LBL>- Etichetta. Un punto elenco, un nome o un numero di identificazione per distinguere un elemento dagli altri all’interno dello stesso elenco.
<LBody>- Elemento corpo elenco. Il contenuto descrittivo di una voce di elenco.
Elementi testo speciale
Gli elementi di testo speciale identificano parti del testo non utilizzate come paragrafo generico (P).
<BlockQuote>- Elemento virgolette blocco. Uno o più paragrafi attribuiti ad un autore diverso da quello del testo immediatamente circostante.
<Caption>- Elemento didascalia. Una breve parte di testo che descrive una tabella o una figura.
<Index>- Elemento indice. Una sequenza di voci contenenti testo identificativo ed elementi di riferimento che indicano la ricorrenza di tale testo nel corpo principale del documento.
<TOC>- Elemento sommario. Un elemento contenente un elenco strutturato di voci ed etichette che identificano le voci e dotato di una struttura gerarchica separata.
<TOCI>- Elemento voce di sommario. Un elemento contenuto in un elenco associato ad un elemento sommario.
Elementi tabella
Gli elementi tabella conferiscono struttura alle tabelle.
<Table>- Elemento tabella. Una disposizione bidimensionale di celle di testo o di dati contente elementi riga di tabella come elementi secondari, nonché un elemento didascalia come primo o ultimo elemento secondario (facoltativo).
<TR>- Elemento riga di tabella. Una riga di intestazioni o dati in una tabella. È possibile che contenga elementi di cella di tipo intestazione di tabella e dati di tabella.
<TD>- Elemento di cella dati di tabella. Una cella di tabella contenente dati diversi dal tipo intestazione.
<TH>- Elemento di cella intestazione di tabella. Una cella di tabella contenente un’intestazione o dei dati che descrivono una o più righe oppure colonne di una tabella.
Elementi di livello in linea
Gli elementi di livello in linea identificano una porzione di testo caratterizzata da una formattazione o un comportamento specifico. Sono distinti dagli elementi di livello blocco. È possibile che gli elementi di livello in linea contengano o siano inclusi in elementi di livello blocco.
<BibEntry>- Citazione bibliografica. Una descrizione che riporta la fonte originale delle informazioni menzionate nel testo.
<BlockQuote>- Una parte di testo in linea attribuita ad un autore diverso da quello del testo circostante. È un elemento distinto da virgolette blocco, che a differenza del testo in linea includono uno o più paragrafi per intero.
<Span>- Un segmento di testo in linea qualsiasi. In genere, viene utilizzato per delimitare del testo associato ad un gruppo di proprietà di stile.
Elementi di livello in linea speciali
Sono simili agli elementi in linea; descrivono una parte di testo in linea caratterizzata da una formattazione o un comportamento speciale.
<Code>- Elemento voce codice. Codice di programmazione informatica incorporato in un documento.
<Figure>- Elemento voce figura. Una rappresentazione visiva o un elemento di grafica associato al testo cui si riferisce.
<Form>- Elemento voce modulo. Un’annotazione modulo PDF compilabile o già compilata.
<Formula>- Elemento voce formula. Una formula matematica.
<Link>- Elemento voce collegamento. Un collegamento ipertestuale incorporato in un documento. L’oggetto di destinazione può essere all’interno dello stesso documento, in un altro file PDF oppure su un sito Web.
<Note>- Elemento voce nota. Documentazione o testo esplicativo, ad esempio una nota a piè di pagina o di chiusura, a cui viene fatto riferimento all’interno del corpo del testo principale.
<Reference>- Elemento voce riferimenti. Una citazione di testo o dati non inclusi nel documento.
Tutti questi elementi sono disponibili nella scheda Tag di Acrobat Pro, che permette di applicarli ai vari elementi del documento o di modificare i tag assegnati. In questo modo il file PDF godrà di diversi vantaggi, poiché i tag standard rendono disponibili a software e periferiche di supporto un gruppo basilare di elementi strutturali e semantici per l’interpretazione della struttura del documento e la presentazione del relativo contenuto in un formato significativo per l’utente.
Inoltre, la conversione a altri formati sarà senza dubbio più precisa ed efficace.
Questa è l’architettura dei tag base PDF, ovvero la “grammatica formale pubblicata”, per dirla con le parole dei requisiti della Stanca. Quindi, i file PDF dovrebbero essere perlomeno conformi al requisito 1 del decreto relativo, mentre il 17 sempre citato a questo proposito secondo me c’entra poco, poiché si riferisce esplicitamente a “oggetti che utilizzino tecnologie non definite da grammatiche formali pubblicate”.
È importante notare le parole “architettura dei tag base”. Perché? L’architettura dei tag PDF può essere estesa, e un PDF può contenere qualsiasi gruppo di tag utilizzato da una data applicazione di authoring.
È possibile che un file PDF presenti tag XML acquisiti da uno schema XML (anche quando il tag viene prodotto a partire da un file XHTML, ricordiamolo). È necessario che tutti i tag personalizzati definiti dall’utente, quali i nomi di tag generati da un’applicazione di authoring (un word processor, un programma di impaginazione) a partire dagli stili di paragrafo (requisito 1 dell’allegato A al decreto 30 aprile 2008, “Regole tecniche disciplinanti l’accessibilità agli strumenti didattici e formativi a favore degli alunni disabili”) dispongano di una mappa ruolo per correlare ciascun tag personalizzato ad un tag standard.
La mappa ruolo è un riferimento che consente al software di supporto di interpretare correttamente i tag personalizzati: è per questo che nella finestra di dialogo Proprietà ritocco, che mostra le proprietà del tag applicato all’elemento selezionato sono disponibili due schede: Contenuto e Tag. Nessuno ci fa caso, così si vedono in giro documenti PDF con tag dove un titolo di Livello 1 è posizionato in un contenitore di tipo Paragrafo.
Che dire, sempre più difficile : -)
Archiviato in Accessibilità, PDF | Comments (4)Scommettiamo sugli eBook?
(gli ebook) Non si vendono per romanzi e narrativa ma funzionano per testi di formazione. Con i libri digitali gli autori guadagnano di più. Gli editori risparmiano sui costi. E l’opportunità è anche per chi li vende. Il settore è agli inizi, ma chi primo arriva…
Inizia così un lungo articolo del numero di novembre della rivista Millionaire dedicato agli e-book. Bè, anche io e Noa Carpignano siamo stati intervistati, e ovviamente diciamo le cose più intelligenti. Peccato che non ci sia la mia foto, invece Noa compare a pag. 111.
Certo che una rivista come questa, dedicata al business, che chiude un articolo così importante (l’inchiesta del mese) riservando uno spazio anche all’accessibilità degli e-book, bè fa davvero piacere. Ormai l’hanno capito tutti che l’accessibilità rende, eccetto i Webmaster. A dire la verità, certi Webmaster.
E che dire dopo la notizia dell’accordo siglato fra Google e le associazioni di editori americani? Ne vedremo delle belle, è certo.
Archiviato in Libri | Comments (15)Editoria elettronica e accessibilità
In precedenza si era già detto della necessità di passare dal paradigma WYSIWYG (What You See Is What You Get) a quello WYSIWYM (What You See Is What You Mean).
Non mi sembra una grande novità affermare che per poter utilizzare, come è desiderabile, gli stessi contenuti per produrre diversi output (carta, d’accordo, ma anche Web, CD, palmari, periferiche assistive, chi più ne ha più ne metta) è necessario separare contenuti e loro struttura dalle informazioni che riguardano esclusivamente la loro presentazione. Sicuramente l’avete già sentita.
Mentre per il Web questo è addirittura scontato (con risultati di varia qualità, dall’esilarante all’ottimo, ma non è questo il punto), per l’editoria non lo è, nonostante quel concetto di separazione di contenuto e presentazione risalga alla preistoria, è uno dei concetti fondamentali spiegati da E.T. a Goldfarb nella grotta e poi trasposti nella tavola delle leggi di SGML. Cinquecento anni fa, come la Spada nella Roccia.
In realtà, tutti i grossi sistemi editoriali professionali si basano da anni su flussi di lavoro in XML. Anche i più diffusi programmi di impaginazione desktop (come Indesign o Xpress) permettono di lavorare in XML, anche Word o il Writer di OpenOffice possono farlo, ma quasi nessuno adotta queste tecniche per vari motivi: la complessità intrinseca delle operazioni (nell’editoria tradizionale che cosa sia una DTD non lo sa nessuno), la continua fretta che porta ad adottare tecniche molto più che deprecate (trattasi dello stile di impaginazione definito “appiccicone”), la mancanza di aggiornamenti del software e di formazione degli operatori, e chi più ne ha più ne metta.
Però, certo questo non vieta alla tecnologia di procedere ed aggiornarsi. E in effetti, ci sono delle ottime novità. Non adottabili forse da subito a larga scala, d’accordo, ma su cui bisogna tenere l’occhio attento.
Una riguarda i formati. Uno dei problemi più grossi che affliggono l’editoria è certamente quello dei formati con cui vengono prodotti i testi. Non soltanto per la questione “formato proprietario”, ma per come vengono gestiti dai programmi di impaginazione al momento dell’importazione.
Se anche il redattore ha preparato un ottimo file .doc con tutte le sue belle caratteristiche di accessibilità (testi alternativi, title dei link, headings per le tabelle, e così via), quando il testo viene importato in Xpress, per dirne una, ciao. Si perde tutto.
Va meglio con Indesign, anche se il processo non è ancora del tutto trasparente.
Poi arriva il momento di preparare il formato di output, PDF o XHTML che sia. Dovrebbe essere accessibile, o almeno si spera. Purtroppo, non è detto. Molte informazioni vanno perse, e bisogna rimettere mano ai file di uscita. È vero che a ogni versione ci sono dei miglioramenti, ma a oggi la necessaria trasparenza e interoperabilità non c’è. Accade automaticamente (quasi…) soltanto in un caso, da Word a PDF. Per il resto, c’è da mettere in preventivo una verifica e un ritocco dei file.
Però, ci sono un paio di eccitanti novità che mi sembrano nella direzione giusta.
La prima novità consiste nel formato CDF (Compound Document Formats) del W3C, attualmente in fase di Candidate Reccomendation (dal 2007). Bellissima idea. Un nuovo e versatile formato che raccoglie elementi in XHTML, SVG, SMIL, MathML e XForms per comporre documenti strutturati e accessibili. Il formato è “language-independent”, e costituisce un framework in cui integrare la famiglia dei linguaggi XML del W3C fra loro (CSS, MathML, SMIL, SVG, VoiceXML, XForms, XHTML, XSL) ma anche formati non-W3C.
Bello, ma con cosa lo uso? Tempo fa avevo visto una presentazione di un sistema editoriale clamoroso basata su CDF (il video è disponibile sul sito della Just Systems). Per chi “traffica” con l’editoria, è spaventoso vedere quello che si riesce a fare con CDF e quel sistema. Tanto tempo fa, facevo la “soubrette” a SMAU per una gloriosa azienda che si chiamava Aldus. C’era un programma allora rivoluzionario, tale Pagemaker, e io passavo il mio tempo stupendo gli astanti con effetti speciali. A un certo punto si avvicina un signore anziano, guarda e si mette a ridere. Offeso mi giro, chiedo cosa ho detto di così buffo. Mi risponde: “Sa, io sono un fotocompositore tradizionale. A me non interessa nulla, sono anziano, ma sa quanti ne falliranno dei miei concorrenti con quel sistema?”. Ecco, mi torna in mente quella situazione, era l’inizio del DTP. Succederà una cosa simile, per tanti motivi (in Italia, non ultimo la nuova finanziaria e l’art. 15).
D’accordo, ma quanto mi costa? Ecco la seconda bella novità: si possono usare alcuni editor per niente…
Just Systems, azienda il cui presidente va messo su un altarino ai piedi del quale deporre fiori e bruciare incenso, ha reso disponibile un Personal Client (quello nel video è l’Enterprise, ok, ma le funzioni principali sono le stesse) da scaricare sul sito della sua community gratuitamente.
Per ribadire il concetto, c’è anche un blog editor completo di ogni benndiddio (image editor, RSS reader, YouTube, Content Aggregator, Mashbar, Mashboard, Amazon Web Service, ecc.) Insomma dategli un occhio, c’è da restare di stucco. Pure i microformat. Personalmente, il solo Mix-N-Tag XVCD mi manda fuori di testa.
Inutile aggiungere che tutti i linguaggi del W3C prevedono l’accessibilità, vero? Ecco che immaginare un sistema editoriale completamente trasparente, accessibile, basato su standard aperti non è più fantascienza, anzi è piuttosto facile. Per bontà? No, perché conviene…
Archiviato in Accessibilità, Libri, Markup | Comment (1)Notte Stellata sul Rodano, di Van Gogh
Notte stellata sul Rodano è un celebre dipinto di Van Gogh. L’Orsa Maggiore è caratterizzata dall’asterismo chiamato Grande Carro. I nomi Dubhe, Merak, Phekda, Megrez, Alioth, Mizar (e la sua compagna Alcor) e Alkaid (spero di non aver dimenticato nessuno) hanno origini arabe, come quelli di moltissime stelle. Dubhe è stato abbreviato da Tolomeo (nella sua lista tradotta letteralmente dall’arabo) da Thahr al Dubb al Akbar, “la schiena della Grande Orsa”. Merak deriva da Al Marakk, “il fianco”, mentre Phelda è “la coscia”. Megrez viene da Al Maghrez, “la radice della coda”. Alioth è un nome derivato da Alyat, la larga coda delle pecore mediorentali. Mizar è “la cintura”, nome impropriamente datole da Sealiger per sostituire quello originale, Mirak.
Alcor è una famosissima stellina del folklore astronomico; gli arabi la chiamavano Suha, “la dimenticata”, perché è solo visibile a chi ha buona vista e c’era un proverbio per chi non andasse troppo per il sottile: “gli ho mostrato Suha e costui mi mostra la Luna”.
È molto bella l’analisi che ne fa Gianluca Masi, di Virtual Telescope, su Coelum Stream. Uno studio fra pittura e astronomia piuttosto affascinante.
Il Bellatrix è un’osservatorio sito a Ceccano (FR). Oltre a essere dotato di attrezzature di alto livello, Bellatrix ha una particolarità: è possibile utilizzarlo via Internet, prenotando a costi davvero ottimi l’attrezzatura e anche un astronomo assistente, se necessario.
L’osservazione potrà essere fatta dal proprio divano, in pantofole. Anche da chi nemmeno volendo in un osservatorio potrebbe andare, perché non può muoversi. Datemi un indirizzo IP e vi mostrerò l’universo.
Che dire, fateci un giro… è entusiasmante. Bisognerà installare sul proprio pc il software di interfaccia, pagare un piccolo prezzo all’osservatorio (il pacchetto d’ingresso in modalità assistita - ovvero, un astronomo professionista vi assisterà - costa 50 euro per 5 ore, 10 euro all’ora!).
Consigliato a tutti, grandi e piccini. Sia il Virtual Telescope sia il suo canale in streaming Web, Coelum Stream.
Archiviato in astronomia, generale | Comment (0)