segunda-feira, 30 de junho de 2008

19. PDF vs. XML | Optimização do e-book LIM

O formato PDF (Portable Document Format) está a tornar-se cada vem mais popular no seio da comunidade cibernética. A Internet possibilitou a conversão, distribuição e troca de documentos electrónicos entre indivíduos e, por esse mesmo motivo, a tecnologia PDF assumiu grande importância neste domínio.

O PDF surgiu em 1993 graças a um dos fundadores da empresa Adobe Systems, John Warnock. O seu grande objectivo era criar "uma tecnologia que permitisse a visualização de arquivos em qualquer computador, independente de plataforma, e que pudesse ser impresso em qualquer impressora" (Arquivos PDF).

Baseando-me na informação disponibilizada no sítio web da Adobe e no blogue da colega de turma Rita Sousa - INcluindo, o referido formato apresenta as seguintes vantagens:
  • Possibilita a distribuição e troca segura de documentos e formulários electrónicos em todo o mundo;
  • É um formato de arquivo universal que preserva as fontes, imagens, gráficos e o layout de qualquer documento de origem, independentemente do aplicativo e da plataforma usados para criá-lo;
  • Os arquivos Adobe® PDF são compactos e completos, podendo ser compartilhados, visualizados e impressos por qualquer pessoa com o software gratuito Adobe Reader®;
  • Acelera a gestão de documentos;
  • Aumento da compressão;
  • Aumenta a produtividade;
  • Reduz a necessidade de papel;
  • Possibilidade de protecção através de senhas;
  • Dificuldade em adicionar vírus ou programas maliciosos em arquivos PDF;
  • É uma especificação de formato de arquivo aberto e está disponível para qualquer pessoa que queira desenvolver ferramentas para criar, visualizar ou manipular documentos PDF.
O e-book do LIM é apresentado em formato PDF, muito usual neste tipo de produtos. Contudo, embora existam inúmeras vantagens na utilização deste formato, como já foi referido anteriormente, há uma questão que o PDF negligencia - a Acessibilidade, apresentando as seguintes desvantagens:
  • Os documentos não são exibidos correctamente em dispositivos portáveis;
  • Os documentos com formatação complexa não podem ser lidos por utilizadores com deficiência visual;
  • O PDF não é considerado um standard W3C;
  • Os documentos em formato PDF apresentam sérias dificuldades na leitura através de leitores de ecrã devido à falta de estrutura;
  • Por tudo isto, torna-se uma barreira ao conceito de "Design Universal", um design para todos.
Tendo em conta o âmbito da disciplina e o desenvolvimento deste trabalho, é bastante relevante dar atenção a estes pontos negativos, apresentado soluções eficazes e eficientes.
Após um exaustivo trabalho de pesquisa em artigos publicados, em sítios web e em blogues referentes a este assunto, sinto-me capaz de apontar melhorias, de forma a promover a acessibilidade e a possibilidade de funcionamento do e-book em várias plataformas.


Uma boa solução para investir na optimização do produto seria apostar na linguagem XML (eXtensible Markup Language), um subconjunto do SGML (Standard Generalized Markup Language) existente desde a década de 80. Desenvolvida desde 1996 e padronizada pelo W3C desde 1998, esta linguagem vem dar resposta a muitos problemas de acessibilidade. Tendo como características principais a estruturação dos dados de forma eficaz, a semelhança com HTML e a interligação de diversas linguagens, XML promete ser o futuro da Internet. Aposta no formato DAISY (Digital Accessible Information System), um Consórcio que torna toda a informação publicada acessível a pessoas com "print disabilities". O formato DAISY é um DTB (Digital Talking Book), uma representação multimédia de uma publicação impressa. Em traços gerais, o DAISY é constituído por diversos tipos de ficheiros e em formatos específicos, produzindo livros que permitem ouvir e ler o texto em simultâneo.

As suas principais vantagens da linguagem XML são as seguintes:
  • É uma recomendação do W3C;
  • Permite gerar linguagens de marcação, isto é, um conjunto de códigos aplicados a um texto para acrescentar dados sobre esse mesmo texto;
  • Facilita a partilha de informações através da Internet;
  • Engloba diversas linguagens, tais como XHTML, RDF, SVG, SDMX, MathML, NCL, XBRL, SMIL, XSIL, todas elas contempladas pelo W3C;
  • Combina a flexibilidade da SGML com a simplicidade da HTML;
  • Permite a separação do conteúdo da formatação;
  • É simples e legível, tanto para humanos como para computadores;
  • Facilita o diálogo entre o homem e a máquina (HCI) (artigo de referência: HCI pattern semantics in XML: a Pragmatic Approach, de Ashraf Gaffar, Ahmed Seffah e John A. Van der Poll);
  • Possibilita a criação de tags sem qualquer limitação;
  • Permite a criação de arquivos para validação de estrutura - DTDs (Document Type Definition);
  • Contempla a estrutura da informação de forma hierárquica;
  • Permite a interligação de bases de dados distintas;
  • Pode atingir grandes taxas de compressão de forma rápida e eficiente;
  • É uma linguagem extensível, livre de licenças, independente de plataforma e que suporta internacionalização e localização, isto é, XML está totalmente de acordo com o padrão Unicode.
Apesar das inúmeras vantagens, o XML também apresenta desvantagens:
  • É pouco intuitivo, dificultando a sua edição por pessoas que não conheçam esta linguagem;
  • Quando muito complexos, os arquivos XML não são facilmente editáveis por pessoas experientes.
A meu ver, estas desvantagens são facilmente contornáveis e compensadas, face às vantagens indicadas. XML é uma família de tecnologias, funciona de forma padronizada na inserção de hyperlinks - Xlink, trabalha com atributos, marcadores, CSS (folhas de estilo), tal como em HTML, e é actualmente a linguagem mais regular e simples de usar.

Transformar o e-book para este "novo" formato, contemplando o formato DAISY, no que diz respeito à produção de um livro digital mais acessível, só traria benefícios e não seria uma tarefa demasiado complicada, tendo em conta os crescentes esforços da Adobe na arquitectura XML. Ao trabalhar com SVG (Scalable Vector Graphics), a questão das imagens serem demasiado pequenas em algumas secções do e-book poderia ser perfeitamente ultrapassada, dada a possibilidade de as aumentar para qualquer resolução, aproveitando toda a resolução de uma impressora e permitindo a sua visualização em ecrãs pequenos e com resoluções diferentes. Sendo igualmente suportada pelo W3C, a linguagem SVG permite descrever vectores estáticos, dinâmicos ou animados.
Explorando as potencialidades do SVG e aplicando-as ao e-book, o conteúdo tornar-se-ia mais acessível, já que esta linguagem é "ideal para a criação, distribuição e impressão de imagens visuais ou tácteis (imagens com relevo destinadas essencialmente a pessoas com deficiências visuais)" e é o "formato preferencial para ilustrar conteúdo áudio/táctil. Nestes casos, o computador faz a leitura do conteúdo áudio enquanto a imagem táctil é colocada numa ferramenta de entrada sensível ao toque" (Rita Sousa, INcluindo).

Quanto às animações, simulações e vídeos existentes no e-book, seria interessante explorar a linguagem SMIL (Synchronized Multimedia Integration Language), que permite integrar "objectos multimédia independentes numa apresentação multimédia sincronizada". Esta linguagem poderia ser útil na transmissão de vídeo e áudio, descritas através de um arquivo de texto. O conteúdo tornar-se-ia mais rico e tanto as imagens JPEG como os vídeos QuickTime poderiam ser integrados de uma forma eficaz, contribuindo para uma nova arquitectura de informação. Baseada em XML, a linguagem SMIL assemelha-se a HTML e facilita a transformação de vídeo para um conteúdo textual acessível aos leitores de ecrã. Isto permitiria, igualmente, aumentar a acessibilidade do produto.

0 comentários: