O formato MS-Word non é un bon formato para o intercámbio de documentos. Ramón Flores 1 Introdución Desde ha algun tempo resulta excesivamente frecuente o envio de mensaxes de correo con anexos consistentes en arquivos MS-Word, i.e. con arquivos no formato próprio dese procesador de textos. Esta prática, se ben frecuente, non é moito recomendábel, xa que o dito formato non é, do meu ponto de vista, unha boa eleizón para transmitir información textual, tal e como se vé en seguida. Non se trata neste documento sobre a idoneidade do programa MS-Word como procesador de textos, ainda que eu persoalmente non goste del([footnote] Non son o único, vexa-se por exemplo o artigo de Allin Cottrell [http://www.ecn.wfu.edu/~cottrell/wp.html||Word Processors: Stupid and Inefficient, ].) e non o use, senón da (im)pertinéncia do formato próprio deste programa para o intercámbio de documentos. O normal é que un procesador de textos poda gravar un mesmo documento en vários formatos([footnote] Por exemplo, este artigo foi escrito con o procesador de documentos libre [http://www.lyx.org||LyX ], o cal permitiu gravá-lo como Texto Simples, en LaTeX, no seu formato próprio, en HTML, en DVI, en Postscript e en PDF.) , e un/unha usuári@ intelixente debe escoller cal é o formato máis axeitado para cada caso. Este artigo, por exemplo, foi escrito con o procesador de documentos libre [http://www.lyx.org||LyX ], o cal permitiu gravá-lo como [nao_formato_word.txt||texto simples], en [nao_formato_word.tex||LaTeX], no [nao_formato_word.lyx||seu formato próprio], en [nao_formato_word.html||HTML], en [nao_formato_word.dvi||DVI], en [nao_formato_word.ps||Postscript] e en [nao_formato_word.pdf||PDF]. 2 O formato ideal Un bon formato para a troca de informacións textuais deberia ser: * Intelixíbel. I.e. deberia poder ser lido, e a ser posíbel mesmo manipulado, en calquer tipo de computador, rolando calquer sistema operacional. De maneira a ser entendido por todo o mundo sen problemas. * Confiábel. Ou sexa, deberia reproducir fielmente as informacións que carrega, nen máis nen menos da que @ autor@ desexa enviar, e mantendo a forma dada inicialmente pol@ autor@. Ademais non deberia comprometer a seguridade nen do emisor nen do receptor. * Lixeiro. I.e. a razón entre o tamaño ocupado polo arquivo e a información contida deberia manter-se baixa. * Resistente a erros. Ou sexa, a perda dalguns poucos bytes non deberia dar lugar a unha perda masiva da información contida. 3 Caréncias do formato MS-Word Infelizmente o formato do MS-Word non cumpre nengun dos requisitos anteriores. Vexamos porqué: 3.1 O formato MS-Word non ten un alto grau de intelixibilidade. * Requer software específico e proprietário. Este é un formato proprietário, binário e fechado, polo cal só o procesador de textos MS-Word o entende cabalmente, e para iso nen sempre. Se ben o procesador de textos MS-Word está amplamente espallado, é un aplicativo proprietário, e non especialmente barato, que ademais só ten versións para dous sistemas operacionais, o Windows e o Mac OS. Portanto non todo o mundo o ten instalado no seu computador. A Internet construiu-se procurando que os distintos tipos de computadores puderan comunicar-se entre si, para todo o mundo poder estar a vontade. Enviar arquivos en formatos proprietários presupondo, sen información confiábel, cal é o software que usa @ recipiendári@ agride ese espírito de procurar a intercomunicación, introducindo ruído na rede. máis * Ha problemas entre versións. Mesmo para os usuários de MS-Word, ha problemas de compatibilidade entre as diversas versións do aplicativo. Asi utilizar as versións máis modernas impede que os usuários de versións máis antigas podan ler as suas mensaxes.([footnote] Ha quen diga que isto non é por acaso, senón procurado pola Microsoft para obrigar a@s usuári@s a actualizar os seus aplicativos. Que non o farian por necesidade de novas características técnicas, mais si para poder entender os arquivos da xente que si os actualizaran.) . Usar versións antigas non soluciona sempre o problema, se ben é prática máis segura, pois ainda asi poden aparecer alteracións molestas no formato. Os problemas entre Windows e Mac OS son loxicamente maiores. * Distintas impresoras = Distintas aparéncias. Ainda que @ recipiendári@ dun ficheiro MS-Word teña a versión axeitada do procesador de textos, mesmo asi pode haber problemas. A aparéncia dun documento MS-Word depende da impresora que teña o sistema, ou máis ben do driver correspondente. Portanto ao formatar un documento MS-Word, tal vez con unha aparéncia moito traballada para atinxir unha impresión dada n@ leitor@, non se pode estar 100% certo de cal vai ser a aparéncia do dito documento nun outro computador con unha impresora diferente. 3.2 O formato MS-Word non é confiábel. É ben coñecido que a Microsoft non se ten caracterizado pola elaboración de produtos moito seguros. No caso que nos ocupa isto evidencia-se en dous pontos, as facilidades dadas para criar vírus e a sua falta de discrición. * Vírus O MS-Word posui un sistema de macros bastante potente e non moito seguro. De maneira que hoxe en dia é o vector máis comun de propagación de vírus electrónicos. Enviar arquivos MS-Word habitualmente e sen necesidade é unha maneira moito eficiente de favorecer a propagación de vírus. Se só fosen enviados os ficheiros MS-Word precisos, moitísimos menos que os actualmente enviados, receber un ficheiro deste tipo non esperado seria xa un aviso de perigo, e a difusión dos vírus seria moito máis dificultosa. Realmente quer fomentar o espallamento de vírus pola rede? Que un particular envie arquivos MS-Word con vírus non acrescenta a sua estima entre os seus coñecidos. Mais no caso de ser unha instituizón a facé-lo, mesmo a oferecé-los nas suas páxinas web, dá unha moito má imaxe da mesma. * Indiscricións Os documentos MS-Word incluen máis informacións das que aparecen a primeira vista, e que en moitas ocasións @s autor@s dos documentos non desexarian foran fornecidas. Asi ademais do que se le ao abrir o documento no procesador de textos MS-Word, o documento leva informacións sobre o autor e o computador no que foi redixido, e tamén informacións sobre versións antigas do documento, que nalguns casos puderan ser confidenciais. Para ler esa información chega ás veces con abrir o arquivo con un procesador de textos distinto do MS-Word. Outras veces son necesários procedimentos máis elaborados([footnote] En Unix por exemplo pode-se usar o comando strings para obter texto "oculto" nun arquivo MS-Word.) , mais en todo caso a información está no arquivo. 3.3 O formato MS-Word é pesado. Con desmedida frecuéncia envian-se mensaxes nun ficheiro MS-Word, que só contén texto simples, e que pudera ir moi ben nunha mensaxe de texto normal. Só que no primeiro caso ocupa centos de KB cando como texto simples ocuparia uns poucos KB. Se para acesar a internet ten que pagar, pense nisto antes de enviar ficheiros Word desnecesariamente. Se é afortunad@ e o aceso resulta-lle gratuito, sexa boa persoa e pense nos demais. 3.4 Resisténcia aos erros do formato MS-Word. A combinación procesador MS-Word formato MS-Word ten moi pouca resisténcia aos erros. Unha pequena alteración do arquivo da lugar a que o procesador considere-o corrupto e non permita recuperar nengunha información. Mas neste caso o problema non é devido unicamente ao formato mais tamén ao procesador. Asi utilizar outro procesador de textos([footnote] por exemplo o procesador libre [http://www.abisource.com||Abiword, ].) , ou o ollar o ficheiro con outras ferramentas([footnote] por exemplo o xa citado comando strings.) , pode permitir recuperar a maior parte da información. 4 Alternativas Existen diferentes alternativas ao formato MS-Word, nengunha delas válidas para todas as ocasións. Da mesma maneira que non nos vestimos igual para unha boda e para xogar ao futebol, non debemos utilizar o mesmo formato para diferentes finalidades. 4.1 Texto simples Ha moitos casos onde o mellor é utilizarmos texto simples; unha carta comercial ou a un amigo, un artigo nun grupo de notícias da USENET, ou nunha lista de correos, etc. Sempre que posíbel debe preferir-se o texto simples, pois é o formato máis intelixíbel, lixeiro e resistente a erros (sen redundáncias), e 100% confiábel. Ademais permite incluir facilmente nas respostas treitos da mensaxe contestada. Podemos dormir con smoking, mais é moito máis cómodo facé-lo con un pixama. Caso de ser necesário enviar un documento con unha aparéncia elaborada existen formatos máis adecuados que o MS-Word: 4.2 RTF O RTF, acrónimo de Rich Text Format, é un formato que permite unha formatación moi elaborada, sendo propriedade da Microsoft. Mais a diferenza do formato MS-Word é aberto, pois as especificazóns son públicas e facilmente verificábeis ao ser lexíbel polas persoas. É por iso que é lido e escrito correctamente por unha grande variedade de procesadores de texto. Ademais ao ser lexíbel polas persoas, sempre se pode recuperar moita información mesmo que for levemente danado. Está pois indicado para cando se quer enviar un documento, que poda ser manipulado pol@ recipiendári@, e cuxa forma principal de leitura sexa impreso. 4.2.1 Como gravar un arquivo con formato RTF no MW-Word? Ir ao menu Arquivo -> Gravar como -> Gravar como tipo: e escoller Formato RTF(*.rtf) 4.3 HTML O HTML, acrónimo de Hypertext Markup Language, é un formato aberto, público e lexíbel pelas persoas, polo cal é entendido por moitos aplicativos informáticos; evidentemente todos os navegadores de internet, moitos procesadores de textos, clientes de correo, etc. É un formato pensado para ver documentos na tela, mais non é tan bon para documentos que se van imprimir. Tampouco é conveniente abusar deste formato. Algun coñecido cliente de correo envia por defeito mensaxes de correo duplas: texto e html, o cal é totalmente desnecesário se o que se quer enviar é unha mensaxe de texto. 4.3.1 Como gravar un arquivo con formato HTLM no MS-Word? Ir ao menu Arquivo -> Gravar como -> Gravar como tipo: e escoller Páxina Web (*.htm; *.html) Contodo debe subliñar-se que o MS-Word produz ficheiros html de bastante pouca cualidade, moi pesados e non sempre respeitantes dos estándares. Neste aspeito é bastante mellor a cualidade dun ficheiro rtf producido por este procesador. 4.4 PDF Acrónimo de Portable Document Format, o PDF é un formato aberto, binário e propriedade de Adobe. Mais as especificazóns son públicas e ben publicitadas, existindo aplicativos que len e escreben PDF en calquer sistema operacional. Se o que se desexa é enviar documentos con moi boa aparéncia, que non dependa da impresora a usar, e que non poda ser alterado facilmente pol@ recipiendári@, este é o formato de eleizón. De facto é usado cada vez máis pelas empresas para difundir información corporativa: catálogos, especificazóns técnicas, etc. Por outra banda non é moi resistente a erros, ao ser binário, e tampouco é especialmente lixeiro. O MS-Word non permite gravar en PDF, mais ha formas de facé-lo con software libre. Unha completa descrición de como o facer pode achar-se na páxina web [http://www.sp.uconn.edu/~fdb94001/using-gs/make-pdf.html||Using Ghostscript to Make PDF Files, ]. 5 Cando é apropriado empregar o formato MS-Word Dicia anteriormente que non ha nengun formato apropriado en todas as circunstáncias, senón que segundo a situación haberá que usar un ou outro. Existe tamén unha circunstáncia propícia para empregar o formato MS-Word: cando se sabe positivamente que @ recipiendári@ ten o procesador de textos MS-Word, unha versión que poda manexar sen problemas o arquivo enviado, e ademais vai ora traballar no dito documento, ora empregar partes dele noutros. 6 Porqué deste documento A verdade nunca gostei do procesador de textos MS-Word, polo cal nunca o tiven no meu computador. Porén ha bastante xente que presupón que eu teño o dito procesador, e envia-me arquivos nese formato. E xa cansei de ver, despois de pasar bastante traballo para os abrir, que na maioria dos casos o formato era totalmente supérfluo. Ha uns poucos meses batin nas miñas navegacións pola rede con un artigo de Jeff Goldberg, que partindo dunha situación semellante a miña tomara-se o traballo de redixir un alegación contra o abuso do envio indiscriminado de documentos en formato MS-Word. Pensei en traduci-lo, mais o fun deixando e ha un par de semanas Richard Stallman, o pai do software libre, deu a lume un artigo incitando a rebelar-se contra este abuso MS-Wordiano. Asi que comecei a traducir, mais xa postos abandonei a idea inicial e redixi un artigo próprio, bastante inspirado iso si no de Jeff Goldberg. Non pretendo portanto ser moi orixinal, tan só contribuir dentro das miñas posibilidades nesta campaña educativa. Pois diso se trata, dunha campaña para espallar boas maneiras na rede. 6.1 Páxinas relacionadas * Jeff Goldberg, [http://www.goldmark.org/netrants/no-word/attach.html||MS-Word is Not a document exchange format]. * Richard Stallman, [http://linuxtoday.com/news_story.php3?ltsn=2002-01-11-002-20-OP||We can put an end to Word attachments]. * Martin Vermeer's,[http://www.netby.dk/Oest/Europa-Alle/vermeer/plain.html||Plaintext: In praise of practical e-mail hygiene, ]. * Michael A. Gurski, [http://userpages.umbc.edu/~mgursk1/rants/why_no_word.html||Why No Word?, ]. * Chris Mason, [http://www.unixzone.com/why_no_word.html||Why no Word?]. * Stéphane Bortzmeyer,[http://www.internatif.org/bortzmeyer/afterword/afterword.html||After Word: l'avenir du traitement de texte, ]. * Juhapekka Tolvanen,[http://www.cc.jyu.fi/~juhtolv/mswordmail.html||Miksi on typerää postittaa sähköpostin liitetiedostona MS Word -dokumentteja,]. * Sam Steingold, [http://www.podval.org/~sds/data.html||No Proprietary Binary Data Formats, ]. * Adam Barr, [http://www.osopinion.com/perl/story/16034.html||Proposal: The Open Data Format Initiative, ]. * Scott Mcneal, [http://www.computerworld.com/cwi/community/story/0,3201,NAV65-1797_STO64689,00.html||The Case for Open File Formats,]. * Kevin Reichard, [http://www.linuxplanet.com/linuxplanet/reviews/1934/1/||Editor's Note: The Importance of Open File Formats, ].