126 bibliotecas web

biblioteca digital, que en un principio recibió el nombre de ... ford y la Biblioteca Pública de Nueva York acep- ..... ción de Independencia de los Estados Unidos,.
538KB Größe 6 Downloads 98 vistas
126 bibliotecas web

INTERNET

21/12/06

12:29

Página 1

Bibliotecas web

En busca de Alejandría Las grandes obras literarias de todos los tiempos al alcance de un clic Gracias a las nuevas tecnologías, el sueño de crear una biblioteca ilimitada y gratuita, con millones de volúmenes y accesible desde cualquier ordenador, se hace más factible. Detrás del proyecto de Google para construir una faraónica librería virtual, vienen otras iniciativas para convertir cultura en bits.

A

finales de 2004, en la Feria del Libro de Frankfurt, Google hizo pública una de las iniciativas más ambiciosas jamás vistas en Internet: construir en diez años una biblioteca virtual para que cualquier usuario acceda a ella desde el sitio más remoto. Tras la aparición de Google Book Search y el relativo entusiasmo con que fue recibido por usuarios y algunos centros de documentación del mundo, no se hizo esperar una respuesta por parte de las principales empresas de Internet. Y es que no podían quedarse impasibles mientras veían cómo el gigante de las búsquedas se apropiaba de un mercado significativo para posicionar marcas y monetizar espacios virtuales con publicidad.

Google Book Search books.google.com A pesar de los desafíos legales y tecnológicos que ha debido superar en dos años, el coloso de Sillicon Valley ha comenzado la tarea de digitalizar, a través de un escáner automatizado capaz de copiar hasta 1.000 páginas por minuto, quince millones de títulos provenientes del catálogo de varias universidades y libre-

126 | PC ACTUAL

rías norteamericanas que auspician la nueva biblioteca digital, que en un principio recibió el nombre de Google Print. Aunque el proyecto es a largo plazo, y cuenta con enconados detractores, Google ha diseñado dos sistemas que poco a poco le están sirviendo para ganar el apoyo de universidades y editoriales: Library Project y Publisher Program. A través de Library Project (Proyecto para Bibliotecas), Google está buscando el respaldo de centros académicos y de documentación para consolidar el banco de libros electrónicos que pretende crear. Desde el principio las Universidades de Michigan, Harvard, Oxford, Stanford y la Biblioteca Pública de Nueva York aceptaron cooperar con el buscador para volcar a la web el contenido de sus catálogos, que, como el de la Universidad de Michigan, pueden estar

conformados hasta por seis millones de volúmenes. En el caso de estas universidades, la digitalización se ha supeditado a las limitaciones impuestas por ellas. La Biblioteca Pública de Nueva York, por ejemplo, restringe la copia de títulos protegidos bajo las leyes de copyright, y la Universidad de Harvard sólo permitirá la digitalización de hasta un máximo de cuarenta mil volúmenes. Sin embargo, este modelo de colaboración ha servido a Google para ir apilando una importante base de datos y firmando nuevos acuerdos con otras universidades del mundo. Google Book Search también ha puesto su mira en grandes y pequeñas editoriales. Así, mediante Publisher Program, cualquier empresa puede unirse gratuitamente al proyecto Google Libros con el fin de exhibir sus publicaciones frente una audiencia mucho más grande. Con este programa de afiliación, las editoriales han encontrado un prometedor escaparate para promocionar sus catálogos y canalizar nuevas ventas. Después de un simple proceso de registro, debe completarse un formulario informativo sobre el título, autor e ISBN de los libros que piensan digitalizarse. A partir de

126 bibliotecas web

21/12/06

12:29

Página 2

Bibliotecas web

ese momento, cada vez que un usuario encuentre contenidos relevantes a su búsqueda, se generará una serie de enlaces a las principales librerías en donde podrán adquirirse los libros. Gracias a este mecanismo de publicidad, Google piensa ganarse uno de los sectores que mayor reticencia ha mostrado respecto al megaproyecto: el editorial. El mecanismo de rastreo de Google Book Search funciona de forma similar a como lo hace el motor de búsqueda. A través de una interfaz muy sencilla, el usuario puede localizar libros y documentos electrónicos que contengan los términos de su búsqueda. Según si el título es o no de dominio público, Google Book ofrece cuatro tipos de resultados: Vista completa, Vista previa restringida, Vista de fragmentos o No hay vista previa disponible. A través de la Vista completa los usuarios acceden al contenido total del documento. Pueden navegar hoja a hoja por todas las páginas del libro, incluyendo las portadas o carátulas y realizar búsquedas internas especializadas. Además de hacer un completo recorrido del volumen a través del índice, los lectores también tienen la opción de buscar información acerca de las tiendas en donde los venden o las bibliotecas en donde lo prestan. Desde hace unos meses, también está disponible la opción de descargarlos en PDF. La Vista previa restringida permite visualizar algunas secciones del libro, como el índice temático, la portada o algunas páginas inter-

piedra del zapato de Google. Desde que comenzó su cruzada para digitalizar un impresionante catálogo on-line, ha recibido miles de demandas por violación de la propiedad intelectual y varios gobiernos lo han acusado de acaparar el acervo cultural de la humanidad.

Open Content Alliance www.opencontentalliance.org La búsqueda de libros se efectúa a través de una sencilla interfaz que ofrece hasta cuatro tipos de resultados: Vista completa, Vista previa restringida, Vista de fragmentos (en la imagen) o No hay vista previa disponible. nas acordes a los términos de búsqueda siempre y cuando el autor de la obra haya concedido a Google la autorización para visualizarlas. Con la Visualización de fragmentos el usuario accede a pasajes que muestran frases relevantes alrededor de los términos de búsqueda. Aunque el sistema es capaz de indexar millones de títulos disponibles en la Web, mostrará el contenido íntegro de los libros siempre que sean de dominio público. Si, por el contrario, la obra tiene copyright, sólo se verá información bibliográfica tal como el nombre de su autor, la fecha y el formato de publicación, la editorial, el ISBN de la edición y algunos enlaces externos referentes a la obra o a las librerías on-line donde es posible comprarla. Con todo, en algunos aspectos, crear la gran biblioteca moderna se ha convertido en la

Universidad Complutense de Madrid La Universidad Complutense de Madrid se convirtió en la primera institución académica no anglosajona en firmar una alianza de cooperación con Google para digitalizar todos los títulos de su colección cuyos derechos de autor no estén bajo tutela legal. Gracias a este acuerdo, cientos de miles de libros de la Biblioteca de la Universidad Complutense, comenzando por la colección histórica Marqués de Valdecilla, podrán ser investigados desde el mismo motor de búsqueda en cualquier sitio del mundo. Además, Google se ha comprometido a desarrollar una herramienta exclusiva para que los estudiantes puedan recuperar información relevante de esos volúmenes desde la biblioteca de la universidad. El valor estratégico de esta clase de convenios entre las universidades y Google Book

INTERNET

Search, además de compartir vía web una importante estantería cultural, radica en la creación de un significativo sistema de documentación que sea posible compartir con instituciones académicas de otros países. www.ucm.es

La OCA (Open Content Alliance) es una coalición encabezada por Yahoo y conformada por reconocidas compañías. Entre ellas, Adobe Systems Incorporated, Internet Archive, HP Labs (responsable de escanear las colecciones), O’Reilly Media, NY Times, Xerox Corporation, European Archive, Research Libraries Group, National Library of Australia y, por supuesto, Microsoft. Este proyecto de escaneo y digitalización también cuenta con el aval de universidades como la de California, Toronto, Virginia, Washington, Texas, Ottawa, Columbia o Pittsburg. Su principal objetivo es construir una colección bibliográfica y multimedia mucho más rica y flexible que la de Google. En primer lugar, toda la información indexada podrá ser recuperada a través de los distintos motores de búsqueda y no solamente desde Yahoo, el promotor de OCA. De hecho, a partir de esta iniciativa, Microsoft desarrolló paralelamente MSN Book Search, un sistema de búsqueda que pretende recolectar información de cientos de periódicos y libros disponibles en la Red, comenzando con los de la nueva estantería de la alianza y continuando con los 150.000 volúmenes que irá adquiriendo a través de una inversión inicial de cinco millones de dólares. El sistema pensado por Microsoft también permite crear grupos de discusión y, a diferencia del esquema de biblioteca planteado por Yahoo, ofrecerá pasarelas de pago para que los usuarios adquieran contenidos especializados o compren ebooks, aparte de diferentes modelos de publicidad en cada una de las visualizaciones. Aprendiendo de errores anteriores y de los principales obstáculos que ha debido superar Google para posicionar su biblioteca virtual, esta alianza ha puesto especial cuidado con el material protegido por derechos de autor. En principio, digitalizará exclusivamente contenido abierto, es decir, cualquier producción del intelecto humano que autorice a otras personas a copiarlo, modificarlo o distribuirlo. Pero, para cumplir con la meta de proporcionar un catálogo de más de un

PC ACTUAL | 127

126 bibliotecas web

INTERNET

21/12/06

12:29

Página 3

Bibliotecas web

Amazon, buscando hoja a hoja

Teniendo presentes los problemas que ha tenido Google, la OCA ha establecido acuerdos con autores, editores y bibliotecas para huir de los tribunales. millón de volúmenes, la coalición debe trabajar en varios frentes que posibiliten indexar información distinta a la publicada bajo una licencia de copyright no restrictivo. Por eso, ha comenzado a establecer acuerdos con editoriales, bibliotecas públicas y escritores. Otra ventaja del proyecto de Yahoo frente al de Google es que el servicio de Open Content Alliance piensa publicar el contenido completo de las obras digitalizadas, incluso las producidas con soporte de audio, y no simples snippets, esos fragmentos sueltos que Google Books permite visualizar para no infringir las leyes de propiedad intelectual. Así, OCA se perfila como una seria alterativa para la organización de la información mundial.

Biblioteca Digital Europea La reacción del Viejo Continente queda plasmada en que algunos estados, impulsados por Francia, solicitaron a la Unión Europea apoyar operacional y financieramente la creación de una biblioteca europea que pudiera organizar la herencia cultural y científica del continente, más allá de una simple copia facsimilar de los textos. Varias naciones, entre ellas Alemania, España, Italia, Hungría y Polonia, se sumaron al proyecto que pretende digitalizar en los próximos cinco años seis millones de volúmenes. El esfuerzo concertado de los estados miembros de la Unión Europea busca desarrollar un enorme banco de información, con soporte para texto, audio y vídeo, que posibilite no sólo poner al alcance de todas las personas el patrimonio histórico de la humanidad, sino también resguardar varias lenguas no inglesas del dominio digital de las principales compañías norteamericanas, enalteciendo la diversidad y multiculturalidad de las naciones que conforman la UE.

128 | PC ACTUAL

Uno de los referentes obligatorios en cuanto a localización y recuperación de contenidos publicados en libros digitales es el servicio de búsqueda especializada de A9, el motor de Amazon.com. Incluso antes de que Google diera a conocer el proyecto Google Print, A9 ya podía buscar e indexar información interna de los libros puestos en venta en la megatienda de Jeff Bezos. A través de Search Inside the Book de Amazon, se realizan búsquedas en millones de páginas de libros indexados no sólo en virtud de su título o autor, sino también de contenidos precisos dentro de los volúmenes, mostrando la carátula de la obra, la hoja original digitalizada, el texto relevante en forma destacada, la correspondiente numeración de las páginas que contengan el término de la búsqueda y

La idea de crear una colección bibliográfica en tan poco tiempo puede ser tan compleja como costosa. La BDUE (Biblioteca Digital de la Unión Europea) debe recibir una inversión de aproximadamente 250 millones de euros y superar serios desafíos técnicos y logísticos para poner en marcha un sistema confiable de almacenamiento y recuperación de la información que incluya un motor de búsqueda autónomo que sirva como acceso único para los usuarios. Para ello, ha de aprovechar la expe-

las opciones para avanzar o retroceder en su navegación. Las personas también pueden encontrar información relevante del libro buscado, comparar precios y ediciones e incluso agregarlo directamente al carro de compras. Si se es un usuario registrado, también se puede crear un archivo histórico de cada una de las búsquedas. www.a9.com

España, Bélgica, Dinamarca, Estonia, Finlandia, Grecia, Hungría, Irlanda e Italia, han ratificado sus intenciones de apoyar a la Comisión Europea de la Sociedad de la Información, aportando parte de sus colecciones literarias y cooperando para organizar conjuntamente una agenda de trabajo para la selección de obras y la digitalización de títulos sin duplicidades. Como complemento, varios representantes de la cultura y de la industria editorial se han integrado a la BDUE mediante discusiones abiertas sobre el trato que debería darse al régimen de propiedad intelectual aplicable al proyecto.

Library of Congress www.loc.gov

Los planes de la UE son ambiciosos: digitalizar en cinco años seis millones de volúmenes. riencia y el potencial de bibliotecas nacionales con presencia en la Red, como la Biblioteca Virtual Miguel de Cervantes en España o la Biblioteca Nacional de Francia (impulsora del proyecto), y coordinar con la industria editorial convenios que faciliten la indexación de nuevos catálogos. Actualmente, una veintena de bibliotecas nacionales de Europa, como las de

La Biblioteca del Congreso de los Estados Unidos, ubicada en Washington DC y considerada la más grande del mundo, ha comenzado un proyecto para publicar en Internet parte de sus 130 millones de volúmenes. Con el apoyo financiero de Google, que aportó tres millones de dólares para la digitalización de su catálogo, la biblioteca quiere construir un registro documental para dar acceso gratuito a través de la Web a todos sus libros y manuscritos exentos de copyright. El propósito es crear una Biblioteca Mundial Digital que sirva para preservar el patrimonio lingüístico de varias culturas del mundo y desarrollar una ciberbiblioteca mixta y multicultural. Esta forma de memoria colectiva, auspiciada por varios fondos de inversión privada y otras instituciones académi-

126 bibliotecas web

INTERNET

21/12/06

12:29

Página 4

Bibliotecas web

culturales de otros países, al desarrollo de un esquema de trabajo planificado y al adecuado uso que ha hecho de las tecnologías para la digitalización de textos, la Biblioteca Virtual Miguel de Cervantes es una de las herramientas que mejor han preservado el patrimonio cultural iberoamericano.

La Biblioteca del Congreso de EE UU ha comenzado a digitalizar aquellos de sus fondos documentales exentos de copyright. cas de China, Francia, Holanda, Rusia y España, aunará esfuerzos para promover la cultura global pues más de la mitad de sus colecciones están escritas en lenguas distintas a la anglosajona. Como preámbulo a la próxima Biblioteca Mundial Digital, que tiene un soporte documental en la American Memory (una importante colección histórica de Norteamérica con más de 7 millones de fuentes), ya se han digitalizado valiosos documentos de la historia americana, como mapas y textos de la Guerra de Secesión y algunos manuscritos de ex-presidentes como Lincoln y Jefferson.

Gutenberg Project www.gutenberg.org Gutenberg Project ha sido una de las primeras iniciativas orientadas a la creación de catálogos virtuales, con cientos de libros digitales para que los usuarios puedan descargarlos gratuitamente desde alguno de los servidores de la organización. Desde 1971, cuando su fundador Michael Hart puso los cimientos de este centro, se han convertido casi 20.000 libros de dominio público. El primer volumen disponible en formato digital, creado cuando Internet apenas se llamaba Arpanet, fue La Declaración de Independencia de los Estados Unidos, publicado para un pequeño grupo de estudiantes de la Universidad de Illinois. Todos los documentos han sido publicados en Plain Vanilla ASCII, un formato plano que, a diferencia de los sistemas modernos para la digitalización de libros, que permiten capturar imágenes y diagramas, sólo reconoce caracteres de texto. De esta manera, se pretende garantizar que las obras estén disponibles independientemente del software o hardware utilizado y que puedan ser reeditadas posteriormente bajo soportes más robustos, como los de Adobe. Aunque la colección Gutenberg está compuesta mayoritariamente por obras escritas en inglés, hay traducciones de libros escritos como El Lazarillo de Tormes, La Celes-

130 | PC ACTUAL

En este centro de documentación, encontraremos cientos de libros digitales de literatura universal que podremos descargar de forma gratuita. tina o Don Quijote. La mayoría de libros de esta biblioteca son de literatura universal. Sin embargo, como excepción, se han publicado almanaques, diccionarios y obras relevantes para la humanidad, como la Biblia. Pese a las actuales limitaciones técnicas del Proyecto Gutenberg, Hart y el grupo de voluntarios que lo han apoyado pusieron a disposición de la comunidad una gran alternativa para el acceso gratuito a la información y al conocimiento.

Biblioteca Virtual Miguel de Cervantes www.cervantesvirtual.com Antes de que las grandes compañías de Internet proyectaran construir un catálogo de libros electrónicos, compitiendo unas contra otras por indexar el mayor número de documentos, desde 1999, con un catálogo inicial de 2.000 volúmenes, la Biblioteca Miguel de Cervantes ya contaba con una de las colecciones virtuales más imponentes de la Red. Gracias al apoyo inicial de la Universidad de Alicante y del Banco Santander Central Hispano, este centro se ha convertido en una de las principales fuentes de consulta de investigadores, estudiantes y usuarios de Internet de todo el mundo. Aunque su activo principal son las colecciones de literatura española e hispánica, ofrece un catálogo on-line con más de 12.000 títulos y varias portadas temáticas que sirven como centro de investigación especializada. Gracias a la integración que ha tenido con instituciones

Activa desde 1999, esta biblioteca es una importante fuente de consulta para investigadores, estudiantes y todo tipo de internautas.

Wikiversity y Global Text Project en.wikibooks.org/wiki/Wikiversity Gracias a las nuevas tecnologías han ido surgiendo iniciativas para plasmar en la Red documentos publicados inicialmente en el papel. Una de ellas es la Wikiversity o Wikiversidad, una plataforma promovida por la fundación Wikimedia, responsable de la Wikipedia, la popular enciclopedia de edición colaborativa. Funciona como una plataforma gratuita para la construcción mancomunada de una biblioteca en donde investigadores, escritores y la comunidad estudiantil puedan hacer sus propias aportaciones. Aunque no todo el material debe ser digitalizado, puesto que pueden incluir documentos electrónicos, una parte del material recopilado proviene del formato impreso.

Promovida por la Wikimedia, esta plataforma busca la construcción mancomunada de una biblioteca donde investigadores, escritores y estudiantes hagan sus aportaciones. Por su parte, Global Text Project es una plataforma educativa creada por Rick Watson, académico de la Escuela de Negocios de Georgia, encaminada a suministrar libros electrónicos para que estudiantes universitarios de los países del tercer mundo puedan consultarlos on-line. Mediante la generación colectiva de información, a través de varios editores participantes, el proyecto busca crear una librería pedagógica de 1.000 obras para la comunidad universitaria de estas naciones. De forma similar, Wikilibros, otro proyecto patrocinado por la Wikimedia, ha creado un sitio web con el ánimo de recopilar textos, documentos y libros con contenidos accesibles gratuitamente.

Ricardo Barrera [email protected]