La Coctelera

Categoría: Recuperación de información

El español como idioma científico: salto al vacío o salto a la Red

Acaba de salir publicado un artículo titulado El español como idioma científico: salto al vacío o salto a la Red [pdf] en la revista Apuntes de Ciencia y Tecnología, de la Asociación para el Avance de la Ciencia y la Tecnología en España (AACTE). El artículo me lo pidieron al hilo del post en que criticaba un poquillo algunas de las apreciaciones que algunos de los autores de la obra El español: lengua para la ciencia y la tecnología editado por el Instituto Cervantes habían realizado acerca del papel que el español debía tener en ciencia. A partir de ahí he tirado un poco de archivo situando el tema en el marco de la política científica española de las últimas décadas, y reiterando las críticas que hacía en el post.

Por otro lado, en el artículo, ya con connotaciones más documentales, también se habla de los repositorios como una de las medidas a fomentar para mejorar la presencia del español en la ciencia. Tirar de repositorios, la progresiva puesta en la Red de los archivos de las revistas españolas o la mejora de las webs personales de los académicos españoles son algunas medidas muy básicas pero que contribuirían a fomentar la visibilidad de la ciencia en español. Todo ello sin tener que renunciar a la publicación en inglés (ningún investigador lo va a hacer), que es lo que se valora y recompensa por parte de las administraciones, y que por otra parte es la única opción posible en todas las ciencias puras y exactas, y cada vez en mayor parte de las ciencias sociales.

Es un artículo de opinión, cortito, y el tono es bastante informal. La referencia completa, que os podéis descargar en la web de ec3 es:

¿Qué es el DOI?

Con todo el tema de las acreditaciones y peticiones de sexenios los investigadores se están empezando a familiarizar (a base de bien) con diversos conceptos documentales. Conceptos como indicios de calidad, factores de impacto o indización en bases de datos son ya moneda común incluso en aquéllas áreas donde esto sonaba a chino hace cuatro días.

Una de las dudas habituales de los profesores es si pueden aportar como contribución artículos in press, que ya están a disposición pública a través de las plataformas de revistas científicas online como por ejemplo science direct. Estos artículos ya tienen asignado un DOI (identificador de objetos digitales), pero aún no cuentan con volumen ni número ni paginación aún asignada, por lo que los distintos organismos encargados de evaluar estas contribuciones no suelen aceptarlo, ignorando por cierto, las nuevas dinámicas de la publicación académica (y es que un artículo puede tirarse más de un año in press).

Pero, ¿qué es un DOI? Muchos investigadores no han escuchado hablar de este identificador único de publicaciones científicas, pero qué bueno sería no tener que reseñar toda la ristra de datos bibliográficos asociados a una publicación y anotar únicamente el DOI de  la misma. Se trata de un código alfanumérico que identifica en la web un artículo y que lo recupera incluso si éste se ubica en un servidor distinto al que fue alojado en un principio. Se evita así el típico problema de los enlaces rotos, muy habitual en macrowebs como las universitarias.

Una buena práctica documental es enlazar a los artículos académicos usando su DOI en lugar de la URL donde se ubica el artículo, asegurándonos así que este será recuperable en un futuro. Son muchas las revistas que ya lo usan para identificar sus contenidos, pero aún no es una práctica generalizada entre todos los editores científicos, especialmente en los académicos y pequeños editores.

Para entrar en cuestiones más técnicas puedes echar un vistazo a este post de infobiblio o a esta completa presentación de Teresa Malo de Molina.

Cuidar los datos: también en bases de datos externas

Una de las cuestiones que más suelen obsesionar a bibliotecarios y documentalistas es el control de la información; usamos lenguajes documentales, tesauros, encabezamientos de materias, está bien regulado en las distintas clasificaciones como introducir el nombre de un autor, sus variantes, los signos de puntuación que deben acompañar una referencia bibliográfica, los encabezamientos de autoridades. Los catálogos bibbliotecarios, y en general las bases de datos gestionadas por bibliotecarios son ejemplos de la extrema pulcritud en el control de la información que dispensan los profesionales de la información.

Sin embargo, cuando acudimos a otros entornos documentales, donde el volumen de información que se maneja es tan inmenso que no es posible ejercer control documental exhaustivo sobre los registros, la situación cambia, los bibliotecarios tiemblan, y los usuarios se pierden. El fascinante mundo de la información no controlada.

Un ejemplo; una base de datos de producción científica, WoS o Scopus, que procesa cientos de miles de registros anualmente. Además de la falta de control en campos como autor o institución, encontramos errores en la indización, motivados probablemente por fallos en el escaneado de documentos, o en algún otro proceso del vaciado de los documentos por la base de datos.

¿Deben ocuparse los bibliotecarios, al igual que en sus catálogos, de asegurar que esa información es correcta, veraz, sin errores? Yo creo que sí. Dificilmente un investigador se va a encargar de escribir a los productores de una base de datos (o repositorio, donde se puede dar el mismo problema) para corregir alguno de estos errores. En mi opinión los bibliotecarios académicos pueden centralizar esta labor de data curation sobre la producción científica de su institución en bases de datos documentales. Los beneficios son evidentes; mejora la recuperación de información y otorga más visibilidad a nuestra institución. La mayoría de bases de datos tienen cauces para comunicar errores, erratas o sugerencias sin demasiadas complicaciones. Sólo hay que usarlos.

Ésta es sólo una de las cosillas que me hubiera gustado contar en las jornadas profesionales de las bibliotecas del instituto Cervantes, hace un par de semanas en Madrid, y que me perdí por culpa de la niebla granadina y de la escasa diligencia de Ryanair. Podéis ver la presentación que tenía previsto mostrar en ec3noticias, y descargarla en la web de ec3.

------

Cabezas-Clavijo, Á. ¿Quién se ha llevado mis citas? Nuevos roles del bibliotecario en la práctica científica. En II Jornada Profesional de la Red de Bibliotecas del Instituto Cervantes: El profesional de la Información ante los nuevos retos. Madrid, 10 diciembre 2009

La importancia de buscar

No son muchos los blogs que profundizan en aspectos relacionados con las destrezas de búsqueda en el campo documental, los que hacen análisis de bases de datos, fuentes de información, interoperabilidad entre formatos, comandos, operadores, etc cuando, sin embargo, la recuperación de información (RI) y sus sistemas (SRI) son una de las áreas centrales de la Documentación.

Una investigación académica o una petición de información realizada por un usuario en una biblioteca o servicio de documentación resultarán completamente fallidas si desde el prinicpio ejecutamos mal la ecuación de búsqueda con la que da comienzo la labor documental. Los operadores booleanos, los truncamientos, las wildcards, las búsquedas avanzadas suponen un campo de lo más interesante para profundizar en él. Sin embargo la investigación en el campo de la RI en España es bastante pobre, como lo demuestra el bajo número de autores de ese área entre los más destacados de la ByD española (EPI, 15(3): 373-383, 2006).

Ahora que las bibliotecas parecen abrazar con fuerza el paradigma de la difusión, no habría que olvidar la importancia de buscar. No en vano uno de los inventos más destacados de las últimas décadas es un buscador de Internet que recupera con sorprendente destreza todo lo que le pedimos (¿todo?). La importancia de buscar se ha puesto de manifiesto de nuevo en los últimos meses con hechos como que dos de las principales innovaciones que han realizado las empresas Facebook y Twitter sean mejoras en sus buscadores internos, permitiendo así sacar a la luz información (¿relevante?) para sus usuarios. Por supuesto estas mejoras se basan en el desarrollo de algoritmos de recuperación y en potentes robots que indizan el contenido de esas webs no en el trabajo de cientos de documentalistas categorizando y estructurando contenidos (eso era la web 1).

No quiero parecer un "antiguo" pero ahora que está tan de moda la difusión y la comunicación no está de más recordar que una de las fortalezas de los documentalistas se encuentra precisamente al principio de la cadena documental, en la búsqueda, sacandole el máximo partido a las fuentes de información, conociendo sus pecualiaridades y ejecutando búsquedas que permitan extraer todo el valor a dichas fuentes. No lo olvidemos.

Puntos de acceso a la información: el fin de la propiedad y el ascenso de los repositorios

Quizá una de las discusiones más interesantes alrededor de los bienes de consumo culturales y científicos sea el debate sobre el acceso y la propiedad. El jefe de Spotify, el último bombazo de la 2.0 lo comentaba en una reciente entrevista. Si dispongo de un acceso de calidad a los productos y servicios que quiero usar, ¿pará qué necesito almacenarlo en algún dispositivo de mi propiedad?

Efectivamente, esto ya es así en el mundo de la información. Nos hemos acostumbrado a acceder online a multitud de servicios y aplicaciones (la famosa nube), tanto que muchas veces la recuperación de información pertinente es mucho más fácil en la web que en nuestros propios sistemas de almacenamiento. Esto es así por dos razones: porque los buscadores en la web (léase Google) son más potentes, intituitivos y fáciles de usar que las herramientas de la mayoría de sistemas operativos, y porque además en la web solemos disponer de varios puntos de aceso para alcanzar la información que requerimos. Pongamos el ejemplo de un artículo científico; nosotros lo almacenamos en algún lugar de nuestro disco duro, pero en Internet podemos encontrar el mismo documento en la web de la revista, en un repositorio institucional, en la web del autor,...es decir, múltiples vías de acceso a la misma información.

Ofrecer varias vías para acceder a la información deriva finalmente en un mayor uso de ella, lo cual a su vez genera mayor visibilidad para los materiales y mayor reconocimiento para los autores. Los músicos usan MySpace para colgar sus obras, los investigadores los repositorios en acceso abierto para facilitar el uso de sus investigaciones. Esto puede derivar, en el caso del músico en la grabación de discos o la invitación a ofrecer conciertos mientras que al investigador le genera oportunidades para impartir cursos, ser invitado a conferencias, establecer colaboraciones y aumentar el impacto de sus investigaciones.

Con esta situación, es de agradecer que el borrador de la nueva Ley de la Ciencia dedique un apartado al establecimiento de políticas para hacer públicas las investigaciones financiadas con fondos estatales y que fomente la creación de repositorios en acceso abierto. Algunas instituciones han tomado la delantera, y esta misma semana la Universidad de Murcia (Digitum) y la de Salamanca (Gredos) han presentado sus plataformas para la difusión de su material investigador y docente. Presumo que, si el Ministerio sigue con sus planes, en los próximos meses los depósitos institucionales no serán un servicio de valor añadido, sino una necesidad inaplazable para todas las instituciones que se dedican a la investigación.

Sin la implicación de las altas instancias institucionales estas iniciativas están abocadas a un rinconcito (sin luz) del entramado de la organización. Por eso creo que estos productos no deben liderarse desde las bibliotecas (por su falta de influencia y nula capacidad de liderazgo en las instituciones), aunque el concurso de su personal sí es imprescindible para marcar las directrices técnicas del proyecto.

Se presenta un panorama muy esperanzador para este tipo de servicios, veamos cómo se desarrollan en los próximos meses.

El miedo escénico y la identidad digital

Decía Jorge Valdano que los equipos visitantes que jugaban en el Santiago Bernabeu salían al campo con miedo escénico derivado de la impresión que el estadio y el ambiente les causaba. La web 2.0, donde cualquiera puede generar contenidos, causa en muchas personas el mismo efecto; un pánico atroz a publicar un texto, dejar un comentario o poner una foto a disposición pública. El miedo escénico de la web 2.0.

El cambio de paradigma que enarbola la web 2.0 presupone que cualquier usuario puede generar contenidos de valor (también sin valor ninguno) ya que tecnológicamente es muy sencillo hacerlo. Sin embargo, las barreras psicológicas, el miedo a hablar en público, el ¿y si me equivoco, y si me critican? juegan un papel limitador muy importante que sin duda acalla voces que podrían ser de gran valor.

Creo que una de las principales tareas de los formadores en competencias informacionales es lograr que cualquier persona se atreva a exponer públicamente sus opiniones en los foros que estime oportuno. Si no, la voz cantante, la visión de la realidad que se expone en Internet no es fiel reflejo de la sociedad sino que sólo es representativa de los puntos de vista de un pequeño porcentaje de usuarios medios-avanzados sin miedo a exponer sus ideas públicamente y que generan corrientes de opinión e incluso grupos de presión cada vez más reconocibles.

Además, en el marco de la gestión de la identidad digital y de la importancia que en ciertos ámbitos se le concede, la presencia y la visibilidad en la web son elementos clave, tanto a nivel personal como institucional o empresarial. Tan malo puede ser aparecer por hechos negativos como no aparecer. No es un secreto que cada vez más información sobre nosotros (y sobre nuestras empresas, instituciones, productos, marcas) es accesible a través de los buscadores, simplemente ejecutando las acciones de búsqueda adecuadas.

Determinar a priori qué candidato puede ser el más adecuado para un puesto de trabajo, qué marca de electrodomésticos comprar, o la reputación de una clínica médica son el tipo de búsquedas que cualquier persona puede llevar a cabo en la Red. Así, la gestión de la reputación online (catorze lo ha entendido a las mil maravillas) es una nueva disciplina con anclajes en el ámbito documental y vinculada a las políticas de comunicación y a la participación activa en los nuevos espacios digitales, como por ejemplo, los sitios de redes sociales.

El miedo escénico, como obstáculo a superar en el marco de la ALFIN 2.0 y de la novisíma Educación Mediática, y la visibilidad en la web como oportunidad para las personas y para las instituciones serán algunos de los conceptos muy a tener en cuenta en 2009 para documentalistas y bibliotecarios.

La calidad de la indización en las bases de datos científicas

Nadie dijo que conseguir exactitud en el tratamiento de grandes cantidades de información fuera fácil, pero aspirar a ello, al menos, no estaría mal. Una de las principales bases de datos de artículos científicos Cat.inist elaborada por el CNRS (el CSIC francés) nos muestra afiliaciones como ésta.

Ciudades sin duda muy conocidas por todos como Alhacete o Albacefe o esas unidades administrativas llamadas Depurtamento o la más usual Deparluniento de reminiscencias claramente italianas, y que entorpecen especialmente nuestra labor documental.

Con los nombres de los autores tampoco vamos muy bien. Es un tema bien candente, como demuestra que el artículo más citado de ec3 sea uno que trata acerca de la indización de autores españoles en bases de datos internacionales [pdf], que la FECYT haya financiado un estudio en el que se recomienda a los autores españoles cómo deben firmar sus trabajos o hayan surgido iniciativas como IraLIS para normalizar nombres de autores en ByD. Lo cierto es que aún muchos autores siguen usando un sólo apellido en su firma lo que unido a la deficiente indización en algunas bases de datos dificulta mucho su correcta localización.

Mira este registro, ¡están repetidas las iniciales de todos los autores!

También es cierto que la competencia WoS-Scopus está generando desarrollos que redundan en la calidad de la indización y en la mayor exactitud de los estudios bibliométricos, como demuestra el hecho de que ambas empresas hayan implantado recientemente la correspondencia autor-institución para los artículos más recientes o el desarrollo completo del nombre del investigador.

En definitiva, en mi opinión se hace necesario el concurso humano para revisar y en su caso modificar el vaciado de los artículos en las bases de datos, realizados por procedimientos automáticos. Cada vez más instituciones confían sus mecanismos de promoción en la aplicación de diferentes indicadores bibliométricos por lo que hay que ser precavidos y exigentes en el tratamiento de dicha información y conocer bien sus limitaciones. Al final son personas las que están detrás de toda la batería de datos e indicadores y cualquier decisión que se tome les afecta directamente.

Motores de búsqueda para el navegador: agilizando la recuperación de información

Uno de los principales cometidos de los documentalistas debe ser el manejo de recursos y fuentes de información que faciliten y agilicen procesos rutinarios. Y qué proceso más habitual y repetitivo para un profesional de la documentación que la búsqueda y recuperación de información pertinente. Dice Fernando Juárez que la biblioteca tiene infravalorada la importancia del navegador en la calidad del acceso a internet. Me temo que muchos documentalistas también...

Pero esto lo podemos arreglar sin problemas. Casi todos los navegadores presentan ya la funcionalidad de buscar información a través de los motores de búsqueda integrados en el navegador, pero además de los habituales buscadores, otros muchos sitios webs han desarrollado sus propias extensiones para buscar directamente desde nuestro navegador evitándonos el paso por las páginas de inicio de dichos sitios web.

Pero como esta entrada tiene un carácter eminentemente didáctico, ¿cómo podemos saber si un sitio web tiene un plugin para buscar en ella desde el navegador? Pues en firefox, por ejemplo, dicho cuadro de búsqueda cambia levemente de color, tal que así (si tienes otra interfaz puede cambiar levemente).

Y ahora simplemente pinchas en el logo, y en el menú que se te despliega, te dará la opción de añadir dicho motor de búsqueda. Ya está.

Son varias las bases de datos y herramientas documentales que puedes instalarte. Pubmed, Dialnet o la Master List de Thomson Reuters son algunos de los motores que te puedes instalar desde sus páginas. Bibliotecas como Muskiz en España o la Universidad de Carolina del Norte en los EEUU también tienen su propia herramienta para buscar en el OPAC. El directorio Mycroft Project recoge muchas más extensiones, incluyendo, por ejemplo, múltiples diccionarios y enciclopedias.

Y si eres tan vago que te da pereza cambiar el motor de búsqueda para una consulta determinada, un truco (por cortesía del blog del barrio de los Rosales); le asignas una etiqueta o una palabra clave al motor de búsqueda y ¡a buscar directamente en la barra de direcciones! Por ejemplo, a través de la opción de "administrar buscadores" he etiquetado Pubmed como med, así que...

...para buscar directamente en Medline los artículos referidos a Bibliometría.

Fácil y sencillo. Esas extensiones nos ahorran tiempo y nos permiten personalizar nuestra búsqueda, tunear nuestro navegador para hacerlo más potente y eficaz. ¿Y tú, a qué esperas?