La calidad de la indización en las bases de datos científicas
Nadie dijo que conseguir exactitud en el tratamiento de grandes cantidades de información fuera fácil, pero aspirar a ello, al menos, no estaría mal. Una de las principales bases de datos de artículos científicos Cat.inist elaborada por el CNRS (el CSIC francés) nos muestra afiliaciones como ésta.
Ciudades sin duda muy conocidas por todos como Alhacete o Albacefe o esas unidades administrativas llamadas Depurtamento o la más usual Deparluniento de reminiscencias claramente italianas, y que entorpecen especialmente nuestra labor documental.
Con los nombres de los autores tampoco vamos muy bien. Es un tema bien candente, como demuestra que el artículo más citado de ec3 sea uno que trata acerca de la indización de autores españoles en bases de datos internacionales [pdf], que la FECYT haya financiado un estudio en el que se recomienda a los autores españoles cómo deben firmar sus trabajos o hayan surgido iniciativas como IraLIS para normalizar nombres de autores en ByD. Lo cierto es que aún muchos autores siguen usando un sólo apellido en su firma lo que unido a la deficiente indización en algunas bases de datos dificulta mucho su correcta localización.
Mira este registro, ¡están repetidas las iniciales de todos los autores!
También es cierto que la competencia WoS-Scopus está generando desarrollos que redundan en la calidad de la indización y en la mayor exactitud de los estudios bibliométricos, como demuestra el hecho de que ambas empresas hayan implantado recientemente la correspondencia autor-institución para los artículos más recientes o el desarrollo completo del nombre del investigador.
En definitiva, en mi opinión se hace necesario el concurso humano para revisar y en su caso modificar el vaciado de los artículos en las bases de datos, realizados por procedimientos automáticos. Cada vez más instituciones confían sus mecanismos de promoción en la aplicación de diferentes indicadores bibliométricos por lo que hay que ser precavidos y exigentes en el tratamiento de dicha información y conocer bien sus limitaciones. Al final son personas las que están detrás de toda la batería de datos e indicadores y cualquier decisión que se tome les afecta directamente.


Foto: Alonso Lobato

zapico dijo
El uso indiscriminado del OCR y la ignorancia de los indizadores hacen irresolubre el problema, bueno algunos hemos pasado miles de horas intentando normalizar estos errores.
14 Diciembre 2008 | 09:15 PM