¿Puede aportar la Documentación soluciones para la gestión de ingentes cantidades de datos?
Wired, esa revista que pasa por ser uno de las más vitales cazadoras de tendencias en el mundo tecnológico, dedica su último número a desgranar cómo las cada vez más complejas y gigantes cantidades de datos que se manejan en las investigaciones están cambiando la forma tradicional de la Ciencia. Con el provocador título en su portada de The end of Science, y con el ejemplo de Google (cómo no), y de la secuenciación del genoma, Wired afirma que se acabó la era de las teorias, ya no es necesaria la búsqueda de un modelo que explique el comportamiento de algún fenómeno, basta con mirar los números. Polémica afirmación, cuanto menos.
We can throw the numbers into the biggest computing clusters the world has ever seen and let statistical algorithms find patterns where science cannot.
Desde luego, y pese a los enemigos de lo cuantitativo (tantos y tantos en la ByD, por ejemplo) es innegable que las cantidades de datos con las que se trabajan en los laboratorios provoca un cambio en los métodos de trabajo. Los viejos sistemas de almacenamiento y recuperación de información tienen unos límites, más o menos amplios, pero los tienen. El reto de la Documentación es desde luego aportar soluciones que ayuden a la gestión de esos datos en una época en la que ya no es suficiente indizar tan sólo un título y unas simples keywords que se le han ocurrido al documentalista o bibliotecario de turno. Es necesario indizar el texto completo y establecer mecanismos de jerarquización y recuperación de la información.
Por ello, surgen métodos como los basados en metáforas biológicas (por ejemplo, los algorismos genéticos o los basados en colonias de hormigas) como forma de aproximarse a las soluciones más probables que una necesidad de información puede generar.
Esto es lo que hace Google con tus consultas. Fuente: Wired: Sorting the World: Google Invents New Way to Manage Data.
Pero no es necesario pensar en complejas operaciones logarítimicas para las que muchos no estamos capacitados. El rastreo y recuperación de información sobre un tema determinado ya supera ampliamente el terreno de lo textual y de los tradicionales formatos web.
Rastrear mails, feeds, nanoblogs, redes sociales, fotos, tags, vídeos, y en definitiva, cualquier elemento informativo accesible a través de la Red, almacenar dicha información y prepararla para su análisis es cada vez más una ingente tarea que sobrepasa los límites del trabajo individual y manual, y que debe basarse (sí o sí) en métodos automáticos, semánticos (signifique esto lo que signifique) e inteligentes, que posibiliten que el sistema "aprenda" de la información ya almacenada. El objetivo puede ser detectar insospechadas relaciones entre variables o aportar la mejor evidencia para la toma de decisiones.
Sean cuales sean los objetivos finales, el mundo de la Documentación, en colaboración con matemáticos e informáticos está en disposición de ayudar en el diseño de estos sistemas y jugar un papel esencial en su desarrollo. Apasionante, sin duda.




milagobios dijo
Nueva biblioteca pública en Vallecas:
http://www.madrid.org/cs/Satellite?alias=1142476509415&c=Page&cid...
23 Julio 2008 | 08:24 PM