GEOCOMMONS: GEOLOCALIZACIÓN DE LA PRODUCCIÓN ACADÉMICA DE LA UPC
GEOCOMMONS: GEOLOCALIZACIÓN DE LA PRODUCCIÓN ACADÉMICA DE LA UPC
FRANCISCO MÁÑEZ SÁNCHEZ, JORDI PRATS PRAT,
TONI PRIETO JIMÉNEZ y REMEI GARCIA MARTÍNEZ
RESUMEN: El mes de noviembre del año 2016 se puso en funcionamiento el portal «GeoCommons: la UPC en el territori» (http://geocommons.upc.edu). GeoCommons tiene como principal objetivo mostrar el impacto de la actividad académica de la Universitat Politècnica de Catalunya (UPC) en el territorio, a partir de la geolocalización de los documentos depositados en su repositorio institucional. En el desarrollo del proyecto se tuvieron en cuenta tanto la gestión de los metadatos necesarios para su implementación en el repositorio, como su visualización posterior en el propio portal, basándose en estándares ampliamente utilizados. Para facilitar su consulta, la interfaz ofrece la posibilidad de filtrar los contenidos a partir de distintos criterios, como pueden ser tipos de documentos, materias o centros docentes. Con el objetivo de mejorar la explotación de los datos geográficos GeoCommons permite también la inserción de mapas en cualquier página web, facilitando su uso en distintos contextos. En la presente contribución se detallarán las particularidades del desarrollo del proyecto, así como sus principales líneas de trabajo futuras, entre las que destaca la implementación de un portal participado por todas las universidades politécnicas miembros de la Asociación UP4.
Palabras clave: Geolocalización; Visualización de datos; Repositorios institucionales.
Keywords: Geolocalization; Data visualization; Institutional repositories.
1. INTRODUCCIÓN
En el año 2006 el entonces Servicio de Bibliotecas y Documentación de la Universitat Politècnica de Catalunya (UPC), puso en funcionamiento el depósito institucional «UPCommons. Portal del conocimiento abierto de la UPC»[1], infraestructura que recoge, preserva y visualiza en Internet la producción docente y de investigación de la Universidad.
Los objetivos principales de UPCommons eran:
• Incrementar la calidad de la investigación y la docencia de la UPC, potenciando su visibilidad, posicionamiento y prestigio dentro de la comunidad académica y científica mediante las TIC e Internet.
• Mejorar la organización y gestión de las publicaciones académicas y científicas de la UPC mediante la automatización de los procesos y el cambio de formatos de papel a electrónico y digital.
Desde su puesta en funcionamiento hasta el día de hoy, UPCommons ha evolucionado hasta convertirse en un instrumento esencial para visualizar en Internet la actividad de investigación y de docencia de la Universidad, siendo posiblemente una de las webs que más tráfico genera en la UPC y posicionándose entre los primeros del mundo en los rankings especializados[2].
Este hecho posiblemente no responde tanto al importante volumen de documentos que contiene (más de 80.000), sino también a la diversidad de su naturaleza (artículos de revista, reportes de investigación, actas de congresos, tesis doctorales, tesinas de máster, proyectos de fin de grado, vídeos…), que en su conjunto ofrecen una visión plural y completa de la actividad que se lleva a cabo en la UPC.
El año 2014, en el marco de los estudios de Ingeniería Técnica en Topografía de la Escuela Politécnica Superior de Edificación de Barcelona (EPSEB), se presentaba el Proyecto de Fin de Carrera «Creación de un SIG de levantamientos topográficos realizados en proyectos finales de carrera en la EPSEB con Leaflet, JS, Geodjango y Postgirs» del estudiante Alberto Palenzuela y dirigido por la profesora Amparo Núñez[3].
El proyecto, realizado con la colaboración de la biblioteca de la Escuela, tenía por objetivo mostrar en un mapa los emplazamientos donde hacían referencia los PFC realizados por los alumnos. El importante desarrollo que están teniendo en la actualida de los Sistemas de Información Geográfica (SIG), así como la amplia disponibilidad de herramientas de software libre justificaba, en el marco de la titulación, el desarrollo de un proyecto que ilustrara el impacto que los trabajos de sus estudiantes tenían en el territorio.
No es nuevo que la visualización de datos es a día de hoy una disciplina de primer orden, al facilitar la lectura y análisis de datos desde ópticas diferentes, mostrando información no siempre evidente.
El proyecto de la EPSEB fue presentado en una reunión de la dirección del Servicio con los responsables de las bibliotecas y la posibilidad de visualizar la actividad y el impacto que la UPC había tenido y tiene en el territorio no se dejó escapar, siendo el origen del proyecto GeoCommons[4].
2. OBJETIVOS DEL PROYECTO
Partiendo del contexto establecido anteriormente se definieron los siguientes objetivos del proyecto:
• Elaborar un portal web que visualice el impacto que tiene la actividad de la UPC en el territorio, a partir de la geolocalización de los documentos depositados en «UPCommons. Portal del conocimiento abierto de la UPC».
• Establecer los mecanismos de gestión del proyecto con el fin de integrarlo dentro de los flujos de trabajo de actualización del repositorio, favoreciendo la sostenibilidad del proyecto.
• Utilizar herramientas de software libre para la elaboración del proyecto, que faciliten su integración en otros entornos, así como la disponibilidad del código para su modificación.
• Favorecer la participación de todas las bibliotecas en la elaboración del proyecto, favoreciendo su visión global y la pertenencia de los contenidos.
3. ACCIONES REALIZADAS
3.1. Creación de un grupo de trabajo para el desarrollo del proyecto
Para el desarrollo de los objetivos del proyecto se estableció un grupo de trabajo formado por personas de los Servicios Generales del Servicio de Bibliotecas, Publicaciones y Archivos y aquellas bibliotecas de la Universidad que, de manera más evidente, disponían de contenidos en UPCommons susceptibles de ser geolocalizados. A pesar de que el impacto en la UPC en el territorio se puede considerar como un aspecto común a la actividad de toda la Universidad, sí es cierto que, por sus especializaciones, en algunos centros esta se muestra de manera más evidente.
Finalmente, el grupo de trabajo quedó configurado con personas de Servicios Generales del Servicio de Bibliotecas, Publicaciones y Archivos, Biblioteca de la Escuela Politécnica Superior de Edificación de Barcelona, Biblioteca de la Escuela Técnica Superior de Arquitectura del Vallés, Biblioteca Rector Gabriel Ferrater, Biblioteca del Campus del Baix Llobregat, Biblioteca de la Escuela Técnica Superior de Arquitectura de Barcelona y Biblioteca del Campus Universitario de Manresa.
Los objetivos principales que se establecieron para el grupo de trabajo fueron:
• Definir los contenidos iniciales para ser geolocalizados.
• Definir los requerimientos del sistema.
• Validar el prototipo.
• Definir y validar el modelo de mantenimiento y gestión de los contenidos.
• Definir criterios de geolocalización de documentos.
• Establecer futuros requerimientos de la plataforma.
3.2. Definición de los contenidos iniciales
El hecho de contar en el grupo de trabajo con bibliotecas que disponían ya de mucha documentación susceptible de ser geolocalizada facilitó la definición de las prioridades en cuanto a contenidos de la web.
Fue cada biblioteca la que estableció su marco de trabajo, según sus prioridades, obteniendo un amplio abanico de tipologías documentales que garantizaba que en un futuro el desarrollo de la plataforma permitiera la georreferenciación de cualquier documento depositado en UPCommons.
No fueron pocas las que iniciaron su trabajo centrándose en los Proyectos y Trabajos de Fin de Carrera y Grado o Tesinas de Máster, al tratarse a menudo de trabajos con aplicaciones muy prácticas, relacionados con la aportación de soluciones a casos reales. Sin embargo, a día de hoy se pueden encontrar geolocalizados también artículos de revista, tesis doctorales, grabaciones de vídeo, libros,…
También pareció interesante incorporar un nuevo concepto en el proyecto: el de geolocalizar las entidades que habían participado o con las que se había colaborado en la elaboración de los diferentes trabajos. De este modo se incrementaba la visión del impacto de la UPC en el territorio, no solo mostrando las localizaciones donde hacían referencia los documentos, sino también con quiénes se está trabajando y dónde se encuentran, mostrando una fuerte colaboración con el tejido de empresas más cercanas, así como altos niveles de internacionalización en algunos programas.
3.3. Prototipado
Para el análisis de los requerimientos se tuvieron en cuenta, tanto el proyecto inicial desarrollado en la EPSEB, como otros proyectos implementados por otras organizaciones.
Hay que decir que la disponibilidad de herramientas de software libre o aplicaciones web para geolocalizar conceptos en mapas se ha visto incrementado en los últimos años, lo que ha propiciado un fuerte incremento en proyectos que las utilizan para la visualización de datos.
Sin embargo, no fue fácil encontrar referentes dentro del ámbito bibliotecario con los objetivos establecidos por el proyecto GeoCommons, ya que se trata a menudo de proyectos orientados a la gestión de colecciones patrimoniales, como puede ser el caso de la Búsqueda Geográfica del repositorio Memoria Digital de Cataluña[5] o de carácter muy especializado, como la Cartoteca Digital del Instituto Cartográfico y Geológico de Cataluña[6], especializada en la georreferenciación de cartografía histórica o el proyecto Earthworks de las Stanford University Libraries[7], por citar algunos ejemplos. De entre las excepciones, pero, cabe destacar el buscador geográfico del repositorio del Instituto Español de Oceanografía[8].
De los proyectos consultados quedó claro que el gran protagonista del portal web debía ser el propio mapa, intentando ofrecer unas funciones auxiliares y de apoyo a la hora de navegar por los diferentes países y ciudades.
A partir de elaboración y evaluación de diferentes prototipos el resultado final obtenido contempla:
• Un Sistema de Información Geográfica (SIG) que permite la navegación por un mapa del mundo donde se encuentran geolocalizados documentos incorporados al depósito institucional UPCommons, así como entidades (universidades, centros de investigación, empresas,…) con quien se ha colaborado para realizar un trabajo específico.
• La opción de filtrar los contenidos por tipo de documento (artículos de revista, tesis doctorales, trabajos de fin de grado,…).
• La opción de filtrar los contenidos por materias (aeronáutica y espacio, arquitectura, ingeniería agroalimentaria,…).
• Un buscador global.
• La opción de filtrar los contenidos y generar vistas específicas para la producción vinculada a un centro docente específico.
• La opción de ver solo documentos georreferenciados o entidades colaboradoras.
• La opción de cambiar el tipo de mapa donde se están visualizando los datos: imágenes satélites, curvas de nivel, alto contraste, alto contraste con fondo negro.
• Adaptado a dispositivos móviles.
• Multiidioma (catalán, castellano e inglés).
Para cada documento se muestra una información mínima de identificación: título, autor principal, tipo de documento, fecha de publicación y el enlace al registro completo en UPCommons.
Para cada entidad colaboradora se muestra: los documentos resultantes de la colaboración, el enlace a la web (si está disponible en el servicio Google Places), imágenes (si están disponibles en el servicio Google Places) y dirección (si está disponible al servicio Google Places)

3.4. Gestión de contenidos
Posiblemente uno de los puntos más sensibles identificados por el grupo de trabajo fueron los costes asociados a la geolocalización de los documentos y entidades colaboradoras, así como el mantenimiento y actualización del sistema.
Este aspecto fue también motivo de la elaboración de diferentes modelos, optando finalmente por potenciar la incorporación de los metadatos necesarios para la gestión de la plataforma en el propio repositorio, así como el desarrollo de herramientas auxiliares de apoyo a los bibliotecarios y bibliotecarias. De este modo el propio repositorio podrá ofrecer los datos de geolocalización de los documentos para otros proyectos mediante los protocolos de interoperabilidad que ya soporta, ofreciendo también a los bibliotecarios un entorno de gestión de estos datos ya conocido por ellos.
Otro aspecto importante que se tuvo en cuenta a la hora de establecer el modelo de gestión y actualización de los metadatos fue la voluntad de seguir estándares reconocidos internacionalmente. De esta manera se garantizaba la viabilidad de GeoCommons independientemente de la plataforma utilizada para su gestión. Sobre el metadato para guardar la geolocalización de documentos se optó por utilizar «dc.coverage.spatial» siguiendo el esquema del el estándar Dublin Core[9], garantizando de esta manera su reaprovechamiento para futuros proyectos.
3.5. Aspectos tecnológicos
GeoCommons está desarrollado con Yii Framework de PHP[10], entorno que implementa el patrón de diseño Modelo-Vista-Controlador, permitiendo interactuar con la base de datos a través de un ORM (Object-Relational Mapping) a través de los DAO (Data Access Objects), así como la internacionalización I18n para la implementación de aplicaciones multiidioma.
Para la creación de mapas interactivos se ha utilizado la librería de Javascript Leaflet[11], por varios motivos:
• Recomendación de expertos en SIG del Instituto Cartográfico y Geológico de Cataluña. Ellos mismos la están utilizando en algunos de sus productos.
• Rápida curva de aprendizaje, debido al estilo de código moderno.
• Buena arquitectura de software, muy optimizada, permite un muy buen rendimiento con un peso ligero.
• Atractivo look-and-feel y soporte para dispositivos móviles.
• Dispone de un extenso ecosistema de plugins desarrollados por los propios usuarios, que permite extender el funcionamiento «base» de la librería.
• Excelente documentación de la API y soporte técnico y funcional.
Como base cartográfica se ha utilizado el proyecto Open Street Map[12]. Se trata de un proyecto colaborativo que permite crear mapas libres y editables, a partir de información geográfica capturada por dispositivos GPS, ortofotografías y otras fuentes libres. Toda la cartografía se distribuye bajo licencia abierta de base de datos (ODbL).
En cuanto al diseño gráfico de la aplicación, se ha utilizado el framework de código abierto Bootstrap[13], que permite la creación de webs con una muy buena apariencia y proporciona una vía rápida por el diseño web adaptado a cualquier tipo de dispositivo (responsive).
En la carga de datos, se utiliza un script PHP de ejecución diaria, que obtiene la información de UPCommons mediante el protocolo Open Archives Initiative-Protocol for Metadata Harvesting[14]. El servidor de UPCommons publica información sobre los documentos geolocalizados y/o los documentos que tienen entidades colaboradoras. GeoCommons las procesa, parsea y crea su propia base de datos.
3.6. Inserción de GeoCommons en páginas web
GeoCommons no acaba en su propio portal. Se ha previsto también que pueda ser un instrumento que ilustre otras páginas o productos web.
El uso del tag de HTML «iframe», estándar también, permite insertar en cualquier página web los contenidos del GeoCommons, con unas funcionalidades mínimas y orientado a la visualización geográfica de datos dentro de contextos más precisos.
Un ejemplo se puede encontrar en la página principal del depósito UPCommons, donde se muestra el mapa del mundo con la totalidad de los documentos geolocalizados.
Aparte de insertar la totalidad de los documentos geolocalizados, se facilita también la posibilidad de personalizar esta vista a partir de la producción vinculada a un centro docente.
4. EL PROYECTO GEOUP4
En el marco de la creación de la Asociación UP4, formada por las cuatro universidades politécnicas españolas (Universidad Politécnica de Cataluña, Universidad Politécnica de Valencia, Universidad Politécnica de Cartagena y Universidad Politécnica de Madrid) se creó un grupo de trabajo específico para el desarrollo de proyectos dentro del ámbito de las bibliotecas, las publicaciones y los archivos (UP4BIB). UP4BIB tiene entre sus objetivos realizar proyectos conjuntos e innovadores para los servicios bibliotecarios e información científica y técnica.
En una reunión celebrada en la Universidad Politécnica de Valencia se decidió impulsar el proyecto GeoUP4, que seguirá las líneas de trabajo y objetivos del proyecto GeoCommons, pero ofreciendo un mapa donde se mostrará el impacto en el territorio de las cuatro universidades politécnicas a partir de sus publicaciones académicas.
Para el desarrollo del proyecto se ha creado un grupo de interlocutores de cada una de las universidades, con el que se definen los requerimientos específicos que pueda tener el producto, tales como la estructura de datos a utilizar o la tecnología a aplicar.
Cabe destacar que el aprovechamiento de los desarrollos realizados en el proyecto GeoCommons, así como el uso de estándares ampliamente conocidos y utilizados está facilitando mucho la implementación del portal GeoUP4, del que se espera disponer de un primer prototipo en breve.
5. RESULTADOS Y CONCLUSIONES
El hecho de haber articulado, para la definición y gestión del proyecto, un grupo de trabajo formado por seis bibliotecas (aparte de las personas de los Servicios Generales) permitió la definición de un proyecto muy plural, donde se contemplaron las diferentes necesidades y realidades que podían tener sus centros o campus. Esta pluralidad ha permitido una rápida incorporación del resto de bibliotecas al proyecto.
GeoCommons dispone a día de hoy de más de 7800 puntos geolocalizados y más de 900 entidades colaboradoras identificadas. Teniendo en cuenta que el proyecto se presentó en noviembre del año 2016, hay que decir que está teniendo un ritmo de crecimiento mucho más elevado de lo que en su momento se previó. Posiblemente esto se debe a que las herramientas de gestión de metadatos definidas funcionan adecuadamente y las bibliotecas han podido insertar la geolocalización en sus procesos habituales de gestión de documentos en UPCommons.
El hecho de poder trabajar el proyecto también junto con PDI de la Universidad especializados en áreas como la ingeniería geomática ha permitido la elaboración de un proyecto más sólido y robusto, adaptado a los requerimientos previamente establecidos y contando con el asesoramiento de especialistas.
El interés mostrado por la comunidad de la UPC[15], así como del entorno profesional o de otras universidades ha sido muy notable. El hecho de poder mostrar el impacto de la actividad académica de la universidad de forma innovadora, poniendo el énfasis en su actividad tanto en el territorio más cercano como en el mundo, ilustra el compromiso de la UPC con su entorno inmediato, así como sus altos niveles de internacionalización, aportando además la evidencia de la documentación generada en esta actividad. Como muestra, tal y como se ha dicho, hay que destacar el interés de los servicios bibliotecarios de las universidades UP4 en trabajar un proyecto conjunto en esta línea.
Con la puesta en funcionamiento del portal, se han detectado nuevas necesidades y desarrollos para mejorar su rendimiento, añadir funcionalidades o ampliar las posibilidades.
De las nuevas necesidades y funcionalidades detectadas destacan:
• Mejora de la estructura de la base de datos y del entorno de desarrollo: para mejorar los tiempos de carga de la web, así como obtener una estructura de datos más flexible, se está trabajando en la actualización de la base de datos y el entorno de desarrollo.
• Tratamiento de la geografía política (municipios, comarcas y países): como ya se ha dicho, actualmente la aplicación permite solo geolocalizar puntos en base a dos coordenadas, pero se han detectado bastantes documentos que hacen referencia a municipios, comarcas, países, etc., y se está trabajando tanto en el modo de hacer la gestión de estas geolocalizaciones como en encontrar la mejor solución para ilustrarlo en el mapa.
• Georeferenciación de cartografía: los documentos cartográficos requieren tratamientos particulares a la hora de posicionarse en un mapa. Con la colaboración de la profesora Amparo Núñez[16] se quiere elaborar un proyecto específico para la gestión y tratamiento de esta documentación.
• Flexibilización de la inserción de GeoCommons a páginas web: actualmente la inserción de GeoCommons a páginas web solo permite personalizar la vista a partir del centro al que se refiere la documentación geolocalizada. Se está trabajando para que esta vista se pueda personalizar en base a cualquiera de los criterios de filtrado que ofrece actualmente GeoCommons (tipo de documentos, materias, etc.).
• Geolocalización automática de documentos: se ha establecido contacto con el profesor Horacio Rodríguez[17], del Grupo de Procesamiento del Lenguaje Natural de la UPC, para estudiar la viabilidad de geolocalizar automáticamente documentos depositados en UPCommons.
[3] Palenzuela Cesar, A. (2014). Creación de un SIG de levantamientos topográficos realizados en proyectos finales de carrera en la EPSEB con Leaflet, JS, Geodjango y Postgirs. 31/07/2017, de Universitat Politècnica de Catalunya Sitio web: http://hdl.handle.net/2099.1/24821
[9] Dublin Core Metadata Innitiative. (2006). DCMI Point Encoding Scheme: a point location in space, and methods for encoding this in a text string. 31/07/2017, de Dublin Core Metadata Innitiative Sitio web: http://dublincore.org/documents/dcmi-point/
[10] xx
[15] El proyecto GeoCommons ha recibido este año uno de los premios otorgados por el Consejo social de la UPC a la calidad de la gestión universitaria (http://www.upc.edu/consellsocial/ca/premis-del-consell-social/premi-upc-qualitat-de-la-gestio-universitaria).