Metodología

Conozca nuestras metodologías

HIPATIA aloja diferentes tipos de aplicaciones que utilizan una diversidad de fuentes y abordajes. Contiene tanto información desagregada basada en el microdato, cuyas unidades de estudio son el individuo o los centros de investigación, así como indicadores “macro”, que brindan un panorama del quehacer nacional en ciertos temas.

Incluye aplicaciones con un formato de paneles que, en conjunto, albergan 62 variables en forma de gráficos interactivos con estadísticas e información desagregada.

Otras aplicaciones tienen un formato de buscadores, y aunque se orientan a la persona emprendedora y empresaria en lo individual, al mismo tiempo evidencian avances y rezagos en áreas donde aún es necesario poner el foco de atención.

metodo

¿Tiene alguna duda acerca de algunos términos que utilizamos en los datos o nuestras metodologías?

Ver glosario

Grupos de investigación

¿Qué datos se incluyen?

El estudio parte de las relaciones de coautoría de las personas investigadoras adscritas a instituciones establecidas en Costa Rica, específicamente con base en las publicaciones que esas personas autoras registraron en la plataforma Scopus, desarrollada por la empresa editorial Elsevier. A partir de esta información se construyó una matriz de coautoría, a la cual se le aplicó un análisis de redes sociales.
El término “grupos de investigación” se utiliza como un concepto operativo que se define en función de la existencia y extensión de las redes de coautoría. Comprende a las personas autoras que firman de modo conjunto sus publicaciones científicas, aunque no necesariamente corresponden a una determinada estructura administrativa o institucional.

GI

¿Cuáles variables se utilizan?

  • Entramado general que refleja la huella de la producción científica y tecnológica endógena, generada durante el período 2000-2021 por autores que han estado afiliados a instituciones del país.
  •  Grupos de investigación identificados, que resultan de la dinámica de las colaboraciones descritas en el punto anterior, según área del conocimiento, institución y sexo.
  • Estadísticas que describen generalidades de los grupos de investigación.
  • Métricas propias del análisis de redes sociales, como densidad, grado de centralidad y grado de centralidad por intermediación.
  • Índice “h” o índice de Hirsch, que refleja el balance entre el número de artículos científicos y las citas de las que han sido objeto. Si el índice “h” vale n, entonces n publicaciones han sido citadas más de n veces.
  • Producción científica de cada persona investigadora registrada en Scopus.

¿Cuál es el tamaño de las bases de datos?

Scopus (datos al año 2021)

Número de documentos: 12.943 
Número de autores: 1.923

¿Cuáles fuentes se consultaron?

Coautorías de publicaciones en Scopus

El análisis se restringió a los artículos científicos y revisiones clasificados por Scopus bajo temáticas comprendidas en las áreas de Ciencias Experimentales, Ingenierías y Tecnologías. Abarca el período 2000-2021.

Además, se realizó una búsqueda de información en internet, sobre las áreas del conocimiento en que se desempeñan las y las personas autoras identificadas.

¿Cuál fue el tratamiento de los datos?

Metodología del análisis y visualización de redes

Para el análisis a partir de las coautorías indexadas en Scopus, como un primer filtro se consideraron todas las publicaciones de personas investigadoras vinculadas a instituciones costarricenses. Se obtuvo un total de 18.954 autores, que incluye personas adscritas a organizaciones costarricenses o con sede en Costa Rica. En un segundo nivel el estudio se concentró en los autores afiliados exclusivamente a instituciones en Costa Rica; en total se identificaron 9.628 personas. Por último, para registrar el legado de las personas investigadoras con mayor actividad, el análisis se enfocó en aquellos que cuentan con tres o más artículos publicados entre 2000 y 2021 y sus coautores que realizaron al menos dos publicaciones durante ese período. De esta forma se construyó una red integrada por 1.923 autores.

La descarga de la base de datos de Scopus se efectuó mediante la herramienta API Key de la empresa Elsevier. La información extraída de Scopus se almacenó en la base de datos Neo4j orientada a grafos.

Análisis y visualización de redes

A partir de la información obtenida de Scopus, como una primera aproximación para identificar los grupos de investigación que conforman la red se aplicó el algoritmo Fast Greedy, de Girvan-Newman, mediante el software Cytoscape. Este algoritmo identificó 62 grupos de autores, bajo la premisa de que hay más conexiones al interior del grupo que con respecto al resto de la red.

Para mejorar la visualización al interior de los grupos resultantes se aplicó el algoritmo Force Atlas, a través de la herramienta y lenguaje de programación R y su entorno de desarrollo integrado RStudio. Este mismo software se utilizó para estimar un conjunto de indicadores que describen ciertas propiedades estructurales, tanto de la red como de los autores en forma individual.

Posteriormente se incorporó el visualizador de grafos Linkurious, que facilita la representación de redes interactivas en aplicaciones web.

Por otra parte, se recogieron estadísticas generales alusivas a los grupos, para lo cual se empleó el software Tableau Public.