Metodología

Conozca nuestras metodologías

HIPATIA aloja diferentes tipos de aplicaciones que utilizan una diversidad de fuentes y abordajes. Contiene tanto información desagregada basada en el microdato, cuyas unidades de estudio son el individuo o los centros de investigación, así como indicadores “macro”, que brindan un panorama del quehacer nacional en ciertos temas.

Incluye aplicaciones con un formato de paneles que, en conjunto, albergan 62 variables en forma de gráficos interactivos con estadísticas e información desagregada.

Otras aplicaciones tienen un formato de buscadores, y aunque se orientan al emprendedor y al empresario en lo individual, al mismo tiempo evidencian avances y rezagos en áreas donde aún es necesario poner el foco de atención.

metodo

¿Tiene alguna duda acerca de algunos términos que utilizamos en los datos o nuestras metodologías?

Ver glosario

Grupos de investigación

¿Qué datos se incluyen?

El estudio parte de las relaciones de coautoría de los investigadores adscritos a instituciones establecidas en Costa Rica, específicamente con base en las publicaciones que esos autores registraron en la plataforma Scopus (desarrollada por la empresa editorial Elsevier) y el “Sistema regional de información en línea para revistas científicas de América Latina, el Caribe, España y Portugal” (Latindex). A partir de esta información se construyó una matriz de coautoría, a la cual se le aplicó un análisis de redes sociales.
El término “grupos de investigación” se utiliza como un concepto operativo que se define en función de la existencia y extensión de las redes de coautoría. Comprende a los autores que firman de modo conjunto sus publicaciones científicas, aunque no necesariamente corresponden a una determinada estructura administrativa o institucional.

GI

¿Cuáles variables se utilizan?

  • Entramado general que refleja la huella de la producción científica y tecnológica endógena, generada durante el período 2000-2021 por autores que han estado afiliados a instituciones del país.
  •  Grupos de investigación identificados, que resultan de la dinámica de las colaboraciones descritas en el punto anterior, según área del conocimiento, institución y sexo.
  • Estadísticas que describen generalidades de los grupos de investigación.
  • Métricas propias del análisis de redes sociales, como densidad, grado de centralidad y grado de centralidad por intermediación.
  • Índice “h” o índice de Hirsch, que refleja el balance entre el número de artículos científicos y las citas de las que han sido objeto. Si el índice “h” vale n, entonces n publicaciones han sido citadas más de n veces.
  • Producción científica de cada investigador registrada en Scopus.

¿Cuál es el tamaño de las bases de datos?

Scopus (datos al año 2021)

Número de documentos: 12.943 
Número de autores: 1.923

 

Latindex (datos al año 2019)

Número de documentos
Ciencias Agroalimentarias: 267
Ingenierías y Tecnologías: 442

Número de autores
Ciencias Agroalimentarias: 416
Ingenierías y Tecnologías: 713

¿Cuáles fuentes se consultaron?

Coautorías de publicaciones en Scopus

El análisis se restringió a los artículos científicos y revisiones clasificados por Scopus bajo temáticas comprendidas en las áreas de Ciencias Experimentales, Ingenierías y Tecnologías. Abarca el período 2000-2021.

Además, se realizó una búsqueda de información en internet, sobre las áreas del conocimiento en que se desempeñan las y los autores identificados.

¿Cuál fue el tratamiento de los datos?

Metodología del análisis y visualización de redes

Para el análisis a partir de las coautorías indexadas en Scopus, como un primer filtro se consideraron todas las publicaciones de investigadores vinculados a instituciones costarricenses. Se obtuvo un total de 18.954 autores, que incluye personas adscritas a entidades nacionales y sus coautores pertenecientes a organizaciones en el extranjero. En un segundo nivel el estudio se concentró en los autores afiliados exclusivamente a instituciones en Costa Rica; en total se identificaron 9.628 personas. Por último, para registrar el legado de los investigadores con mayor actividad, el análisis se enfocó en aquellos que cuentan con tres o más artículos publicados entre 2000 y 2021 y sus coautores que realizaron al menos dos publicaciones durante ese período. De esta forma se construyó una red integrada por 1.923 autores.

La descarga de la base de datos de Scopus se efectuó mediante la herramienta API Key de la empresa Elsevier. La información extraída de Scopus se almacenó en la base de datos Neo4j orientada a grafos.

Análisis y visualización de redes

A partir de la información obtenida de Scopus, como una primera aproximación para identificar los grupos de investigación que conforman la red se aplicó el algoritmo Fast Greedy, de Girvan-Newman, mediante el software Cytoscape. Este algoritmo identificó 62 grupos de autores, bajo la premisa de que hay más conexiones al interior del grupo que con respecto al resto de la red.

Para mejorar la visualización al interior de los grupos resultantes se aplicó el algoritmo Force Atlas, a través de la herramienta y lenguaje de programación R y su entorno de desarrollo integrado RStudio. Este mismo software se utilizó para estimar un conjunto de indicadores que describen ciertas propiedades estructurales, tanto de la red como de los autores en forma individual.

Posteriormente se incorporó el visualizador de grafos Linkurious, que facilita la representación de redes interactivas en aplicaciones web.

Por otra parte, se recogieron estadísticas generales alusivas a los grupos, para lo cual se empleó el software Tableau Public.