REMIJ 2025; 25(2)
Inteligencia artificial aplicada a la docencia e investigación clínica:
resultados de una revisión sistemática 2021–2025
Artificial intelligence applied to teaching and clinical research: results of a systematic review
20212025.
Dr. Adrián Batista Valladares1 Dr. Carlos Alexander Serrano Amador 2Dr.C Heenry Luís Dávila
Gómez3
1 Especialista de I grado en Medicina General Integral. Máster en Enfermedades Infecciosas.
Profesor Asistente. Dirección General de Salud Isla de la Juventud. Email:
dradrian@infomed.sld.cu ORCID https://orcid.org/ 0000-0002-5331-7568
2 Especialista de I grado en Medicina General Integral. Profesor Asistente. Facultad de Ciencias
Médicas Isla de la Juventud. Email:alex.gerona72@gmail.com ORCID: https://orcid.org/ 0000-
0003-3877-6122)
3 Doctor en Ciencias Médicas. Especialista de I y II grado en Ginecología y Obstetricia. Profesor e
Investigador Auxiliar. Facultad de Ciencias Médicas Isla de la Juventud. Email:
heenryluis781027@gmail.com ORCID: https://orcid.org/ 0000-0003-1531-9850
RESUMEN
La educación médica y la investigación clínica atraviesan una transformación
acelerada debido al crecimiento exponencial de la literatura biomédica. Entre 2021 y
2025 emergieron cinco herramientas de Inteligencia Artificial (IA) diseñadas para
optimizar la búsqueda, análisis y síntesis de evidencia: Scispace, Consensus, Elicit,
Research Rabbit y Scite, esta revisión sistemática analiza su efectividad, adopción y
potencial educativo, a partir de 18 estudios empíricos, los hallazgos muestran que
estas soluciones no reemplazan los métodos convencionales, pero ofrecen
ventajas significativas para el aprendizaje, la docencia investigativa y el trabajo
académico. Se proponen lineamientos para su integración responsable en
programas docentes, talleres de metodología, investigación formativa y proyectos
institucionales.
Palabras claves: inteligencia artificial, educación médica, investigación clínica.
SUMMARY
Medical education and clinical research are undergoing rapid transformation due to
the exponential growth of biomedical literature. Between 2021 and 2025, five
Artificial Intelligence (AI) tools emerged designed to optimize the search, analysis,
and synthesis of evidence: Scispace, Consensus, Elicit, ResearchRabbit, and Scite.
This systematic review analyzes their effectiveness, adoption, and educational
potential based on 18 empirical studies. The findings show that these solutions do
not replace conventional methods but do offer significant advantages for learning,
research teaching, and academic work. Guidelines are proposed for their
responsible integration into teaching programs, methodology workshops, formative
research, and institutional projects.
Keywords: artificial intelligence, medical education, clinical research.
INTRODUCCIÓN
La docencia en Ciencias de la Salud enfrenta un reto central: la avalancha de
información científica, que se duplica en periodo alrededor de cinco años,1 tanto en
los docentes como los estudiantes, se ven sobrepasados por la velocidad con que
surgen nuevas evidencias y por la exigencia creciente de incorporar prácticas de
Medicina Basada en Evidencia (MBE) en todos los procesos formativos, de manera
simultánea, la enseñanza de la metodología de la investigación demanda nuevas
herramientas pedagógicas que permitan acercar al estudiante a la búsqueda
científica real, sin depender de forma exclusiva de los procesos extensos o difíciles
de replicar en un ambiente educativo. En este contexto emergen cinco herramientas
de IA que, según la literatura revisada, pueden amplificar las capacidades docentes
y mejorar el aprendizaje autónomo: 1) Scispace: un «copiloto» integral para
búsqueda, análisis, resumen y lectura guiada; 2 2) Consensus: motor que responde
preguntas clínicas (en especial, tipo PICO) con evidencia sintetizada; 3 3) Elicit:
plataforma para automatizar cribado inicial y extracción de datos en revisiones
sistemáticas;4 4) Research Rabbit: sistema visual para explorar redes de literatura y
líneas de investigación;5 y 5) Scite: herramienta que clasifica citaciones en apoyo,
contradicción o mención, útil para evaluar fiabilidad.6 Hasta la fecha, su uso en
docencia es incipiente, pero su potencial para facilitar el aprendizaje investigativo es
evidente. Esta revisión sistemática identifica y analiza la evidencia desde una
perspectiva orientada a la enseñanza.
MÉTODO
Se aplicó la metodología PRISMA 2020 para analizar estudios empíricos publicados
entre noviembre de 2021 y octubre de 2025.7 Las bases consultadas incluyen
PubMed/MEDLINE, Scopus, Web of Science, EMBASE, Cochrane Library y Google
Scholar, de 3.450 registros iniciales, se incluyeron 18 estudios tras aplicar criterios
de elegibilidad, con predominio de investigaciones publicadas en 20242025.
Los estudios fueron clasificados en: validación de herramientas (n=6);
usabilidad/descriptivos (n=9) y comparativos (n=3). La síntesis fue narrativa debido
a la heterogeneidad de métodos y métricas.
RESULTADOS
¿Qué puede aportar cada herramienta al proceso docente? (síntesis educativa)
Los hallazgos se traducen en una propuesta didáctica directa para el profesorado:
Elicit: Evidencia empírica indica que acelera entre un 4050% tareas como
cribado o extracción preliminar de datos.8, 9 Su potencial docente radica en: 1) Útil
para enseñar cómo se estructura una revisión sistemática; 2) Facilita la introducción
a tablas de Población, Intervención y Resultados y 3) Permite simular búsquedas
con estudiantes sin perder tiempo en tareas mecánicas.
Scite: Validación sólida en clasificación de citaciones (Kappa > 0.85).10 Desde
su potencial docente: 1) Permite enseñar pensamiento crítico sobre la calidad de
una afirmación científica y 2) Ayuda a estudiantes a diferenciar «estudios citados»
de «estudios que respaldan».
Consensus: Herramienta útil para sintetizar respuestas rápidas a preguntas
clínicas.3 Es excelente para clases de MBE y discusión de casos clínicos; además
de que permite comparar evidencia sintetizada vs. lectura detallada de artículos.
Research Rabbit: Útil en descubrimiento y visualización de redes de
conocimiento.5 Con relación a su potencial docente: 1) Ideal para talleres de
búsqueda bibliográfica y 2) Ayuda a visualizar líneas históricas de investigación y
relaciones entre autores.
Scispace: Permite resumir, traducir, comentar y «conversar» con un PDF.2
Dentro de su potencial docente se reconoce: 1) Herramienta para guiar aprendizaje
autónomo de lectura crítica y 2) Facilita preparación de clases, resúmenes y
material didáctico.
Límites importantes para su uso académico
Según los estudios revisados, no sustituyen las búsquedas tradicionales (Elicit solo
alcanza sensibilidad 25,5%69,2%).8 La reproducibilidad es limitada en squedas
semánticas.11 Scispace, Consensus y Research Rabbit carecen de validación
robusta. En el contexto docente, esto implica que deben usarse como apoyo, no
como fuentes únicas de evidencia.
DISCUSIÓN
La evidencia indica que estas herramientas, aunque aún inmaduras para tareas de
investigación rigurosa, tienen un impacto potencial enorme en la educación médica.
Sus beneficios clave para la docencia son:
Democratizan el acceso al aprendizaje investigativo: permiten que estudiantes
con poca experiencia interactúen con literatura real desde el primer día, lo que
reduce las barreras tradicionales.
Mejoran la motivación: el aprendizaje se vuelve más visual, interactivo y rápido:
investigar con Research Rabbit, analizar citaciones con Scite, formular preguntas
clínicas en Consensus.
Aceleran la formación metodológica: los docentes pueden convertir en minutos
procesos que por lo general requieren horas, lo que permite dedicar más tiempo a
razonamiento crítico y menos a tareas mecánicas.
Favorecen el Aprendizaje Basado en Problemas (ABP) y la MBE: Consensus y
Scispace facilitan integrar evidencia actualizada en la discusión de casos clínicos sin
demora.
Permiten desarrollar competencias digitales: estas competencias son
esenciales exigidas por organismos internacionales para la formación médica del
siglo XXI.
Recomendaciones para docentes e investigadores
Basadas en la evidencia presentada, se sugiere:
Para clases de MBE y clínica: usar Consensus para iniciar debates clínicos
basados en evidencia, y además también utilizar Scite para enseñar lectura crítica y
robustez de un artículo.
Para talleres de metodología de investigación: usar Elicit para enseñar fases
de una revisión sistemática, a lo que también usar Research Rabbit para explicar
búsquedas no lineales y mapeo de temas.
Para tutoría de trabajos académicos: emplear Scispace para enseñar lectura
guiada de artículos y resúmenes automáticos, al igual utilizarlo también para
supervisar borradores, referencias y redacción científica.
En todos los casos: mantener la búsqueda tradicional como método principal,
explicar limitaciones, sesgos y falta de reproducibilidad documentada y enseñar a
contrastar todo resultado con bases primarias (PubMed, EMBASE).
CONCLUSIONES
Las herramientas de IA analizadas son asistentes educativos poderosos, en
especial útiles en: el aprendizaje autónomo, la docencia en metodología, los talleres
de investigación y los proyectos formativos en ciencias de la salud. Ninguna
reemplaza la investigación rigurosa, pero todas pueden transformar de manera
positiva la forma en que se enseña y aprende la investigación clínica, para el
contexto educativo, la adopción crítica y con guía pedagógica de estas tecnologías
representa una oportunidad para fortalecer la formación científica de docentes,
estudiantes y residentes.
REFERENCIAS
1. Bornmann L, Mutz R. Growth rates of modern science: A bibliometric analysis of
the number of publications and cited references. J Assoc Inf Sci Technol. [en
linea] 2015 [citado 29 abr 2025]; 66(11):2215-22. Disponible en:
https://www.researchgate.net/publication/262987677_Growth_rates_of_modern_
science_A_bibliometric_analysis_based_on_the_number_of_publications_and_c
ited_references_Growth_Rates_of_Modern_Science_A_Bibliometric_Analysis_B
ased_on_the_Number_of_Publicatio
2. Castaño Castaño S. La inteligencia artificial en Salud Pública: oportunidades,
retos éticos y perspectivas futuras: e202503017. Rev Esp Salud blica [en
linea] 2025 [citado 22 de Dic 2025]; 99(1):12 páginas. Disponible en:
https://ojs.sanidad.gob.es/index.php/resp/article/view/1006
3. García Palomer D, Arretx Spoerer M. Evaluación cualitativa de modelos de
inteligencia artificial generativa para resolución de preguntas clínicas de
rehabilitación infantil [en linea] 2023 [citado 06 dic 2025] Vol. 18, Rehabilitación
Integral. Rehabilitación Integral; p. 1932. Disponible en:
https://doi.org/10.51230/ri.v18i1.98
4. Wang, Futing, et al. "ELICIT: LLM augmentation via external in-context
capability." arXiv preprint [Internet] 2024 [citado 11 Dic 2025]; 2410.09343.
Disponible en: https://arxiv.org/abs/2410.09343
5. Zacarías Torres A del Ángel. Más allá de la Automatización: Inteligencia Artificial
y sus Implicaciones en la Docencia y el Mundo del Trabajo. Ciencia Latina [en
linea] 2023 [citado 22 de ene 2024]; 7(5):7473-87. Disponible en:
https://ciencialatina.org/index.php/cienciala/article/view/8333
6. Page MJ, McKenzie JE, Bossuyt PM, Boutron I, Hoffmann TC, Mulrow CD, et al.
The PRISMA 2020 statement: an updated guideline for reporting systematic
reviews. BMJ. [en linea] 2021 [citado 29 mar 2025]; 372: 71. Disponible en:
https://doi.org/10.1136/bmj.n71
7. Porzybót D, Golysheva I. Applications of artificial intelligence in medicine: a
state-of-the-art review and future perspectives. European Journal of
Management and Social Science [en linea] 2024; [citado 06 dic 2025] 5(12): 14-
8. Disponible en: https:// EJMSS+2024+1_2
8. Thirunavukarasu AJ, Almajalid R, Ho AT. Large language models in medicine.
Nature Medicine [en linea] 2024 [citado 06 dic 2024]; 29(8), 193040. Disponible
en: https://doi.org/10.1038/s41591-023-02448-8
9. Moosavi A, Huang S, Vahabi M, Motamedivafa B, Tian N, Mahmood R, et al.
Prospective Human Validation of Artificial Intelligence Interventions
in Cardiology: A Scoping Review. JACC. Advances, [en linea] 2024 [citado 28
ago 2024]; 3(9), 101202. Disponible en:
https://doi.org/10.1016/j.jacadv.2024.101202
10. Liu X, Cruz-Rivera S, Moher D, Calvert M, Denniston AK, SPIRIT-AI and
CONSORT-AI Working Group. Reporting guidelines for clinical trials evaluating
AI interventions: The CONSORT-AI extension. BMJ [en linea] 2020 [citado 06
dic 2024]; 370, m3164. Disponible en:
https://www.thelancet.com/journals/landig/article/PIIS2589-7500(20)30218-
1/fulltext
11. Gallent-Torres C, Zapata-González A, Ortego-Hernando JL. El impacto de la
inteligencia artificial generativa en educación superior: una mirada desde la ética
y la integridad académica. ALIVIAR. Revista Electrónica de Investigación y
Evaluación Educativa [en linea] 2020 [citado 28 ago 2024] 2023;29(2):1-
21.Disponible en: :https://www.redalyc.org/articulo.oa?id=91676028011