AntecedentesLa inteligencia artificial (IA) permite la automatización de las revisiones sistemáticas de la literatura (RLS), tal como proponen varias colaboraciones internacionales. Las SLR de alta calidad se adhieren a fases estrictas para abordar una pregunta estructurada, la selección de términos de búsqueda, la búsqueda bibliográfica, la preselección de referencias preliminares, la evaluación de estudios, la extracción de datos y el análisis. La preselección de referencias es una de las fases más laboriosas, lentas y propensas a errores. Aunque la IA tiene el potencial de simplificar el SLR, los problemas de compatibilidad, transparencia y fiabilidad dificultan su adopción. A pesar de que la bibliografía se actualiza a diario, sigue siendo difícil resumirla y tomar decisiones sobre su aplicación.ObjetivoEvaluar las pruebas disponibles que apoyan el uso de la inteligencia artificial para la preselección de referencias de la revisión sistemática de la literatura.MétodosRevisión de alcance siguiendo la metodología de Johanna Briggs en busca de la naturaleza y extensión de la evidencia que realce el uso de modelos algorítmicos basados en IA para la selección preliminar de referencias en SLR. El cribado, la selección y la extracción se realizaron por duplicado. Se intenta cubrir el modelo más comúnmente reportado, las métricas de rendimiento, la validez externa y la accesibilidad. También se incluyen las características de la tecnología de IA y las que facilitan su adopción e implementación. Solo se incluyeron artículos publicados después de 2019. Los resultados se presentan en forma de descripción narrativa y se utilizan tablas y figuras. Un diagrama de flujo de decisiones mostró el número de referencias y artículos que se recuperaron, eliminaron o incluyeron en el análisis final.ResultadosTras eliminar los duplicados, se identificaron 9652 citas a partir de la búsqueda en bases de datos electrónicas. Basándonos en el título y el resumen, excluimos 9527, dejando 113 artículos de texto completo para evaluar su elegibilidad. Los principales países de afiliación del autor correspondiente, en orden descendente, fueron EE.UU., Canadá y el Reino Unido. Aproximadamente el 80percent-flag-change de los modelos de algoritmos comunicados se basaban en el aprendizaje automático (AM), seguido del procesamiento del lenguaje natural (PLN). Casi el 40percent-flag-change de los modelos ML se sometieron a validación externa. No se propusieron estrategias adicionales para facilitar la adopción o aplicación de modelos algorítmicos de clasificación. ConclusionesResumimos los conocimientos sobre modelos algorítmicos para la clasificación de referencias durante la fase de cribado de las revisiones sistemáticas de la literatura (RSL). La mayor parte de la literatura reciente se centra en el ML, mientras que la validación externa sigue siendo una práctica poco frecuente. No se identificaron marcos específicos para promover la adopción e implementación de estos modelos.
BackgroundArtificial intelligence (AI) enables the automation of systematic literature reviews (SLR) as proposed by various international collaborations. High-quality SLR adhere to strict phases to address a structured question, search terms selection, literature search, preliminary references screening, study assessment, data extraction, and analysis. The pre-selection of references is one of the most labor-intensive, time-consuming, and error-prone phases. Although AI has the potential to simplify SLR, issues of compatibility, transparency, and trustworthiness hinder its adoption. Despite daily literature updates, summarizing and making implementation decisions remains a challenge. ObjectiveTo assess the available evidence supporting the use of artificial intelligence for systematic literature review reference pre-selection.MethodsScoping review following the Johanna Briggs methodology looking for the nature and extention of the evidence that enhances the use of AI-based algorithmic models for preliminary reference selection in SLR. Screening, selection and extraction were performed in duplicate. We attempt to cover the most commonly reported model, performance metrics, external validity and accesibility. It also includes characteristics of the AI technology and those that facilitate its adoption and implementation. Only articles published after 2019 were included. The results are presented as narrative description and tables and figures are used. A decision flowchart displayed the number of references and articles that were retrieved, eliminated, or included in the final analysis.ResultsAfter removing duplicates, we identified 9652 citations from the electronic database search. Based on the title and abstract, we excluded 9527, leaving 113 full-text articles to be assessed for eligibility. The leading countries of corresponding author affiliation, in descending order, were the USA, Canada, and the United Kingdom. Approximately 80percent-flag-change of the reported algorithm models were based on machine learning (ML), followed by natural language processing (NLP). Almost 40percent-flag-change of the ML models underwent external validation. No additional strategies were proposed to facilitate the adoption or implementation of algorithmic classifier models. ConclusionsWe summarized knowledge on algorithmic models for reference classification during the screening phase of systematic literature reviews (SLRs). Most recent literature focuses on ML, while external validation remains an unfrequently practice. No specific frameworks were identified to promote the adoption and implementation of these models.