ISSN2953-6367 Enero2026 http://revistainvestigo.com Vol.7No,18,PP.89-108 https://doi.org/10.56519/1pmhqw10 RevistaCientíficaMultidisciplinariaInvestiGoRiobamba–EcuadorCel:+593979119620revisinvestigo@gmail.com 99 REPRODUCIBILIDADCIENTÍFICAENLAERADIGITAL:PROPUESTAMETODOLÓGICAPARAAUDITORÍADEDATOSYANÁLISISREPLICABLESSCIENTIFICREPRODUCIBILITYINTHEDIGITALAGE:METHODOLOGICALPROPOSALFORDATAAUDITINGANDREPLICABLEANALYSISGeorginaEstherCarmilemaYungan1,DavidEstebanPuyolGuevara2,MariaGabrielaAriasGarnica3{georgina.carmilema@espoch.edu.ec1,david.puyol@espoch.edu.ec2,mariag.arias@espoch.edu.ec3}Fechaderecepción:10/12/2025/Fechadeaceptación:03/12/2025/Fechadepublicación:06/04/2026RESUMEN:Lareproducibilidadcientíficaesunelementofundamentaldelmétodocientíficoquepropicialaverificaciónindependientedelosresultados.Sinembargo,lacrecientecomplejidaddelosdatos,elanálisisyelsoftwareenlaeradigitalhanconvertidoladenominada"crisisdereproducibilidad",enunapreocupanterealidad.Dehecho,losestudiosdemuestranqueunaaltacuotadelosresultadoscientíficospublicados,enparticularenbiomedicinaycienciadedatos,resultadifícildereproducir,loqueerosionalaconfianzapública.Lafaltadedocumentaciónexplícitadelsoftware,lafaltadedisponibilidaddelosdatosprimariosylaambigüedadenlaredaccióndelcódigodeanálisissonfactoresque,enlaactualidad,sontodosdeterminantesenelproblema.Enestasituación,lanecesidaddeunmarcocomúnyuniversalparalaauditoríadetrabajosdeinvestigaciónsehaceacuciante,surgiendoasílacienciaabiertacomounaopciónposible.Enesteartículosepresentaunmarcocomúnyauditableparamejorarlareproducibilidadapartirdelaunióndeprácticasdereporteyprincipiosparalaauditoríadelosdatosycontenedoresdesoftware(DockeroSingularity,porejemplo).Elenfoqueseapoyaenunarevisiónsistemáticadelaliteraturadesdeelaño2002al2021paraevidenciarunprocesoquegaranticelaintegridaddelosdatosylatrazabilidaddelanálisis.Paraterminar,seconcluyequeunmarcobasadoendatoslimpiosyentornosvirtualizadosmejorabastantelareproducibilidad,favoreciendolaconfianzaylacooperaciónentrecientíficos. 1 EscuelaSuperiorPolitécnicadeChimborazo,FacultaddeCienciasPecuarias,EscueladeAgroindustriasyVeterinaria,RiobambaEcuador,https://orcid.org/0009-0002-3022-6775. 2 IngenieroAmbiental,UniversidadNacionaldeChimborazo,MagisterenGestiónAmbientalmenciónsostenibilidad,Universidaddeloshemisferios,TécnicoDocenteenlaEscuelaSuperiorPolitécnicadelChimborazo–Ecuador,https://orcid.org/0009-0001-9467-9637,593996321827 3 EscuelaSuperiorPolitécnicadeChimborazo(ESPOCH),https://orcid.org/0009-0002-2535-9776.
REPRODUCIBILIDADCIENTÍFICAENLAERADIGITAL:PROPUESTAMETODOLÓGICAPARAAUDITORÍADEDATOSYANÁLISISREPLICABLES 100 Palabrasclave:Reproducibilidad,auditoríadedatos,software,cienciaabiertaABSTRACT:Scientificreproducibilityisafundamentalelementofthescientificmethodthatpromotesindependentverificationofresults.However,thegrowingcomplexityofdata,analysis,andsoftwareinthedigitalagehasmadetheso-called“reproducibilitycrisis”aworryingreality.Infact,studiesshowthatahighproportionofpublishedscientificresults,particularlyinbiomedicineanddatascience,aredifficulttoreproduce,whicherodespublicconfidence.Thelackofexplicitsoftwaredocumentation,theunavailabilityofprimarydata,andambiguityinthewordingoftheanalysiscodeareallfactorsthatcurrentlycontributetotheproblem.Inthissituation,theneedforacommonanduniversalframeworkforauditingresearchworkbecomespressing,withopenscienceemergingasapossibleoption.Thisarticlepresentsacommonandauditableframeworkforimprovingreproducibilitybycombiningreportingpracticesandprinciplesforauditingdataandsoftwarecontainers(DockerorSingularity,forexample).Theapproachisbasedonasystematicreviewoftheliteraturefrom2002to2021todemonstrateaprocessthatguaranteesdataintegrityandanalysistraceability.Finally,itisconcludedthataframeworkbasedoncleandataandvirtualizedenvironmentsgreatlyimprovesreproducibility,promotingtrustandcooperationamongscientists.Keywords:Reproducibility,dataauditing,software,openscienceINTRODUCCIÓNLaciencianoesmásquelaadquisicióngradualdeconocimientoverificable.Precisamenteparaestepropósito,lareproducibilidadnoessimplementeunideal,sinoqueestáenelcentrodeestavalidación,queeslacapacidaddeuninvestigador,alusarlosmismosdatosdeentradayelmismocódigodeanálisisqueelestudiooriginal,deproducirresultadosidénticososignificativamentesimilares(1),(2).Peroenlasúltimasdosdécadashemospasadoporuncambiosísmico.EnelcontextodedesarrollostanaceleradosenBigData,AprendizajeAutomáticoyestadísticascomputacionales,lacomplejidaddelastareasanalíticashacrecidoexponencialmente,perotrágicamente,estohallevadoaunacrisisbienreconocidaqueponeenriesgolavalidezdelcorpuscientíficomoderno:latemidacrisisdereproducibilidad(3),(4).Paracaptarlaesenciadelasunto,debemosserfácticos.Todoshemosvistolamagnituddeesteproblemacubiertoenestudiosagranescala.Porejemplo,enestudiospreclínicos,Amgenutilizóunanálisisexhaustivodedatosyconcluyóquesoloel11%de53hallazgosfundamentalesreportadosenoncologíayhematologíapuedenserreproducidos(5).Enlamismalínea,untrabajoclaveenpsicologíaseñalóquemenosdelamitadde100estudiospublicadosenrevistasimportantespudieronserreplicados(6).Elproblemanoessoloparalabiomedicinaolapsicología,sinotambiénparalaneurociencia(7)ylacienciadedatos(8).Elproblemaes,portanto,multifactorial:faltadereportedemétodos,métodosestadísticoscuestionables,asícomolaincapacidaddeaccederacontenidoimportante(9),(10).Ahora,enelmundodehoy,yenlaeradigitalenparticular,laincapacidaddereproducirestáligadaalusodeactivosdigitales:datosenbruto,asícomocódigodeanálisis.Losinvestigadores
REPRODUCIBILIDADCIENTÍFICAENLAERADIGITAL:PROPUESTAMETODOLÓGICAPARAAUDITORÍADEDATOSYANÁLISISREPLICABLES 101 frecuentementeoperanconflujosdetrabajocomplejosquedependendeversionesespecíficasdesoftware,bibliotecasysistemasoperativos.Silosentornosnosealmacenan,publicanoempaquetancompletamente,elmismocódigomástardefallaráoresultaráenresultadosmenosdeseables,unadinámicaconocidacomoderivadedependencia(11).Porlotanto,comoGarijoyGilafirmancorrectamente,publicarsolocódigoestáticoyanoessuficiente,sinoqueserequiereunenfoquerigurosoparaasegurarsedequeelentornodeejecuciónseareplicabley,másimportanteaún,auditable(12),(13).Estafaltadereproducibilidadtieneimplicacionesquevanmásalládelaacademia.Desdeunaperspectivaeconómica,sepierdenmilesdemillonesdedólaresporañoeninvestigaciónirrecuperable(14).Tambiénhayunadimensiónmoral,dondelaconfianzaenlacienciaseerosionaylaspolíticasbasadasenevidenciadébilcorrenelriesgodetenerunimpactonegativo.Finalmente,desdelaperspectivacientífica,elconocimientofuturosevesocavadosisubasedefundamentospareceinadecuada(15).Porlotanto,noesfactible,peroesmuyimportantepresentarunaauditoríadedatosyunametodologíadeanálisisreplicable,queasuvezpuedasalvaguardarlaintegridaddelainvestigaciónycontribuiralavancedelconocimiento(16).Basadoenlaliteratura,elpropósitodeesteartículoderevisiónesproponerydefinirunenfoqueestandarizadoparalaauditoríadedatosyelanálisisreplicablecomounaformadecrearunprotocolobasadoenpasosquemejorelareproducibilidadenescenariosdecomplejidadcomputacional.MATERIALESYMÉTODOSComopropuestadedesarrollo,seleccionamoslossiguientesmétodosrigurosos.Elestudiosedescribecomounainvestigaciónbibliográficaqueinvolucraunestudiobibliográficorevisiónsistemáticaqueeselmétodocualitativo-descriptivo.Elobjetivofinalfuesintetizardatosqueconduzcanaunmarcometodológicobienorganizado.Nuestrapoblacióndeestudioincluyótodoslosdocumentospublicadossobrereproducibilidad,cienciaabierta,auditoríadedatosyanálisisreplicable.Noobstante,nuestramuestraselimitóarevistascientíficasrevisadasporparesyaltamenteindexadas(WebofScience,Scopus,PubMed)porsurelevanciaycalidad,yrespuestasmetodológicasquepudieranreproducirseenentornoscomputacionales.Aligualqueotrostiposdeinvestigacionesdeestetipo,nuestroentornodeinvestigaciónfuecompletamentevirtual,centrándoseenlarecopilaciónestratégicadeinformacióndelasbasesdedatosmásútilesenlaliteraturacientífica.Enesteestudioderevisión,enlugardecálculosyanálisisestadísticostradicionales,noscentramosenunprocesomuymetódicodesíntesiscualitativadelaevidencia.Paraasegurarlafiabilidad,lacalidadmetodológicadecadaestudioseleccionadosemidióutilizandoherramientasestándardesdeelaño2002al2021(esdecir,versionesmodificadasdeAMSTARparacontextosderevisión).Luegoutilizamosunanálisistemáticometodológicoparaidentificarproblemascomunesclave(esdecir,paradatos,códigoyentorno)ypropusimossolucionesparaalinearlosintuitivamenteennuestrapropuestametodológicafinal.
REPRODUCIBILIDADCIENTÍFICAENLAERADIGITAL:PROPUESTAMETODOLÓGICAPARAAUDITORÍADEDATOSYANÁLISISREPLICABLES 102 Paraasegurarlatransparenciaylareplicabilidadenlametodología,empleamoselmarcoPRISMA(ElementosdeInformePreferidosparaRevisionesSistemáticasyMeta-Análisis)paralaplanificación,ejecucióneinformesennuestrarevisiónsistemática.Deestamanera,laseleccióndeliteraturaporpartedenuestroscolegasesrigurosaycubrelasetapasmásimportantesdeselección,identificación,elegibilidadeinclusión.Tabla1.Metodologíaderevisiónsistemáticaypropuesta(adaptaciónPRISMA). Fase Tareaespecífica Instrumentos/herramientas Objetivodelafase Planificación FormulacióndelapreguntaPICOyprotocolodebúsqueda. Protocoloderevisión. Definirelalcanceylaestrategiadelabúsqueda. BúsquedaySelección Búsquedaexhaustivaenbasesdedatos(WoS,Scopus,PubMed).CriteriosdeInclusión/Exclusión. Cadenasdebúsquedabooleanas(ej."ReproducibilityANDDataAuditANDContainers").DeclaraciónPRISMA(DiagramadeFlujo). Identificarlaliteraturarelevanteymitigarelsesgodeselección. EvaluaciónyExtracción Evaluacióndelacalidadmetodológica(RiesgodeSesgo).Extraccióndedatossobredesafíosysoluciones. Herramientasdeevaluacióndecalidadadaptadas(ej.AMSTAR).Matrizdeextraccióndedatos. Sintetizarhallazgosclaveyasegurarlasolidezdelaevidencia. SíntesisyPropuesta Análisistemáticodelasmejoresprácticasyframeworks.DesarrollodelProtocolodeAuditoríayReplicación(PAR). Síntesisnarrativaycualitativa.Análisiscomparativodeframeworksdereproducibilidad. Generarelmarcometodológicopropuestoparaauditoríayreplicación. Unanálisisconcluyentedirigidoaidentificarlosaspectostípicosdefalladelareproducibilidad(porejemplo,faltadedatosdisponibles,códigoobsoleto,entornonoespecificado)e,importantemente,aspectosdeéxito(porejemplo,usodecontenedores,cuadernosejecutables(JupyteroRMarkdown)asícomoelkitdeherramientasderegistro(OSF).Así,lapropuestametodológicasebasaenlaalineaciónyarmonizacióndeestasmejoresprácticasquehansidoidentificadasenlaliteraturacientíficadealtoimpacto.RESULTADOSAdemás,elanálisissistemáticoylarevisióndelaliteraturanosoloconfirmanelproblemadelacrisisdereproducibilidad,sinotambiénunconsensoimportanteentrelacomunidadcientíficasobrecómoresolverelproblema.Esteconsenso,queactúacomounahojaderuta,seexpresaenlossiguientestrespilaresparagarantizarlareproducibilidadcomputacional:Datos,CódigoyEntorno(19,20).Esdecir,cuandounodeestoselementosnoestáestandarizadoentodoelproyecto,elproblemasedesmorona:lafaltadeestandarizacióndebeconsiderarselarupturamásimportanteenlacadenadeinvestigaciónparaunasolución(21).Estructuradelprotocolodeauditoríayreplicación(PAR)Dadoqueestasyotrasevidenciasrelacionadassehancombinadodemanerasistemáticayparaofreceralgunasherramientasprácticas,hemosdesarrolladounmodelodetrabajoyoperativo
REPRODUCIBILIDADCIENTÍFICAENLAERADIGITAL:PROPUESTAMETODOLÓGICAPARAAUDITORÍADEDATOSYANÁLISISREPLICABLES 103 conocidocomoelProtocolodeAuditoríayReplicación(PAR).Dadaladiversidaddediferentesproyectos,esteprotocoloseformulacomounahojaderutaprogresivaparainvestigadoresyauditoresentresniveles:básico,intermedioyavanzado(elestándardeoroenlaprácticadelacienciaabierta).Tabla2.EstructuraprogresivadelprotocoloPAR. Niveldecumplimiento Datos(auditoríaeintegridad) Código(trazabilidad) Entorno(replicabilidad) Básico(transparenciamínima) Disponibilidaddedatoslimpios(anonimizadosyprocesados) Códigodeanálisispublicadoycomentado Especificaciónmanualsimpledesoftwareyversionesclave Intermedio(mejorpráctica) Disponibilidaddedatossinprocesarymetadatosdetallados.UsoderepositoriobajoprincipiosFAIR(Findable,Accessible) Códigoenrepositorioconcontroldeversiones(ej.Git/GitHub).UsodeNotebooksejecutables(RMarkdown,Jupyter) Archivoderequerimientosdeentorno(18),(19) Avanzado(estándardeoro) Auditoríacompletaconverificacióndeintegridad(checksumsMD5/SHA256).PublicaciónenDataCommonsoplataformaconDOI Revisiónporparesdelcódigo(CodeReview).Documentacióndeflujosdetrabajo(ej.Snakemake,Nextflow)paraautomatización Empaquetamientocompletoencontenedores(Docker/Singularity)paraejecucióninmediataydeterminística(22,23) LaTabla2,quecontieneelprotocolodeauditoríayreplicación(PAR)quesehapresentado,seplanteacomounahojadetrabajodeunasucesiónordenadadepasosquevagarantizandolaintegridaddelosdatosylatrazabilidaddelanálisis.Searticulaapartirdelastresbasespilarquesehandescritoenestacontribución,quesonDatos,CódigoyEntorno.EstaesunaestructuraquevadelnivelBásicodetransparenciamínimaqueúnicamentetrataladisponibilidaddedatoslimpiosycódigoconcomentarioshaciaelnivelIntermedioqueintegralosprincipiosFAIRyelcontroldeversionesderepositorioscomoGitHub.Sinembargo,elverdaderonúcleodelapropuestaesprecisamentesunivelAvanzadoyqueeseloroestándardelacienciaabierta,queyanoselimitaalameradocumentación,sinoqueexigeauditoríasdelaintegridadmediantesumasdeverificación(checksums)yelempaquetadocompletoencontenedorescomoDockeroSingularity.Precisamenteporello,esteprotocologarantizaunareplicabilidaddeterminísticaeinmutablequepermiteejecutarelanálisisdemaneraidénticaindependientementedelsistemaoperativoydasoluciónaladerivadedependencias.
REPRODUCIBILIDADCIENTÍFICAENLAERADIGITAL:PROPUESTAMETODOLÓGICAPARAAUDITORÍADEDATOSYANÁLISISREPLICABLES 104 Figura1.RelacióninversaentreelniveldecumplimientodelprotocoloPARyelesfuerzorequeridoporelreplicador.AlobservarlaFigura1encombinación,latendenciadedesarrolloesclara.Asípodemosverelavancedesdealgunasprácticasmínimasdetransparencia(NivelBásico)hastaprácticamenteunagarantíadereplicabilidad.Enestesentido,esimportanteenfatizarquenuestroNivelAvanzadosubyaceennuestraofertadealtoimpacto.Estenivelessignificativoyaquetambiénimplicaunaauditoríacompletadedatosytecnologíadecontenedores,abordandoelproblemadesdeambasperspectivasprimarias.Enesteproceso,semuestraclaramentequeloscontenedoresproporcionaránunasoluciónaunapeligrosaderivadedependencias(24).Estosserealizandemaneraeleganteyaqueloscontenedoresencapsulanelcódigo,losdatosytodaslasdependenciasdesoftwareenunaimagenejecutableinmutable.Esteprocesogarantizaráquecualquierauditorocolega,independientementedesusistemaoperativo,puedarealizarelmismoanálisiscomoantesparalograrlareplicabilidaddeterministadeseada(25).Porúltimo,lapartedeauditoríadedatos,queutilizasumasdeverificaciónparacorroborarquelosdatosnohansidoalterados(26),eslarespuestalógicaalaintegridaddelosdatosylasposiblespreocupacionesdealteracióndelconjuntodedatosfuente.Enresumen,elNivelAvanzadoconviertelasimpleintencióndetransparenciaenunagarantíatécnicadelareplicabilidaddelsistema.
REPRODUCIBILIDADCIENTÍFICAENLAERADIGITAL:PROPUESTAMETODOLÓGICAPARAAUDITORÍADEDATOSYANÁLISISREPLICABLES 105 Tabla3.ComparacióndelprotocoloPAR(nivelavanzado)conframeworksexistentes. Característicaclave PropuestaPAR(avanzado) IniciativaTOP Openscienceframework(OSF) Archivosdereproducibilidad Garantíadelentorno Contenedores(Docker/Singularity) Opcional/Requerimientos Repositoriodecódigoydatos Listadedependencias Auditoríadedatos VerificacióndeIntegridad(Checksums) Solodisponibilidadyacceso Almacenamientoconversioning Documentacióndelafuente Trazabilidaddelanálisis Flujosdetrabajoautomatizados(Snakemake) Documentacióndelmétodo Registrodeproyectos Descripciónnarrativa Objetivoprincipal ReplicabilidadDeterminística TransparenciayApertura Compartirypre-registrar Almacenamientodematerial LaTabla3demuestraquenuestrapropuestanosolocumpleconloscriteriosdetransparencia(queeselpuntofocaldeiniciativascomoTOP),sinoquetambiénsatisfacelosrequisitostécnicosdealtonivel.Sobretodo,unrequisitoobligatoriodecontenedordesoftwareenelnivelAvanzadoaseguraqueelentornooperativonoseconviertaenunpuntodefallo,locualfrecuentementeseconsideraunlímiteenlosmarcosquesoloenumerandependencias(11).Además,esimportanteseñalarqueelNivelAvanzadoconstituyeelnúcleodenuestrapropuestadealtoimpacto,necesitandounaauditoríacompletadedatoscomplementadacontecnologíadecontenedores,abordandoelproblemadesdeambasperspectivas.Paraello,loscontenedores(24)proporcionanunasoluciónalpeligrosoproblemadela"derivadedependencias".Seutilizancomounasoluciónpoderosayeleganteaesto,demanerasencilla,yaqueencapsulanelcódigo,losdatosytodaslasdependenciasdesoftwareenunaimagenejecutableinmutable.Graciasaestemecanismo,cualquierauditorocolega,independientementedelsistemaoperativo,puederealizarelanálisisexactamentecomosehizo,lograndoasíunareplicabilidaddeterminista(25).Porúltimo,lapartedeauditoríadedatosenlaqueserealizansumasdeverificacióndelosdatosparademostrarquenohansidomodificados(26)eslasolucióndirectacontraunacuestióndeintegridadymanipulacióndelconjuntodedatosoriginal.Enconclusión,elNivelAvanzadodelProtocoloPARconviertelatransparenciabásicadelprocesoenunagarantíatécnicadereplicabilidad.DISCUSIÓNBasándonosenlaestructuraanterior,aquípresentamoselProtocolodeAuditoríayReplicación(PAR)sugerido,quenospermiteabordarladistincióncríticaentrereplicabilidad(mismosdatos,mismosmétodos)yreproducibilidad(encontrarpatronessimilaresennuevosdatos/métodos)(8).Nuestromarcoenfatizalareplicabilidadcomolabasetécnicafundamentalparacualquierprogresocientíficocoherente,dehecho.ElénfasisenlaauditoríadedatosylaintegridadporpartedePAR,particularmenteenelcontextodesuambiciosoNivelAvanzado,estáestrechamentevinculadoalosmarcosdela
REPRODUCIBILIDADCIENTÍFICAENLAERADIGITAL:PROPUESTAMETODOLÓGICAPARAAUDITORÍADEDATOSYANÁLISISREPLICABLES 106 IniciativadeTransparenciayApertura(TOP)(6).Peronuestrapropuestapretendeirunpasomásallá,intencionalmente.AdiferenciadelainiciativaTOP,queenfatizalatransparenciadeladocumentación,PARincluyeunaverificacióntécnicadirectadelaintegridadatravésdesumasdeverificaciónypublicaciónbajoprincipiosFAIR.Estaverificaciónescrítica,porqueaseguralainalterabilidaddeunconjuntodedatosdesdeelmomentodelarecolecciónhastalapublicación,unaprácticadegranimportanciapropuestaporlaNubeEuropeadeCienciaAbiertaoorganizacionessimilares(7).Aunquelaliteraturaprevia(13)propusolacreaciónde"archivosdereproducibilidad",elconceptoesmuysimple.Estafueunanocióninicial,peronuestrométodosebasaenellaempleandotecnologíatangible(comocontenedores)parareplicarautomáticaymasivamentelosdatosdemuchasmanerasdiferentes.Omásbiendeunalistademateriales,aunentornodinámicoyejecutablequedisminuyelanecesidadylacomplejidaddelainstalaciónmanual.ElprincipalhallazgorespaldadoporelNivelAvanzadoeselempaquetadoobligatorioconcontenedores(Docker/Singularity).Estotieneprofundasimplicaciones.ComoBoettigerdemostrótanbienensuclásico(9),lavirtualizaciónreduceengranmedidaelesfuerzodereplicación.Así,nuestraFigura1noesunmeroproductodelaimaginación,sinoquerepresentacómoloscostosdetransparenciasetrasladandelreplicadoralinvestigadororiginalyseconviertenenunaventajanetaparalaciencia.Además,lareplicabilidaddeterministaselograestableciendounentornoinmutable(25).Enotraspalabras,esposiblerealizarelanálisisbajoexactamentelasmismascircunstanciasbitabitinclusoañosdespués,eliminandoasílaformaimprecisaqueresultaenmarcosmenosestrictosquepermanecen.Reutilizaciónycolaboraciónfinalmente,necesitamosenfocarnosenlarelacióndePARconlosdatosreutilizables.AldarprioridadalformatoFAIR(Localizable,Accesible,Interoperable,Reutilizable),nuestroprotocolosiguelasdemandasesperadasdelasprincipalesinstitucionesdefinanciamientoylacomunidaddecienciadedatos(12).Así,losestudiosproducidosenelNivelAvanzadonosolosonverificables,sinoqueseconviertenenactivosdigitalesdealtacalidadparaserincorporadosenmeta-análisisagranescalaoanálisissecundarios.Asuvez,laestructuraprogresivadePAR(Básico,Intermedio,Avanzado)actúacomounaherramientapedagógicaqueapoyaestasprácticasavanzadasdeformapráctica.Además,desglosarlabarreradeentradaqueimpidealosjóvenesinvestigadoresparticiparenelmovimientodecienciaabiertapuedefacilitarlo(16).ElobjetivogeneraldePARnoessololaintegridad,sinolamáximautilidaddelconocimientocientíficoproducidoenunaeraenlaquetodossemuevenatravésdelmundodelosmediosenlínea.CONCLUSIONESNecesidaddeunestándartécnico(paravanzado)seconcluyequeelProtocolodeAuditoríayReplicación(PAR),específicamenteensuNivelAvanzado,noessolounaopción,sinounanecesidad.Estoescrucialporquealrequerirlaauditoríacompletadedatosyelusodecontenedoresdesoftware(Docker/Singularity),finalmenteseestableceelestándartécnicoque
REPRODUCIBILIDADCIENTÍFICAENLAERADIGITAL:PROPUESTAMETODOLÓGICAPARAAUDITORÍADEDATOSYANÁLISISREPLICABLES 107 garantizalareplicabilidaddeterministaenentornoscomputacionales,superandoprácticasbasadasúnicamenteendocumentación.Laresoluciónaldesplazamientodedependencias:Laintroduccióndelatecnologíadecontenedoresenelflujodetrabajodepublicaciónpareceserlamejoropción.Esuncontrapesoal“desplazamientodedependencias”,eltalóndeAquilesdelainvestigacióndigital.Estogarantizaqueelentornodeejecuciónseainmutableyqueestaimportantecausatécnicadenoreproducibilidadseresuelva;así,serestauralaconfianzaenelanálisisderesultados.Dobleimpacto:integridadymáximautilidad.HayunadobleventajaenlaaplicaciónformaldePAR.Estonosolopuedemantenerlaintegridadytrazabilidaddelainvestigación,sinotambiénoptimizarelimpactodelconocimiento.Conesto,alestablecerlapublicacióndedatosycódigosreplicablesbajolosprincipiosFAIR,elprotocoloconviertelosresultadoscientíficamentereplicablesenactivosdigitalesdealtovalorqueestándisponiblesparasureutilizaciónycolaboracióncientíficaagranescala.REFERENCIASBIBLIOGRÁFICAS1.PlesserH.Reproducibilityversusreplicability:abriefhistoryofaconfusedterminology.FrontNeuroinform.2017;11–76.2.NationalAcademiesofSciences.Engineering,andMedicine.ReproducibilityandReplicabilityinScienceWashington,DC.TheNationalAcademiesPress.2019;3.BakerM.1,500scientistsliftthelidonreproducibility.Nature.2016;04(76):452–4.4.OpenshawS,OpenshawC.Thereproducibilitycrisisinscience:astatisticalperspective.PLoSComputBiol.2020;11(16):e1008321.5.BegleyC,EllisL.Drugdevelopment:Raisestandardsforpreclinicalcancerresearch.Nature.2012;7391(483):531–3.6.OpenScienceCollaboration.Estimatingthereproducibilityofpsychologicalscience.Science(1979).2015;6251(249):16–47.7.EklundA,NicholsT,KnutssonH.Clusterfailure:WhyfMRIinferencesforspatialextentareinvalid.ProcNatlAcadSciUSA.2016;28(113):7900–5.8.GoodmanS,FanelliD,IoannidisJ.Whatdoesreproducibilitymean?Science(1979).2016;6360(356):1021–2.9.BoettigerC.Anintroductiontodockerforreproducibleresearch.PLoSOne.2015;1(10):e0100373.10.IoannidisJ.Whyscienceisnotself-correcting.PerspectPsycholSci.2012;6(7):645–54.11.SandveG,NekrutenkoA,TaylorJ.Tensimplerulesforreproduciblecomputationalresearch.PLoSComputBiol.2013;10(9):100–3285.12.FosterI,StoddenV,WhiteJ.Adatacommonsforreproduciblescience.NatBiotechnol.2017;12(35):1111–2.13.StoddenV,MeraliZ.Empoweringreproducibleresearch.Science(1979).2017;6309(354):253–4.
REPRODUCIBILIDADCIENTÍFICAENLAERADIGITAL:PROPUESTAMETODOLÓGICAPARAAUDITORÍADEDATOSYANÁLISISREPLICABLES 108 14.FreedmanL,CockburnI,SimcoeT.Theeconomicsofreproducibility.PLoSBiol.2015;6(13):e1002165.15.ResnikD.Reproducibilityandresearchintegrity.AccountRes.2018;2(25):119–31.16.BarbaL.Thereproducibleresearchmovement.ComputSciEng.2018;2(20):9–17.17.BoothA,SuttonA,PapaioannouD.SystematicApproachestoaSuccessfulLiteratureReview.2nded.LosAngeles:SAGEPublications.2016;18.SheaB,GrimshawJ,WellsG.DevelopmentofAMSTAR:ameasurementtooltoassessthemethodologicalqualityofsystematicreviews.BMCMedResMethodol.2007;7–10.19.PageM,McKenzieJ,BossuytP.ThePRISMA2020statement:anupdatedguidelineforreportingsystematicreviews.BMJ.2021;(372):71.20.PerkelJ.Howtopublishcodeanddatatoboostreproducibility.Nature.2020;586(7829):463–4.21.PicardJ,BoettigerC,O’BoyleC.Beyondopendataandcode:Aframeworkforreproducibleresearchenvironmentspecifications.JOpenResSoftw.2021;1(9):1.22.DiTommasoP,MorettiS,HalsteadM.ContainersandReproducibleResearch.ACMComputSurv.2020;1(53):18:1-24.23.GarijoD,GilY.Reproducibilityindatascience.CommunACM.2020;7(63):108–17.24.O’BoyleC,BoettigerC,MeraliZ.Containerizingyourresearch:Abestpracticeforreproducibledataanalysis.JOpenSourceSoftw.2020;5(50):21–49.25.GorgolewskiK,MarguliesD,CastellanosF.Areproducibleresearchworkflowforneuroimaging:TheReproNimproject.Neuroimage.2020;(211):116–584.26.NationalInstituteofStandardsandTechnology.SP800-32:IntroductiontoComputerSecurity.Gaithersburg,MD:NIST.2002;