ISSN2953-6367
Enero2026
http://revistainvestigo.com
Vol.7No,18,PP.89-108
https://doi.org/10.56519/1pmhqw10
RevistaCientíficaMultidisciplinariaInvestiGo
Riobamba–Ecuador
Cel:+593979119620
revisinvestigo@gmail.com
99
REPRODUCIBILIDADCIENTÍFICAENLAERADIGITAL:
PROPUESTAMETODOLÓGICAPARAAUDITORÍADEDATOSY
ANÁLISISREPLICABLES
SCIENTIFICREPRODUCIBILITYINTHEDIGITALAGE:
METHODOLOGICALPROPOSALFORDATAAUDITINGAND
REPLICABLEANALYSIS
GeorginaEstherCarmilemaYungan
1
,DavidEstebanPuyolGuevara
2
,MariaGabrielaArias
Garnica
3
{georgina.carmilema@espoch.edu.ec
1
,david.puyol@espoch.edu.ec
2
,mariag.arias@espoch.edu.ec
3
}
Fechaderecepción:10/12/2025/Fechadeaceptación:03/12/2025/Fechadepublicación:06/04/2026
RESUMEN:
Lareproducibilidadcientíficaesunelementofundamentaldelmétodocientífico
quepropicialaverificaciónindependientedelosresultados.Sinembargo,lacreciente
complejidaddelosdatos,elanálisisyelsoftwareenlaeradigitalhanconvertidola
denominada"crisisdereproducibilidad",enunapreocupanterealidad.Dehecho,losestudios
demuestranqueunaaltacuotadelosresultadoscientíficospublicados,enparticularen
biomedicinaycienciadedatos,resultadifícildereproducir,loqueerosionalaconfianza
pública.Lafaltadedocumentaciónexplícitadelsoftware,lafaltadedisponibilidaddelos
datosprimariosylaambigüedadenlaredaccióndelcódigodeanálisissonfactoresque,enla
actualidad,sontodosdeterminantesenelproblema.Enestasituación,lanecesidaddeun
marcocomúnyuniversalparalaauditoríadetrabajosdeinvestigaciónsehaceacuciante,
surgiendoasílacienciaabiertacomounaopciónposible.Enesteartículosepresentaun
marcocomúnyauditableparamejorarlareproducibilidadapartirdelaunióndeprácticasde
reporteyprincipiosparalaauditoríadelosdatosycontenedoresdesoftware(Dockero
Singularity,porejemplo).Elenfoqueseapoyaenunarevisiónsistemáticadelaliteratura
desdeelaño2002al2021paraevidenciarunprocesoquegaranticelaintegridaddelosdatos
ylatrazabilidaddelanálisis.Paraterminar,seconcluyequeunmarcobasadoendatoslimpios
yentornosvirtualizadosmejorabastantelareproducibilidad,favoreciendolaconfianzayla
cooperaciónentrecientíficos.
1
EscuelaSuperiorPolitécnicadeChimborazo,FacultaddeCienciasPecuarias,EscueladeAgroindustriasyVeterinaria,Riobamba
Ecuador,https://orcid.org/0009-0002-3022-6775.
2
IngenieroAmbiental,UniversidadNacionaldeChimborazo,
MagisterenGestiónAmbientalmenciónsostenibilidad,Universidaddeloshemisferios,TécnicoDocenteenlaEscuelaSuperior
PolitécnicadelChimborazo–Ecuador,https://orcid.org/0009-0001-9467-9637,593996321827
3
EscuelaSuperiorPolitécnicadeChimborazo(ESPOCH),https://orcid.org/0009-0002-2535-9776.
REPRODUCIBILIDADCIENTÍFICAENLAERADIGITAL:PROPUESTAMETODOLÓGICAPARAAUDITORÍADEDATOSYANÁLISIS
REPLICABLES
100
Palabrasclave:Reproducibilidad,auditoríadedatos,software,cienciaabierta
ABSTRACT:
Scientificreproducibilityisafundamentalelementofthescientificmethodthat
promotesindependentverificationofresults.However,thegrowingcomplexityofdata,
analysis,andsoftwareinthedigitalagehasmadetheso-called“reproducibilitycrisis”a
worryingreality.Infact,studiesshowthatahighproportionofpublishedscientificresults,
particularlyinbiomedicineanddatascience,aredifficulttoreproduce,whicherodespublic
confidence.Thelackofexplicitsoftwaredocumentation,theunavailabilityofprimarydata,
andambiguityinthewordingoftheanalysiscodeareallfactorsthatcurrentlycontributeto
theproblem.Inthissituation,theneedforacommonanduniversalframeworkforauditing
researchworkbecomespressing,withopenscienceemergingasapossibleoption.Thisarticle
presentsacommonandauditableframeworkforimprovingreproducibilitybycombining
reportingpracticesandprinciplesforauditingdataandsoftwarecontainers(Dockeror
Singularity,forexample).Theapproachisbasedonasystematicreviewoftheliteraturefrom
2002to2021todemonstrateaprocessthatguaranteesdataintegrityandanalysistraceability.
Finally,itisconcludedthataframeworkbasedoncleandataandvirtualizedenvironments
greatlyimprovesreproducibility,promotingtrustandcooperationamongscientists.
Keywords:Reproducibility,dataauditing,software,openscience
INTRODUCCIÓN
Laciencianoesmásquelaadquisicióngradualdeconocimientoverificable.Precisamentepara
estepropósito,lareproducibilidadnoessimplementeunideal,sinoqueestáenelcentrode
estavalidación,queeslacapacidaddeuninvestigador,alusarlosmismosdatosdeentradayel
mismocódigodeanálisisqueelestudiooriginal,deproducirresultadosidénticoso
significativamentesimilares(1),(2).Peroenlasúltimasdosdécadashemospasadoporun
cambiosísmico.EnelcontextodedesarrollostanaceleradosenBigData,Aprendizaje
Automáticoyestadísticascomputacionales,lacomplejidaddelastareasanalíticashacrecido
exponencialmente,perotrágicamente,estohallevadoaunacrisisbienreconocidaqueponeen
riesgolavalidezdelcorpuscientíficomoderno:latemidacrisisdereproducibilidad(3),(4).
Paracaptarlaesenciadelasunto,debemosserfácticos.Todoshemosvistolamagnituddeeste
problemacubiertoenestudiosagranescala.Porejemplo,enestudiospreclínicos,Amgenutilizó
unanálisisexhaustivodedatosyconcluyóquesoloel11%de53hallazgosfundamentales
reportadosenoncologíayhematologíapuedenserreproducidos(5).Enlamismalínea,un
trabajoclaveenpsicologíaseñalóquemenosdelamitadde100estudiospublicadosenrevistas
importantespudieronserreplicados(6).Elproblemanoessoloparalabiomedicinaola
psicología,sinotambiénparalaneurociencia(7)ylacienciadedatos(8).Elproblemaes,por
tanto,multifactorial:faltadereportedemétodos,métodosestadísticoscuestionables,asícomo
laincapacidaddeaccederacontenidoimportante(9),(10).
Ahora,enelmundodehoy,yenlaeradigitalenparticular,laincapacidaddereproducirestá
ligadaalusodeactivosdigitales:datosenbruto,asícomocódigodeanálisis.Losinvestigadores
REPRODUCIBILIDADCIENTÍFICAENLAERADIGITAL:PROPUESTAMETODOLÓGICAPARAAUDITORÍADEDATOSYANÁLISIS
REPLICABLES
101
frecuentementeoperanconflujosdetrabajocomplejosquedependendeversionesespecíficas
desoftware,bibliotecasysistemasoperativos.Silosentornosnosealmacenan,publicano
empaquetancompletamente,elmismocódigomástardefallaráoresultaráenresultados
menosdeseables,unadinámicaconocidacomoderivadedependencia(11).Porlotanto,como
GarijoyGilafirmancorrectamente,publicarsolocódigoestáticoyanoessuficiente,sinoquese
requiereunenfoquerigurosoparaasegurarsedequeelentornodeejecuciónseareplicabley,
másimportanteaún,auditable(12),(13).
Estafaltadereproducibilidadtieneimplicacionesquevanmásalládelaacademia.Desdeuna
perspectivaeconómica,sepierdenmilesdemillonesdedólaresporañoeninvestigación
irrecuperable(14).Tambiénhayunadimensiónmoral,dondelaconfianzaenlacienciase
erosionaylaspolíticasbasadasenevidenciadébilcorrenelriesgodetenerunimpactonegativo.
Finalmente,desdelaperspectivacientífica,elconocimientofuturosevesocavadosisubasede
fundamentospareceinadecuada(15).Porlotanto,noesfactible,peroesmuyimportante
presentarunaauditoríadedatosyunametodologíadeanálisisreplicable,queasuvezpueda
salvaguardarlaintegridaddelainvestigaciónycontribuiralavancedelconocimiento(16).
Basadoenlaliteratura,elpropósitodeesteartículoderevisiónesproponerydefinirun
enfoqueestandarizadoparalaauditoríadedatosyelanálisisreplicablecomounaformade
crearunprotocolobasadoenpasosquemejorelareproducibilidadenescenariosde
complejidadcomputacional.
MATERIALESYMÉTODOS
Comopropuestadedesarrollo,seleccionamoslossiguientesmétodosrigurosos.Elestudiose
describecomounainvestigaciónbibliográficaqueinvolucraunestudiobibliográficorevisión
sistemáticaqueeselmétodocualitativo-descriptivo.Elobjetivofinalfuesintetizardatosque
conduzcanaunmarcometodológicobienorganizado.
Nuestrapoblacióndeestudioincluyótodoslosdocumentospublicadossobrereproducibilidad,
cienciaabierta,auditoríadedatosyanálisisreplicable.Noobstante,nuestramuestraselimitóa
revistascientíficasrevisadasporparesyaltamenteindexadas(WebofScience,Scopus,PubMed)
porsurelevanciaycalidad,yrespuestasmetodológicasquepudieranreproducirseenentornos
computacionales.Aligualqueotrostiposdeinvestigacionesdeestetipo,nuestroentornode
investigaciónfuecompletamentevirtual,centrándoseenlarecopilaciónestratégicade
informacióndelasbasesdedatosmásútilesenlaliteraturacientífica.
Enesteestudioderevisión,enlugardecálculosyanálisisestadísticostradicionales,nos
centramosenunprocesomuymetódicodesíntesiscualitativadelaevidencia.Paraasegurarla
fiabilidad,lacalidadmetodológicadecadaestudioseleccionadosemidióutilizando
herramientasestándardesdeelaño2002al2021(esdecir,versionesmodificadasdeAMSTAR
paracontextosderevisión).Luegoutilizamosunanálisistemáticometodológicoparaidentificar
problemascomunesclave(esdecir,paradatos,códigoyentorno)ypropusimossolucionespara
alinearlosintuitivamenteennuestrapropuestametodológicafinal.
REPRODUCIBILIDADCIENTÍFICAENLAERADIGITAL:PROPUESTAMETODOLÓGICAPARAAUDITORÍADEDATOSYANÁLISIS
REPLICABLES
102
Paraasegurarlatransparenciaylareplicabilidadenlametodología,empleamoselmarco
PRISMA(ElementosdeInformePreferidosparaRevisionesSistemáticasyMeta-Análisis)parala
planificación,ejecucióneinformesennuestrarevisiónsistemática.Deestamanera,laselección
deliteraturaporpartedenuestroscolegasesrigurosaycubrelasetapasmásimportantesde
selección,identificación,elegibilidadeinclusión.
Tabla1.Metodologíaderevisiónsistemáticaypropuesta(adaptaciónPRISMA).
Fase
Tareaespecífica
Instrumentos/herramientas
Objetivodelafase
Planificación
Formulacióndelapregunta
PICOyprotocolodebúsqueda.
Protocoloderevisión.
Definirelalcancey
laestrategiadela
búsqueda.
Búsqueday
Selección
Búsquedaexhaustivaenbases
dedatos(WoS,Scopus,
PubMed).Criteriosde
Inclusión/Exclusión.
Cadenasdebúsquedabooleanas(ej.
"ReproducibilityANDDataAuditAND
Containers").DeclaraciónPRISMA
(DiagramadeFlujo).
Identificarla
literaturarelevante
ymitigarelsesgode
selección.
Evaluacióny
Extracción
Evaluacióndelacalidad
metodológica(Riesgode
Sesgo).Extraccióndedatos
sobredesafíosysoluciones.
Herramientasdeevaluacióndecalidad
adaptadas(ej.AMSTAR).Matrizde
extraccióndedatos.
Sintetizarhallazgos
claveyasegurarla
solidezdela
evidencia.
Síntesisy
Propuesta
Análisistemáticodelas
mejoresprácticasy
frameworks.Desarrollodel
ProtocolodeAuditoríay
Replicación(PAR).
Síntesisnarrativaycualitativa.Análisis
comparativodeframeworksde
reproducibilidad.
Generarelmarco
metodológico
propuestopara
auditoríay
replicación.
Unanálisisconcluyentedirigidoaidentificarlosaspectostípicosdefalladelareproducibilidad
(porejemplo,faltadedatosdisponibles,códigoobsoleto,entornonoespecificado)e,
importantemente,aspectosdeéxito(porejemplo,usodecontenedores,cuadernosejecutables
(JupyteroRMarkdown)asícomoelkitdeherramientasderegistro(OSF).Así,lapropuesta
metodológicasebasaenlaalineaciónyarmonizacióndeestasmejoresprácticasquehansido
identificadasenlaliteraturacientíficadealtoimpacto.
RESULTADOS
Además,elanálisissistemáticoylarevisióndelaliteraturanosoloconfirmanelproblemadela
crisisdereproducibilidad,sinotambiénunconsensoimportanteentrelacomunidadcientífica
sobrecómoresolverelproblema.Esteconsenso,queactúacomounahojaderuta,seexpresa
enlossiguientestrespilaresparagarantizarlareproducibilidadcomputacional:Datos,Códigoy
Entorno(19,20).Esdecir,cuandounodeestoselementosnoestáestandarizadoentodoel
proyecto,elproblemasedesmorona:lafaltadeestandarizacióndebeconsiderarselaruptura
másimportanteenlacadenadeinvestigaciónparaunasolución(21).
Estructuradelprotocolodeauditoríayreplicación(PAR)
Dadoqueestasyotrasevidenciasrelacionadassehancombinadodemanerasistemáticaypara
ofreceralgunasherramientasprácticas,hemosdesarrolladounmodelodetrabajoyoperativo
REPRODUCIBILIDADCIENTÍFICAENLAERADIGITAL:PROPUESTAMETODOLÓGICAPARAAUDITORÍADEDATOSYANÁLISIS
REPLICABLES
103
conocidocomoelProtocolodeAuditoríayReplicación(PAR).Dadaladiversidaddediferentes
proyectos,esteprotocoloseformulacomounahojaderutaprogresivaparainvestigadoresy
auditoresentresniveles:básico,intermedioyavanzado(elestándardeoroenlaprácticadela
cienciaabierta).
Tabla2.EstructuraprogresivadelprotocoloPAR.
Nivelde
cumplimiento
Datos(auditoríae
integridad)
Código(trazabilidad)
Entorno(replicabilidad)
Básico
(transparencia
mínima)
Disponibilidaddedatos
limpios(anonimizadosy
procesados)
Códigodeanálisispublicado
ycomentado
Especificaciónmanualsimple
desoftwareyversionesclave
Intermedio
(mejorpráctica)
Disponibilidaddedatossin
procesarymetadatos
detallados.Usode
repositoriobajoprincipios
FAIR(Findable,Accessible)
Códigoenrepositoriocon
controldeversiones(ej.
Git/GitHub).Usode
Notebooksejecutables(R
Markdown,Jupyter)
Archivoderequerimientosde
entorno(18),(19)
Avanzado
(estándarde
oro)
Auditoríacompletacon
verificacióndeintegridad
(checksumsMD5/SHA256).
PublicaciónenData
Commonsoplataformacon
DOI
Revisiónporparesdelcódigo
(CodeReview).
Documentacióndeflujosde
trabajo(ej.Snakemake,
Nextflow)para
automatización
Empaquetamientocompletoen
contenedores
(Docker/Singularity)para
ejecucióninmediatay
determinística(22,23)
LaTabla2,quecontieneelprotocolodeauditoríayreplicación(PAR)quesehapresentado,se
planteacomounahojadetrabajodeunasucesiónordenadadepasosquevagarantizandola
integridaddelosdatosylatrazabilidaddelanálisis.Searticulaapartirdelastresbasespilarque
sehandescritoenestacontribución,quesonDatos,CódigoyEntorno.Estaesunaestructura
quevadelnivelBásicodetransparenciamínimaqueúnicamentetrataladisponibilidaddedatos
limpiosycódigoconcomentarioshaciaelnivelIntermedioqueintegralosprincipiosFAIRyel
controldeversionesderepositorioscomoGitHub.Sinembargo,elverdaderonúcleodela
propuestaesprecisamentesunivelAvanzadoyqueeseloroestándardelacienciaabierta,que
yanoselimitaalameradocumentación,sinoqueexigeauditoríasdelaintegridadmediante
sumasdeverificación(checksums)yelempaquetadocompletoencontenedorescomoDockero
Singularity.Precisamenteporello,esteprotocologarantizaunareplicabilidaddeterminísticae
inmutablequepermiteejecutarelanálisisdemaneraidénticaindependientementedelsistema
operativoydasoluciónaladerivadedependencias.
REPRODUCIBILIDADCIENTÍFICAENLAERADIGITAL:PROPUESTAMETODOLÓGICAPARAAUDITORÍADEDATOSYANÁLISIS
REPLICABLES
104
Figura1.RelacióninversaentreelniveldecumplimientodelprotocoloPARyelesfuerzorequeridoporel
replicador.
AlobservarlaFigura1encombinación,latendenciadedesarrolloesclara.Asípodemosverel
avancedesdealgunasprácticasmínimasdetransparencia(NivelBásico)hastaprácticamente
unagarantíadereplicabilidad.Enestesentido,esimportanteenfatizarquenuestroNivel
Avanzadosubyaceennuestraofertadealtoimpacto.Estenivelessignificativoyaquetambién
implicaunaauditoríacompletadedatosytecnologíadecontenedores,abordandoelproblema
desdeambasperspectivasprimarias.
Enesteproceso,semuestraclaramentequeloscontenedoresproporcionaránunasolucióna
unapeligrosaderivadedependencias(24).Estosserealizandemaneraeleganteyaquelos
contenedoresencapsulanelcódigo,losdatosytodaslasdependenciasdesoftwareenuna
imagenejecutableinmutable.Esteprocesogarantizaráquecualquierauditorocolega,
independientementedesusistemaoperativo,puedarealizarelmismoanálisiscomoantespara
lograrlareplicabilidaddeterministadeseada(25).Porúltimo,lapartedeauditoríadedatos,que
utilizasumasdeverificaciónparacorroborarquelosdatosnohansidoalterados(26),esla
respuestalógicaalaintegridaddelosdatosylasposiblespreocupacionesdealteracióndel
conjuntodedatosfuente.Enresumen,elNivelAvanzadoconviertelasimpleintenciónde
transparenciaenunagarantíatécnicadelareplicabilidaddelsistema.
REPRODUCIBILIDADCIENTÍFICAENLAERADIGITAL:PROPUESTAMETODOLÓGICAPARAAUDITORÍADEDATOSYANÁLISIS
REPLICABLES
105
Tabla3.ComparacióndelprotocoloPAR(nivelavanzado)conframeworksexistentes.
Característica
clave
PropuestaPAR
(avanzado)
IniciativaTOP
Openscience
framework(OSF)
Archivosde
reproducibilidad
Garantíadel
entorno
Contenedores
(Docker/Singularity)
Opcional/Requerimientos
Repositoriode
códigoydatos
Listade
dependencias
Auditoríade
datos
Verificaciónde
Integridad(Checksums)
Solodisponibilidady
acceso
Almacenamiento
conversioning
Documentaciónde
lafuente
Trazabilidad
delanálisis
Flujosdetrabajo
automatizados
(Snakemake)
Documentacióndel
método
Registrode
proyectos
Descripción
narrativa
Objetivo
principal
Replicabilidad
Determinística
TransparenciayApertura
Compartirypre-
registrar
Almacenamiento
dematerial
LaTabla3demuestraquenuestrapropuestanosolocumpleconloscriteriosdetransparencia
(queeselpuntofocaldeiniciativascomoTOP),sinoquetambiénsatisfacelosrequisitos
técnicosdealtonivel.Sobretodo,unrequisitoobligatoriodecontenedordesoftwareenel
nivelAvanzadoaseguraqueelentornooperativonoseconviertaenunpuntodefallo,locual
frecuentementeseconsideraunlímiteenlosmarcosquesoloenumerandependencias(11).
Además,esimportanteseñalarqueelNivelAvanzadoconstituyeelnúcleodenuestrapropuesta
dealtoimpacto,necesitandounaauditoríacompletadedatoscomplementadacontecnología
decontenedores,abordandoelproblemadesdeambasperspectivas.Paraello,los
contenedores(24)proporcionanunasoluciónalpeligrosoproblemadela"derivade
dependencias".Seutilizancomounasoluciónpoderosayeleganteaesto,demanerasencilla,ya
queencapsulanelcódigo,losdatosytodaslasdependenciasdesoftwareenunaimagen
ejecutableinmutable.Graciasaestemecanismo,cualquierauditorocolega,
independientementedelsistemaoperativo,puederealizarelanálisisexactamentecomosehizo,
lograndoasíunareplicabilidaddeterminista(25).Porúltimo,lapartedeauditoríadedatosen
laqueserealizansumasdeverificacióndelosdatosparademostrarquenohansido
modificados(26)eslasolucióndirectacontraunacuestióndeintegridadymanipulacióndel
conjuntodedatosoriginal.Enconclusión,elNivelAvanzadodelProtocoloPARconviertela
transparenciabásicadelprocesoenunagarantíatécnicadereplicabilidad.
DISCUSIÓN
Basándonosenlaestructuraanterior,aquípresentamoselProtocolodeAuditoríayReplicación
(PAR)sugerido,quenospermiteabordarladistincióncríticaentrereplicabilidad(mismosdatos,
mismosmétodos)yreproducibilidad(encontrarpatronessimilaresennuevosdatos/métodos)
(8).Nuestromarcoenfatizalareplicabilidadcomolabasetécnicafundamentalparacualquier
progresocientíficocoherente,dehecho.
ElénfasisenlaauditoríadedatosylaintegridadporpartedePAR,particularmenteenel
contextodesuambiciosoNivelAvanzado,estáestrechamentevinculadoalosmarcosdela
REPRODUCIBILIDADCIENTÍFICAENLAERADIGITAL:PROPUESTAMETODOLÓGICAPARAAUDITORÍADEDATOSYANÁLISIS
REPLICABLES
106
IniciativadeTransparenciayApertura(TOP)(6).Peronuestrapropuestapretendeirunpaso
másallá,intencionalmente.AdiferenciadelainiciativaTOP,queenfatizalatransparenciadela
documentación,PARincluyeunaverificacióntécnicadirectadelaintegridadatravésdesumas
deverificaciónypublicaciónbajoprincipiosFAIR.Estaverificaciónescrítica,porqueasegurala
inalterabilidaddeunconjuntodedatosdesdeelmomentodelarecolecciónhastalapublicación,
unaprácticadegranimportanciapropuestaporlaNubeEuropeadeCienciaAbiertao
organizacionessimilares(7).
Aunquelaliteraturaprevia(13)propusolacreaciónde"archivosdereproducibilidad",el
conceptoesmuysimple.Estafueunanocióninicial,peronuestrométodosebasaenella
empleandotecnologíatangible(comocontenedores)parareplicarautomáticaymasivamente
losdatosdemuchasmanerasdiferentes.Omásbiendeunalistademateriales,aunentorno
dinámicoyejecutablequedisminuyelanecesidadylacomplejidaddelainstalaciónmanual.
ElprincipalhallazgorespaldadoporelNivelAvanzadoeselempaquetadoobligatoriocon
contenedores(Docker/Singularity).Estotieneprofundasimplicaciones.ComoBoettiger
demostrótanbienensuclásico(9),lavirtualizaciónreduceengranmedidaelesfuerzode
replicación.Así,nuestraFigura1noesunmeroproductodelaimaginación,sinoquerepresenta
cómoloscostosdetransparenciasetrasladandelreplicadoralinvestigadororiginalyse
conviertenenunaventajanetaparalaciencia.Además,lareplicabilidaddeterministaselogra
estableciendounentornoinmutable(25).Enotraspalabras,esposiblerealizarelanálisisbajo
exactamentelasmismascircunstanciasbitabitinclusoañosdespués,eliminandoasílaforma
imprecisaqueresultaenmarcosmenosestrictosquepermanecen.
Reutilizaciónycolaboraciónfinalmente,necesitamosenfocarnosenlarelacióndePARconlos
datosreutilizables.AldarprioridadalformatoFAIR(Localizable,Accesible,Interoperable,
Reutilizable),nuestroprotocolosiguelasdemandasesperadasdelasprincipalesinstitucionesde
financiamientoylacomunidaddecienciadedatos(12).Así,losestudiosproducidosenelNivel
Avanzadonosolosonverificables,sinoqueseconviertenenactivosdigitalesdealtacalidad
paraserincorporadosenmeta-análisisagranescalaoanálisissecundarios.Asuvez,la
estructuraprogresivadePAR(Básico,Intermedio,Avanzado)actúacomounaherramienta
pedagógicaqueapoyaestasprácticasavanzadasdeformapráctica.Además,desglosarla
barreradeentradaqueimpidealosjóvenesinvestigadoresparticiparenelmovimientode
cienciaabiertapuedefacilitarlo(16).ElobjetivogeneraldePARnoessololaintegridad,sinola
máximautilidaddelconocimientocientíficoproducidoenunaeraenlaquetodossemuevena
travésdelmundodelosmediosenlínea.
CONCLUSIONES
Necesidaddeunestándartécnico(paravanzado)seconcluyequeelProtocolodeAuditoríay
Replicación(PAR),específicamenteensuNivelAvanzado,noessolounaopción,sinouna
necesidad.Estoescrucialporquealrequerirlaauditoríacompletadedatosyelusode
contenedoresdesoftware(Docker/Singularity),finalmenteseestableceelestándartécnicoque
REPRODUCIBILIDADCIENTÍFICAENLAERADIGITAL:PROPUESTAMETODOLÓGICAPARAAUDITORÍADEDATOSYANÁLISIS
REPLICABLES
107
garantizalareplicabilidaddeterministaenentornoscomputacionales,superandoprácticas
basadasúnicamenteendocumentación.
Laresoluciónaldesplazamientodedependencias:Laintroduccióndelatecnologíade
contenedoresenelflujodetrabajodepublicaciónpareceserlamejoropción.Esuncontrapeso
al“desplazamientodedependencias”,eltalóndeAquilesdelainvestigacióndigital.Esto
garantizaqueelentornodeejecuciónseainmutableyqueestaimportantecausatécnicadeno
reproducibilidadseresuelva;así,serestauralaconfianzaenelanálisisderesultados.Doble
impacto:integridadymáximautilidad.
HayunadobleventajaenlaaplicaciónformaldePAR.Estonosolopuedemantenerla
integridadytrazabilidaddelainvestigación,sinotambiénoptimizarelimpactodel
conocimiento.Conesto,alestablecerlapublicacióndedatosycódigosreplicablesbajolos
principiosFAIR,elprotocoloconviertelosresultadoscientíficamentereplicablesenactivos
digitalesdealtovalorqueestándisponiblesparasureutilizaciónycolaboracióncientíficaagran
escala.
REFERENCIASBIBLIOGRÁFICAS
1.PlesserH.Reproducibilityversusreplicability:abriefhistoryofaconfusedterminology.Front
Neuroinform.2017;11–76.
2.NationalAcademiesofSciences.Engineering,andMedicine.ReproducibilityandReplicability
inScienceWashington,DC.TheNationalAcademiesPress.2019;
3.BakerM.1,500scientistsliftthelidonreproducibility.Nature.2016;04(76):452–4.
4.OpenshawS,OpenshawC.Thereproducibilitycrisisinscience:astatisticalperspective.PLoS
ComputBiol.2020;11(16):e1008321.
5.BegleyC,EllisL.Drugdevelopment:Raisestandardsforpreclinicalcancerresearch.Nature.
2012;7391(483):531–3.
6.OpenScienceCollaboration.Estimatingthereproducibilityofpsychologicalscience.Science
(1979).2015;6251(249):16–47.
7.EklundA,NicholsT,KnutssonH.Clusterfailure:WhyfMRIinferencesforspatialextentare
invalid.ProcNatlAcadSciUSA.2016;28(113):7900–5.
8.GoodmanS,FanelliD,IoannidisJ.Whatdoesreproducibilitymean?Science(1979).
2016;6360(356):1021–2.
9.BoettigerC.Anintroductiontodockerforreproducibleresearch.PLoSOne.
2015;1(10):e0100373.
10.IoannidisJ.Whyscienceisnotself-correcting.PerspectPsycholSci.2012;6(7):645–54.
11.SandveG,NekrutenkoA,TaylorJ.Tensimplerulesforreproduciblecomputationalresearch.
PLoSComputBiol.2013;10(9):100–3285.
12.FosterI,StoddenV,WhiteJ.Adatacommonsforreproduciblescience.NatBiotechnol.
2017;12(35):1111–2.
13.StoddenV,MeraliZ.Empoweringreproducibleresearch.Science(1979).2017;6309(354):253–
4.
REPRODUCIBILIDADCIENTÍFICAENLAERADIGITAL:PROPUESTAMETODOLÓGICAPARAAUDITORÍADEDATOSYANÁLISIS
REPLICABLES
108
14.FreedmanL,CockburnI,SimcoeT.Theeconomicsofreproducibility.PLoSBiol.
2015;6(13):e1002165.
15.ResnikD.Reproducibilityandresearchintegrity.AccountRes.2018;2(25):119–31.
16.BarbaL.Thereproducibleresearchmovement.ComputSciEng.2018;2(20):9–17.
17.BoothA,SuttonA,PapaioannouD.SystematicApproachestoaSuccessfulLiteratureReview.
2nded.LosAngeles:SAGEPublications.2016;
18.SheaB,GrimshawJ,WellsG.DevelopmentofAMSTAR:ameasurementtooltoassessthe
methodologicalqualityofsystematicreviews.BMCMedResMethodol.2007;7–10.
19.PageM,McKenzieJ,BossuytP.ThePRISMA2020statement:anupdatedguidelinefor
reportingsystematicreviews.BMJ.2021;(372):71.
20.PerkelJ.Howtopublishcodeanddatatoboostreproducibility.Nature.2020;586(7829):463–4.
21.PicardJ,BoettigerC,O’BoyleC.Beyondopendataandcode:Aframeworkforreproducible
researchenvironmentspecifications.JOpenResSoftw.2021;1(9):1.
22.DiTommasoP,MorettiS,HalsteadM.ContainersandReproducibleResearch.ACMComput
Surv.2020;1(53):18:1-24.
23.GarijoD,GilY.Reproducibilityindatascience.CommunACM.2020;7(63):108–17.
24.O’BoyleC,BoettigerC,MeraliZ.Containerizingyourresearch:Abestpracticeforreproducible
dataanalysis.JOpenSourceSoftw.2020;5(50):21–49.
25.GorgolewskiK,MarguliesD,CastellanosF.Areproducibleresearchworkflowforneuroimaging:
TheReproNimproject.Neuroimage.2020;(211):116–584.
26.NationalInstituteofStandardsandTechnology.SP800-32:IntroductiontoComputerSecurity.
Gaithersburg,MD:NIST.2002;