
dARK - Decentralized Archival Resource Key
A decentralized implementation of the ARK persistent identifier
-
¿Qué es dARK?
dARK es una implementación descentralizada de Archival Resource Key (ARK) que asigna y resuelve identificadores ARK a través de nodos blockchain institucionales. Opera en una red de "bien público" donde la propiedad, el almacenamiento y el control de los datos se distribuyen entre todas las organizaciones participantes.
El proyecto inicial fue principalmente alojado y financiado por el Instituto Brasileño de Información en Ciencia y Tecnología (IBICT), con apoyo adicional de LA Referencia, hecho posible gracias al respaldo de los compromisos de la Coalición Global de Sostenibilidad para Servicios de Ciencia Abierta (SCOSS).
Descentralización
Una implementación inicial de ARK descentralizado basada en una red blockchain privada liviana
Tolerancia a Fallos
Atribución y resolución descentralizada tolerante a fallos de identificadores ARK a través de una red distribuida
Integración
Un sistema de atribución ARK a nivel de agregador para la producción de investigación heredada en el ecosistema de ciencia abierta brasileño (OasisBr, IBICT Brasil)
Motivaciones
Identificador Persistente ARK
El identificador ARK ha surgido como una alternativa viable y de bajo costo debido a la posibilidad de implementar proveedores locales para el resolvedor global. Su uso facilita el acceso y preservación a largo plazo de recursos digitales, asegurando enlaces estables y confiables.
Evaluación de la Investigación
Los identificadores persistentes son esenciales para construir gráficos de investigación más robustos, generar indicadores precisos y mejorar la evaluación de la producción científica. Su capacidad para vincular diversos objetos de información mejora el análisis y la comprensión del impacto de la investigación.
Desafíos en el Sur Global
En los países del Sur Global, la falta de cobertura de identificadores persistentes es un problema común. Esto se debe principalmente a los costos asociados con estos servicios, limitando el acceso a infraestructuras esenciales para asegurar la visibilidad y preservación de los resultados de investigación.
Necesidad de Descentralización
Actualmente, la mayoría de los sistemas de identificadores persistentes operan bajo modelos centralizados, dependiendo de unas pocas agencias para mantener la infraestructura de servicios. Un enfoque descentralizado, como el propuesto por dARK, reduce esta dependencia y aumenta la resiliencia del sistema, promoviendo mayor equidad en el acceso y gestión de identificadores.
Objetivos a Largo Plazo
Infraestructura Abierta
Proporcionar un sistema abierto y no centralizado para identificadores persistentes únicos/deduplicados accesible para todos
Servicios de Resolución
Ofrecer un servicio de resolución descentralizado para el ecosistema de Ciencia Abierta, interoperable con otros servicios PID (como agencias DOI)
Preservación de Metadatos
Asegurar la preservación descentralizada de metadatos asociados con objetos digitales referenciados por identificadores ARK, con el objetivo de proporcionar PIDs y metadatos consistentes a gráficos de investigación (OpenAIRE, OpenAlex, entre otros)
Nota Importante
Este desarrollo no pretende reemplazar o competir con los identificadores/agencias DOI, sino servir como una solución complementaria que también será interoperable con proveedores DOI.
-
Arquitectura y Componentes
La arquitectura del sistema dARK está diseñada con una clara separación de componentes, organizados en la Capa de Servicio y la Capa Core.
Capa de Servicio
La Capa de Servicio proporciona servicios esenciales que interactúan con los componentes de la Capa Core. Estos servicios incluyen:
dARK Resolver
Integrado con el sistema global de resolución nt2.info, permitiendo la resolución de identificadores persistentes
dARK Minter
Utilizado para crear y registrar nuevos PIDs en el sistema
dARK Dashboard
Proporciona capacidades de monitoreo y administración para la plataforma
Acceder al código fuente en GitHubdARK API
Facilita la comunicación entre aplicaciones y la blockchain subyacente
dARK Backup
Garantiza la durabilidad de los datos y la fiabilidad del sistema
Acceder al código fuente en GitHubdARK LA Referencia
Implementa la creación masiva de dARK en la Plataforma de Cosecha de LA Referencia
Estos servicios están respaldados por mecanismos de balanceo de carga para garantizar alta disponibilidad y un rendimiento óptimo del sistema.
Capa Core (dARK dApp)
La Capa Core está construida sobre una red blockchain con permisos que forma la columna vertebral del sistema dARK. En su núcleo se encuentra una red pública con permisos que opera con un mecanismo de consenso de Prueba de Autoridad (PoA), proporcionando tanto seguridad como eficiencia para la gestión de PIDs.
Sobre la madurez de código abierto dARK
dARK es un proyecto de código abierto y está disponible para la comunidad global de Ciencia Abierta. Sin embargo, es un proyecto en constante evolución, prueba y mejora. Por lo tanto, no recomendamos crear implementaciones de producción basadas de dARK en este momento. Estamos abiertos a contribuciones de código y pruebas en entornos piloto, y alentamos la participación de la comunidad a través de estos canales.
dARK dApp
Aplicación descentralizada central que implementa los contratos inteligentes de gestión de PIDs y garantiza la integridad de los datos a través de la tecnología blockchain
Fundación Blockchain
La red aprovecha la tecnología Hyperledger Besu para proporcionar una base blockchain segura y eficiente. Hyperledger Besu es un cliente de Ethereum diseñado para uso empresarial que admite implementaciones de redes públicas y privadas con permisos. Su implementación de la Máquina Virtual de Ethereum (EVM) permite contratos inteligentes sofisticados que gestionan operaciones de PID con total transparencia y auditabilidad.
Arquitectura de la Red
Diseñada con la resiliencia y la fiabilidad como principios fundamentales, la arquitectura comienza con una Red dARK Mínima Viable (MVDN). Esta red consta de nodos blockchain esenciales que proporcionan la funcionalidad fundamental requerida para la operación del sistema. Estos nodos gestionan las comunicaciones RPC/API y mantienen el libro mayor distribuido de identificadores persistentes. Cada nodo completo implementa puntos finales de API para la interacción de servicios externos a través de balanceo de carga.
Para garantizar la operación continua incluso durante fallos de nodos, la arquitectura incorpora redundancia tolerante a fallos a través de nodos de respaldo y sistemas de replicación de datos. Este enfoque distribuido asegura que ningún punto único de fallo pueda comprometer la integridad o disponibilidad de la infraestructura de PID.
Capa de Aplicación
En la capa de aplicación, la dARK dApp ofrece la funcionalidad central para gestionar identificadores persistentes a través de contratos inteligentes. Esta lógica de aplicación maneja la creación, actualización y resolución de PIDs mientras aplica las reglas de gobernanza definidas por los participantes de la red.
Infraestructura Federada
La arquitectura admite múltiples redes blockchain independientes operadas por diferentes autoridades, creando una infraestructura de PID verdaderamente federada.
Diseño Escalable
El sistema puede escalar horizontalmente añadiendo más nodos a la red, asegurando un alto rendimiento incluso con un número creciente de PIDs.
Extensiones Futuras
El diseño modular permite la incorporación futura de soluciones de almacenamiento adicionales como IPFS para cargas de metadatos más grandes, manteniendo la integridad de los datos a través de la verificación criptográfica en la cadena.
Integración del Ecosistema
El sistema dARK está diseñado para integrarse sin problemas con el ecosistema académico existente, particularmente con redes de repositorios, revistas diammond y agregadores de metadatos, siguiendo este flujo de trabajo inicial:
1Cosecha de Metadatos
Los agregadores cosechan regularmente metadatos de repositorios institucionales, revistas y otros proveedores de contenido a través de protocolos estándar como OAI-PMH o APIs personalizadas.
2Asignación de PID
Para contenido sin identificadores persistentes, el agregador puede solicitar nuevos ARKs a través de la API de dARK Minter. Para ARKs existentes, se validan y registran en el sistema dARK.
3Registro en Blockchain
El sistema dARK registra cada ARK en la blockchain, junto con su URL de destino y metadatos esenciales, proporcionando un registro descentralizado y a prueba de manipulaciones de identificadores.
4Distribución de PID
Los ARKs recién creados o validados pueden ser enviados de vuelta a los repositorios para su inclusión en sus registros de metadatos, permitiendo un enfoque estandarizado para la identificación persistente en toda la red.
5Resolución
Cuando un usuario accede a un ARK, el resolver global redirige al resolver dARK, que utiliza la blockchain para recuperar la información de ubicación actual, asegurando el acceso persistente incluso cuando cambian las ubicaciones de los recursos.
Este enfoque de integración permite a los agregadores de metadatos como LA Referencia mejorar sus servicios con una infraestructura de PID descentralizada mientras preservan los flujos de trabajo existentes y agregan valor a la red de repositorios en su conjunto. También permite transiciones sin problemas cuando los repositorios mueven contenido o cambian de plataforma, ya que el sistema de resolución de PID puede actualizarse sin romper enlaces externos.
Desarrollo Futuro
En las próximas fases de desarrollo, el proyecto dARK planea:
- Transformar este proyecto inicial (actualmente trabajando en IBICT/Brasil) en un servicio regional integral diseñado como una infraestructura pública, siguiendo los principios establecidos por LA Referencia
- Desarrollar plugins para los sistemas de repositorios y revistas más utilizados para facilitar la integración sin problemas con la infraestructura dARK
- Implementar persistencia descentralizada de metadatos para preservar la información bibliográfica y servir como una fuente de datos confiable para sistemas analíticos como OpenAlex
Estas mejoras fortalecerán aún más el ecosistema dARK y expandirán su utilidad dentro del panorama de la comunicación académica en toda América Latina y más allá.