dARK - Decentralized Archival Resource Key

A decentralized implementation of the ARK persistent identifier

  • ¿Qué es dARK?

    dARK es una implementación descentralizada de Archival Resource Key (ARK) que asigna y resuelve identificadores ARK a través de nodos blockchain institucionales. Opera en una red de "bien público" donde la propiedad, el almacenamiento y el control de los datos se distribuyen entre todas las organizaciones participantes.

    El proyecto inicial fue principalmente alojado y financiado por el Instituto Brasileño de Información en Ciencia y Tecnología (IBICT), con apoyo adicional de LA Referencia, hecho posible gracias al respaldo de los compromisos de la Coalición Global de Sostenibilidad para Servicios de Ciencia Abierta (SCOSS).

    Descentralización

    Una implementación inicial de ARK descentralizado basada en una red blockchain privada liviana

    Tolerancia a Fallos

    Atribución y resolución descentralizada tolerante a fallos de identificadores ARK a través de una red distribuida

    Integración

    Un sistema de atribución ARK a nivel de agregador para la producción de investigación heredada en el ecosistema de ciencia abierta brasileño (OasisBr, IBICT Brasil)

    Motivaciones

    Identificador Persistente ARK

    El identificador ARK ha surgido como una alternativa viable y de bajo costo debido a la posibilidad de implementar proveedores locales para el resolvedor global. Su uso facilita el acceso y preservación a largo plazo de recursos digitales, asegurando enlaces estables y confiables.

    Evaluación de la Investigación

    Los identificadores persistentes son esenciales para construir gráficos de investigación más robustos, generar indicadores precisos y mejorar la evaluación de la producción científica. Su capacidad para vincular diversos objetos de información mejora el análisis y la comprensión del impacto de la investigación.

    Desafíos en el Sur Global

    En los países del Sur Global, la falta de cobertura de identificadores persistentes es un problema común. Esto se debe principalmente a los costos asociados con estos servicios, limitando el acceso a infraestructuras esenciales para asegurar la visibilidad y preservación de los resultados de investigación.

    Necesidad de Descentralización

    Actualmente, la mayoría de los sistemas de identificadores persistentes operan bajo modelos centralizados, dependiendo de unas pocas agencias para mantener la infraestructura de servicios. Un enfoque descentralizado, como el propuesto por dARK, reduce esta dependencia y aumenta la resiliencia del sistema, promoviendo mayor equidad en el acceso y gestión de identificadores.

    Objetivos a Largo Plazo

    Infraestructura Abierta

    Proporcionar un sistema abierto y no centralizado para identificadores persistentes únicos/deduplicados accesible para todos

    Servicios de Resolución

    Ofrecer un servicio de resolución descentralizado para el ecosistema de Ciencia Abierta, interoperable con otros servicios PID (como agencias DOI)

    Preservación de Metadatos

    Asegurar la preservación descentralizada de metadatos asociados con objetos digitales referenciados por identificadores ARK, con el objetivo de proporcionar PIDs y metadatos consistentes a gráficos de investigación (OpenAIRE, OpenAlex, entre otros)

    Nota Importante

    Este desarrollo no pretende reemplazar o competir con los identificadores/agencias DOI, sino servir como una solución complementaria que también será interoperable con proveedores DOI.

    más
  • Arquitectura y Componentes

    La arquitectura del sistema dARK está diseñada con una clara separación de componentes, organizados en la Capa de Servicio y la Capa Core.

    Diagrama de Arquitectura dARK

    Capa de Servicio

    La Capa de Servicio proporciona servicios esenciales que interactúan con los componentes de la Capa Core. Estos servicios incluyen:

    dARK Resolver

    Integrado con el sistema global de resolución nt2.info, permitiendo la resolución de identificadores persistentes

    dARK Minter

    Utilizado para crear y registrar nuevos PIDs en el sistema

    dARK Dashboard

    Proporciona capacidades de monitoreo y administración para la plataforma

    Acceder al código fuente en GitHub

    dARK API

    Facilita la comunicación entre aplicaciones y la blockchain subyacente

    dARK Backup

    Garantiza la durabilidad de los datos y la fiabilidad del sistema

    Acceder al código fuente en GitHub

    dARK LA Referencia

    Implementa la creación masiva de dARK en la Plataforma de Cosecha de LA Referencia

    Estos servicios están respaldados por mecanismos de balanceo de carga para garantizar alta disponibilidad y un rendimiento óptimo del sistema.

    Capa Core (dARK dApp)

    La Capa Core está construida sobre una red blockchain con permisos que forma la columna vertebral del sistema dARK. En su núcleo se encuentra una red pública con permisos que opera con un mecanismo de consenso de Prueba de Autoridad (PoA), proporcionando tanto seguridad como eficiencia para la gestión de PIDs.

    Sobre la madurez de código abierto dARK

    dARK es un proyecto de código abierto y está disponible para la comunidad global de Ciencia Abierta. Sin embargo, es un proyecto en constante evolución, prueba y mejora. Por lo tanto, no recomendamos crear implementaciones de producción basadas de dARK en este momento. Estamos abiertos a contribuciones de código y pruebas en entornos piloto, y alentamos la participación de la comunidad a través de estos canales.

    dARK dApp

    Aplicación descentralizada central que implementa los contratos inteligentes de gestión de PIDs y garantiza la integridad de los datos a través de la tecnología blockchain

    Fundación Blockchain

    La red aprovecha la tecnología Hyperledger Besu para proporcionar una base blockchain segura y eficiente. Hyperledger Besu es un cliente de Ethereum diseñado para uso empresarial que admite implementaciones de redes públicas y privadas con permisos. Su implementación de la Máquina Virtual de Ethereum (EVM) permite contratos inteligentes sofisticados que gestionan operaciones de PID con total transparencia y auditabilidad.

    Arquitectura de la Red

    Diseñada con la resiliencia y la fiabilidad como principios fundamentales, la arquitectura comienza con una Red dARK Mínima Viable (MVDN). Esta red consta de nodos blockchain esenciales que proporcionan la funcionalidad fundamental requerida para la operación del sistema. Estos nodos gestionan las comunicaciones RPC/API y mantienen el libro mayor distribuido de identificadores persistentes. Cada nodo completo implementa puntos finales de API para la interacción de servicios externos a través de balanceo de carga.

    Para garantizar la operación continua incluso durante fallos de nodos, la arquitectura incorpora redundancia tolerante a fallos a través de nodos de respaldo y sistemas de replicación de datos. Este enfoque distribuido asegura que ningún punto único de fallo pueda comprometer la integridad o disponibilidad de la infraestructura de PID.

    Capa de Aplicación

    En la capa de aplicación, la dARK dApp ofrece la funcionalidad central para gestionar identificadores persistentes a través de contratos inteligentes. Esta lógica de aplicación maneja la creación, actualización y resolución de PIDs mientras aplica las reglas de gobernanza definidas por los participantes de la red.

    Infraestructura Federada

    La arquitectura admite múltiples redes blockchain independientes operadas por diferentes autoridades, creando una infraestructura de PID verdaderamente federada.

    Diseño Escalable

    El sistema puede escalar horizontalmente añadiendo más nodos a la red, asegurando un alto rendimiento incluso con un número creciente de PIDs.

    Extensiones Futuras

    El diseño modular permite la incorporación futura de soluciones de almacenamiento adicionales como IPFS para cargas de metadatos más grandes, manteniendo la integridad de los datos a través de la verificación criptográfica en la cadena.

    Integración del Ecosistema

    El sistema dARK está diseñado para integrarse sin problemas con el ecosistema académico existente, particularmente con redes de repositorios, revistas diammond y agregadores de metadatos, siguiendo este flujo de trabajo inicial:

    1

    Cosecha de Metadatos

    Los agregadores cosechan regularmente metadatos de repositorios institucionales, revistas y otros proveedores de contenido a través de protocolos estándar como OAI-PMH o APIs personalizadas.

    2

    Asignación de PID

    Para contenido sin identificadores persistentes, el agregador puede solicitar nuevos ARKs a través de la API de dARK Minter. Para ARKs existentes, se validan y registran en el sistema dARK.

    3

    Registro en Blockchain

    El sistema dARK registra cada ARK en la blockchain, junto con su URL de destino y metadatos esenciales, proporcionando un registro descentralizado y a prueba de manipulaciones de identificadores.

    4

    Distribución de PID

    Los ARKs recién creados o validados pueden ser enviados de vuelta a los repositorios para su inclusión en sus registros de metadatos, permitiendo un enfoque estandarizado para la identificación persistente en toda la red.

    5

    Resolución

    Cuando un usuario accede a un ARK, el resolver global redirige al resolver dARK, que utiliza la blockchain para recuperar la información de ubicación actual, asegurando el acceso persistente incluso cuando cambian las ubicaciones de los recursos.

    Este enfoque de integración permite a los agregadores de metadatos como LA Referencia mejorar sus servicios con una infraestructura de PID descentralizada mientras preservan los flujos de trabajo existentes y agregan valor a la red de repositorios en su conjunto. También permite transiciones sin problemas cuando los repositorios mueven contenido o cambian de plataforma, ya que el sistema de resolución de PID puede actualizarse sin romper enlaces externos.

    Desarrollo Futuro

    En las próximas fases de desarrollo, el proyecto dARK planea:

    • Transformar este proyecto inicial (actualmente trabajando en IBICT/Brasil) en un servicio regional integral diseñado como una infraestructura pública, siguiendo los principios establecidos por LA Referencia
    • Desarrollar plugins para los sistemas de repositorios y revistas más utilizados para facilitar la integración sin problemas con la infraestructura dARK
    • Implementar persistencia descentralizada de metadatos para preservar la información bibliográfica y servir como una fuente de datos confiable para sistemas analíticos como OpenAlex

    Estas mejoras fortalecerán aún más el ecosistema dARK y expandirán su utilidad dentro del panorama de la comunicación académica en toda América Latina y más allá.

    más