
INTRODUCCIÓN & CONTEXTO
Solidaridad Network es una organización internacional de la sociedad civil con más de 50 años de experiencia en el desarrollo de cadenas de valor sostenibles. En Colombia, nuestra misión se centra en impactar positivamente a productores y comunidades para que logren una producción resiliente y rentable, en armonía con el medio ambiente. El uso estratégico de los datos es fundamental para medir nuestro impacto, optimizar nuestras intervenciones y generar conocimiento que impulse la sostenibilidad a escala.
El ecosistema de datos de la organización se conforma de múltiples plataformas y formatos lo que dificulta el entendimiento o la evaluación holística de toda la información. Bajo este panorama, la organización busca contratar consultoría (persona natural o firma) para diseñar e implementar una Arquitectura de Analítica Federada potenciada por Inteligencia Artificial, que actúe como una plataforma transversal para consultar, analizar y razonar sobre múltiples fuentes de datos distribuidas, sin mover ni duplicar la información, preservando la seguridad, gobernanza y trazabilidad, preservando la seguridad, gobernanza y trazabilidad, y habilitando productos escalables (p. ej., chats conversacionales, servicios de alertas, scoring de riesgo, asistentes de autoría para GEE/ArcGIS, envío de información, etc.). Como como producto mínimo viable (MVP), se entregará un chat de IA federado embebido en un app en Dash (Python), que permita a usuarios finales interactuar simultáneamente con las visualizaciones y con el asistente conversacional bajo los permisos correspondientes.
La consultoría deberá diseñar una arquitectura que se integre de forma nativa con el siguiente ecosistema de datos:
- Data Lake AWS (Amazon Athena, AWS Glue, Amazon S3 y Amazon RDS) con información tabular, documentos e imágenes.
- Google Drive con documentos no estructurados y semiestructurados (PDF, Word, Excel) y archivos multimedia (imagen, audio, video).
- Google BigQuery como data warehouse adicional con información tabular.
- ArcGIS Enterprise con geodatabases y contenidos geoespaciales (capas vectoriales, ráster/satelital y servicios).
- Otras aplicaciones en Google Earth Engine (GEE), ArcGIS Dashboards, Experience Builder y StoryMaps, con potencial de generar datos/resultados.
Este proyecto no busca construir una solución única, sino una plataforma de analítica federada potenciada por IA, cuyo funcionamiento será validado a través del MVP.
Nota aclaratoria: En el contexto de esta consultoría, el término IA Federada o RAG federado se refiere a la integración federada de analítica y capacidades de IA sobre múltiples fuentes de datos distribuidas, no al aprendizaje federado (entrenamiento de modelos en nodos distribuidos).
OBJETIVOS DE LA CONSULTORÍA
Objetivo general
Diseñar, implementar y documentar una Arquitectura de Analítica Federada potenciada por IA, segura, escalable y modular, que actúe como una plataforma transversal para la consulta y el análisis sobre el ecosistema de datos distribuidos de Solidaridad Network Colombia, sin centralizar la información. La viabilidad y el valor de esta arquitectura se demostrarán a través de la entrega de un Producto Mínimo Viable (MVP) completamente funcional: un chat de IA conversacional integrado en un dashboard de visualización.
Objetivos específicos
- Definir, justificar e implementar una Arquitectura de Analítica Federada potenciada por IA —modular, escalable y agnóstica de proveedor— que habilite consulta y cómputo cerca del dato sobre las fuentes priorizadas (AWS Athena/Glue/S3/RDS, Google BigQuery, Google Drive, ArcGIS Enterprise y GEE), incorpore RAG federado con citación verificable y geo-razonamiento, y establezca los cimientos de seguridad, gobernanza y observabilidad requeridos para operar múltiples productos.
- Definir, formalizar e implementar el marco de Gobernanza y Seguridad para la Arquitectura, alineado con las políticas institucionales y la normativa aplicable, que mapee permisos e identidades a los dominios AWS/GCP/Google Workspace/ArcGIS, garantice control de acceso basado en identidad y atributos (RBAC/ABAC), auditoría y trazabilidad de extremo a extremo, clasificación y minimización de datos, cifrado y calidad de metadatos, y establezca un proceso formal para incorporar nuevas fuentes y modelos en el tiempo. Producir un documento que defina el marco de gobernanza para la arquitectura. Este documento debe incluir: roles y responsabilidades (propietarios de datos, administradores de la plataforma), políticas de acceso a los datos, estándares de calidad de los metadatos para los agentes cliente, un catálogo de los «productos de datos» disponibles a través de la federación, y un proceso formal para incorporar nuevas fuentes de datos y modelos en el futuro.
- Diseñar, publicar e implementar un plano de interoperabilidad que exponga las capacidades de la Arquitectura mediante APIs y conectores estandarizados, permitiendo que nuevas soluciones (asistentes para GEE/ArcGIS, servicios de alertas, scoring, tableros Dash) consuman datos y resultados sin copiar ni centralizar información. Incluir cachés controlados (con TTL y políticas de invalidación) que no rompan el principio de no-duplicación.
- Diseñar, desarrollar y desplegar un MVP en producción controlada: un tablero interactivo (Dash) que visualice datos combinados de al menos cuatro fuentes federadas (Data Lake AWS, Google Drive, BigQuery y capas geoespaciales de ArcGIS) e incluya un componente de Chat de IA embebido (el cual deberá conectar los resultados de cálculos, KPIs, etc. Junto el análisis de datos no estructurados). El chat usará RAG federado (con citación verificable) y respetará RBAC/ABAC para responder en lenguaje natural sobre el contexto del tablero (filtros activos, selección espacial/geo).
- Realizar un proceso de transferencia constante a los ingenieros y analistas de datos de la organización los cuales proveerán X cantidad de horas de trabajo para el apoyo en el desarrollo de la arquitectura. Se debe crear un paquete de documentación completo que incluya: guías de instalación y configuración de cada componente, manuales de API, tutoriales de desarrollo para crear nuevos agentes cliente, y manuales de usuario para el MVP. Además, se deberán realizar sesiones de capacitación técnica (grabadas) para el equipo de TI y datos de Solidaridad.
METODOLOGÍA
La consultoría se ejecutará en fases iterativas con calidad incorporada, combinando planificación rigurosa con entregas ágiles y demostrables. Cada fase tiene actividades, entregables y criterios de salida medibles. El enfoque prioriza federación de consulta + RAG federado, integrando geoespacial (ArcGIS/GEE).
- Diagnóstico y definición de casos de uso:
- Se realizará una revisión exhaustiva del estado y la calidad de las plataformas a conectar y los datos disponibles en cada una de estas plataformas. Esta fase inicial es crítica para garantizar que las soluciones estén directamente alineadas con los objetivos estratégicos de la organización y sean técnicamente viables.
- Diagnóstico de madurez (nube, datos, GIS, identidad, seguridad).
- Se facilitarán talleres con las áreas programáticas para identificar y priorizar los casos de uso con mayor potencial de impacto (ej. alerta temprana de deforestación, mapeo de zonas de alto valor de conservación, entre otros).
- Los modelos de IA existentes serán aplicados o adaptados, sin entrenamiento federado distribuido, sino mediante integración federada de resultados.
- Diseño de arquitectura:
- Diseño de capas: federación/virtualización, RAG federado con citación, orquestación/LLMOps, exposición (APIs/SDK), observabilidad, seguridad y gobernanza.
- Geo-razonamiento: aplicar filtros espaciales y delegar operaciones a los motores en origen para rendimiento, gobernanza y citación trazable.
- Diagramas C4, ADRs (trade-offs: latencia vs. frescura; costo vs. precisión; lock-in vs. portabilidad).
- Implementación de arquitectura:
- Conectores y servicios federados: AWS (Athena/S3/RDS), BigQuery, Drive, ArcGIS, GEE.
- RAG federado: extracción de metadatos, chunking y vectorización por dominio, enforcement de permisos en retrieval.
- Geo-queries delegadas y agregaciones en servidor; citación con IDs/bounding box.
- Seguridad: RBAC/ABAC mapeado a IAM/Workspace/ArcGIS; cifrado en tránsito/recursos; safelogging; auditoría de consultas/respuestas.
- Observabilidad: métricas (latencia p95, tasa de citas válidas, uso por fuente), tracing y lineage.
- MVP:
- Construcción del tablero (Dash) con un chat de IA compuesto de 4 o más fuentes federadas
- Pruebas de paridad: consistencia entre cifras del visor y respuestas del chat.
- Pruebas con usuarios piloto; evaluación con preguntas canónicas (incluye geo).
- Prácticas transversales:
- Ágil: sprints de 2 semanas, demos y reviews con stakeholders; tablero de issues; showcases del MVP.
- Infra-as-Code (Terraform o equivalente) y CI/CD (conectores, prompts/plantillas, despliegues).
- Pruebas: unitarias, integración, contratos de API, evaluación de LLM (groundedness, exactitud percibida, cobertura).
- Seguridad y gobernanza by Design: mínimo privilegio, clasificación/retención, auditoría end-to-end.
- Observabilidad: métricas, logs saneados, tracing distribuido; paneles por fuente/servicio.
- Gestión de cambios y riesgos: matriz de riesgos, change log, comunicación semanal.
ALCANCE
La consultoría abarcará el diseño, implementación y documentación de una Arquitectura de Analítica Federada potenciada por IA, que permita consulta, análisis y cómputo sin centralizar información. La validez de la arquitectura se demostrará con un MVP en producción controlada: un tablero interactivo en Dash (Python) con chat de IA embebido que opera con RAG federado con citación verificable, control de acceso RBAC/ABAC y geo-razonamiento aplicado al contexto del tablero (filtros y selección espacial).
El enfoque deberá priorizar la sostenibilidad, escalabilidad y adopción de estándares abiertos, incorporando el flujo de datos y alineándose con los lineamientos de gobernanza de datos de la organización. Esta arquitectura facilitará el desarrollo de futuros productos que van más allá del planteamiento del MVP; se espera que esta solución sea la base para construir otro tipo de herramientas basadas en los resultados entregados por la IA federada.
El consultor trabajará de manera colaborativa con los equipos técnicos, analíticos y de soluciones digitales, garantizando la viabilidad operativa de las soluciones propuestas.
ENTREGABLES
- Diseño y gobernanza: documentación estratégica que define el «qué» y el «por qué» de la arquitectura.
- Diagnóstico y Casos de Uso: Informe de la madurez de las plataformas (AWS, GCP, ArcGIS, etc.) y los casos de uso priorizados (ej. alertas de deforestación).
- Diseño de Arquitectura: Documento maestro con los diagramas C4, las decisiones técnicas (ADRs) y el diseño de las capas (RAG, geo-razonamiento, APIs, etc.).
- Marco de Gobernanza y Seguridad: El «manual de reglas» de la plataforma. Define roles, políticas de acceso (RBAC/ABAC), estándares de metadatos, catálogo de datos y el proceso para añadir nuevas fuentes o modelos.
- Plataforma Central: infraestructura de backend implementada y funcional, lista para ser consumida.
- Código de Infraestructura: Scripts para desplegar toda la arquitectura de forma automática.
- Servicios y Conectores (APIs): Las APIs que exponen la capacidad de consulta federada y los conectores funcionales para cada fuente de datos (AWS, GDrive, BigQuery, ArcGIS, GEE).
- Componentes Federados: Los servicios centrales desplegados (motor de RAG, orquestación, servicio de seguridad, etc.).
- Paneles de Observabilidad: Dashboards de monitoreo que muestran la salud de la plataforma (latencia, uso por fuente, calidad de citas).
- MVP: aplicación funcional y completa según alcance con su respectiva documentación de apoyo.
- Aplicación MVP Desplegada: La URL funcional del tablero con el chat de IA embebido, operando en un entorno controlado.
- Código Fuente del MVP: El repositorio completo de la aplicación Dash.
- Informe de Validación: Documento que prueba que el MVP funciona como se espera, incluyendo:
- Pruebas de paridad (visor vs. chat).
- Validación de consultas (normales y geoespaciales).
- Verificación de la seguridad (RBAC/ABAC) y la citación verificable.
- Una API de servicio externa para futuros desarrollos que permita aprovechar el MVP en otros contextos.
- Transferencia y Sostenibilidad: Documentación, capacitación y transferencia del conocimiento para que el equipo de Solidaridad pueda operar, mantener y escalar la solución.
- Documentación Completa:
- Técnica: Guías de instalación, configuración y manuales de las APIs.
- Desarrollo: Tutoriales para crear nuevos conectores o consumir las APIs.
- Usuario: Manual de uso del tablero (MVP) para usuarios finales.
- Capacidad técnica instalada en el equipo según los roles, ingeniero de datos, devOps, fullstack, analista.
- Informe Final y Cierre: Documento de cierre del proyecto y acceso a los tableros de gestión (issues, riesgos, etc.).
TIEMPO PREVISTO Y PRESUPUESTO
El presupuesto y el tiempo de ejecución del proyecto deberá ser propuesto por el consultor o equipo consultor, de acuerdo con el alcance metodológico que planteen.
Durante la ejecución, Solidaridad Colombia asignará 15 horas de acompañamiento institucional (5 horas de un ingeniero de datos y 10 horas de un analista), orientadas a facilitar la entrega de información, la parametrización técnica y la orientación sobre los procesos internos relacionados con el manejo de datos y las diferentes fuentes de información.
APLICACIÓN
REQUISITOS MÍNIMOS PARA PARTICIPAR EN LA LICITACIÓN
Formación académica mínima del equipo:
Profesional en Ingeniería de Sistemas, Ciencias de la computación o áreas afines. Con especialización, maestría, PhD o formación certificada en Inteligencia Artificial, Ingeniería de Sistemas, Ciencias de la Computación o áreas relacionadas al desarrollo de productos basados en Inteligencia Artificial y seguridad.
El candidato debe demostrar conocimiento y experiencia práctica en el diseño e implementación de sistemas de datos complejos y soluciones de IA a escala, específicamente en:
- Arquitectura de Analítica Federada potenciada por IA: Experiencia demostrable en el diseño conceptual y la implementación de arquitecturas de consulta y analítica federada (federated analytics) o plataformas de IA que integren información desde múltiples fuentes sin centralizarla.. Esto incluye el conocimiento de los patrones arquitectónicos, los desafíos de la heterogeneidad de datos y la orquestación de ciclos de entrenamiento distribuido.
- Generación Aumentada por Recuperación (RAG) Federado: Experiencia específica en la implementación de sistemas RAG que operan sobre fuentes de datos distribuidas. El candidato debe probar que ha trabajado en soluciones que recuperan información de múltiples plataformas sin centralizarla, y que pueden generar respuestas con citación verificable para garantizar la trazabilidad y confianza.
- Geo-razonamiento en Sistemas Distribuidos: Experiencia en la integración de lógica geoespacial dentro de arquitecturas federadas. Esto implica la capacidad de delegar consultas espaciales (filtros, selecciones por área) a los motores de origen (como ArcGIS Enterprise o GEE) y luego agregar los resultados de manera coherente.
- Diseño de APIs y Planos de Interoperabilidad: Experiencia en la creación de capas de servicio (APIs, conectores) que exponen las capacidades de una plataforma de datos compleja de manera estandarizada, permitiendo que múltiples aplicaciones consuman los datos y análisis de forma segura y gobernada.
Se requiere experiencia práctica y profunda con las tecnologías que componen el ecosistema de datos de Solidaridad:
- Plataformas Cloud (AWS y Google Cloud):
- AWS: Dominio del ecosistema de datos de AWS, incluyendo Amazon S3 (almacenamiento), AWS Glue (catálogo de datos), Amazon Athena (consultas federadas) y Amazon RDS (bases de datos relacionales).
- Google Cloud: Experiencia sólida con Google BigQuery como data warehouse y con la API de Google Drive para el procesamiento de documentos no estructurados y multimedia.
- Plataformas Geoespaciales:
- ArcGIS Enterprise: Experiencia en la interacción programática con geodatabases y servicios de ArcGIS a través de sus APIs (por ejemplo, ArcGIS API for Python) para consultar y analizar capas vectoriales y ráster.
- Google Earth Engine (GEE): Conocimiento en el uso de GEE para análisis geoespacial, y preferiblemente, experiencia en la integración de sus resultados con otras plataformas.
- Desarrollo de Aplicaciones y Dashboards:
- Python y Dash: Nivel avanzado en Python y experiencia comprobada en el desarrollo de aplicaciones web interactivas y dashboards analíticos utilizando la librería Dash.
El candidato debe demostrar una mentalidad orientada a la producción, la seguridad y la sostenibilidad de la plataforma:
- Gobernanza de Datos en Entornos Federados: Experiencia en la definición e implementación de marcos de gobernanza para sistemas distribuidos. Esto incluye la creación de catálogos de datos, definición de roles (propietarios, custodios), y establecimiento de políticas de calidad de metadatos.
- Seguridad Multi-dominio: Experiencia en la implementación de modelos de seguridad como el Control de Acceso Basado en Roles (RBAC) y Atributos (ABAC), y la capacidad de mapear identidades y permisos a través de diferentes sistemas (AWS IAM, Google Workspace, ArcGIS).
- Infraestructura como Código (IaC): Experiencia en la automatización del despliegue de infraestructura utilizando herramientas como Terraform o AWS CloudFormation.
- CI/CD y Prácticas DevOps/MLOps: Experiencia en la creación de pipelines de integración y despliegue continuo para componentes de software y modelos de IA.
- Observabilidad: Experiencia en la implementación de soluciones de monitoreo para sistemas distribuidos, incluyendo la recolección de métricas de rendimiento (latencia, uso), tracing distribuido y logging centralizado.
Además de la capacidad técnica, se requiere experiencia en la gestión y entrega exitosa de proyectos complejos:
- Metodologías Ágiles: Experiencia trabajando en ciclos iterativos (sprints), realizando demostraciones funcionales y gestionando proyectos con herramientas de seguimiento de issues.
- Documentación Técnica y de Arquitectura: Habilidad para producir documentación clara y de alta calidad, incluyendo diagramas de arquitectura (modelo C4) y registros de decisiones de arquitectura (ADRs).
- Transferencia de Conocimiento: Experiencia previa en la capacitación de equipos técnicos, creación de tutoriales y manuales para asegurar la autonomía del cliente después de la finalización del proyecto.
NORMAS GENERALES DE CONTRATACIÓN
En todas las invitaciones a presentar ofertas se indicará si estas son rechazadas o si se ha producido alguna práctica ilegal o corrupta en relación con la adjudicación. En todos los contratos celebrados en el marco del proyecto el beneficiario de la subvención podrá anular el contrato si considera que se han producido prácticas ilegales o corruptas en relación con la adjudicación o ejecución del contrato.
DOCUMENTOS REQUERIDOS Y FECHA DE PRESENTACIÓN DE PROPUESTAS
Para aplicar a esta licitación, los participantes deben remitir a [email protected]), los siguientes documentos:
- Propuesta técnica
- Presupuesto – El proveedor de servicios /consultor considerará en su cotización, todos los gastos, impuestos, transporte y demás factores que puedan afectar el valor final de los estudios requeridos. Debe detallar el valor unitario sin IVA, valor del IVA y valor total, y la forma de pago. En la cotización se debe indicar que se aceptan los términos de referencia publicados para invitar a cotizar.
- Cronograma de actividades
- Experticia de la empresa consultora
Para la persona jurídica o persona natural seleccionada debe adjuntar los siguientes documentos, dependiendo del caso que aplique:
| Persona jurídica | Persona Natural |
| RUT | RUT |
| Copia del documento de identidad del representante legal | Copia del documento de identidad del proveedor o contratista |
| Certificación bancaria de la empresa proveedora o contratista | Certificación bancaria a nombre propio del proveedor o contratista |
| Certificado de existencia y representación legal | Formato de conocimiento de terceros persona natural |
| Formato de conocimiento de terceros persona jurídica | Formato de Habeas Data |
| Formato de Habeas Data | Acuerdo de confidencialidad |
| Acuerdo de confidencialidad | Declaración de causas de inhabilidad para participar de la licitación, firmada por el representante legal o quien tenga poderes de representación |
| Declaración de causas de inhabilidad para participar de la licitación, firmada por el representante legal o quien tenga poderes de representación |
La convocatoria permanecerá abierta hasta que se identifique y seleccione al candidato o equipo consultor que cumpla con el perfil y los requerimientos técnicos establecidos, o hasta que Solidaridad considere cubierta la necesidad.
La convocatoria cierra el 21 de noviembre de 2025
CRITERIOS DE SELECCIÓN
Los criterios para la selección del consultor o firma consultora serán los siguientes:
Calidad técnica de la propuesta (50%):
-Se evaluará la metodología propuesta asegurando que esté alineada con los objetivos de la consultoría.
-La propuesta deberá demostrar un entendimiento sólido de los desafíos del sector palma y de los enfoques sostenibles aplicados en el programa, con énfasis en la capacidad de adaptar las metodologías a la realidad local y las necesidades del programa.
Competitividad económica (35%):
-Se considerará el costo total de la consultoría en relación con el valor entregado. La evaluación incluirá la razonabilidad del presupuesto y su desglose detallado, asegurando que los recursos sean utilizados de manera eficiente y efectiva para alcanzar los resultados deseados.
Trayectoria comprobada (15%):
-Se evaluará la experiencia previa en el desarrollo de iniciativas tecnológicas que integren inteligencia artificial. De igual forma, el trabajo en proyectos de digitalización o tecnificación de organizaciones.
Consanguinidad: De conformidad con la política de Solidaridad aplicable, los candidatos con parientes (incluyendo cuarto grado de consanguinidad y segundo grado de afinidad, incluyendo cónyuge) que trabajan para la organización como funcionario o contractual de la fuerza contractual complementaria, no serán elegibles para proveer servicios a Solidaridad.