Planteamiento del problema 1
¡Bienvenidos Participantes!
Estamos emocionados de tenerlos con nosotros en este TechSprint enfocado en mejorar la participación ciudadana y la comprensión de los gastos gubernamentales a través de un chatbot conversacional impulsado por IA. Esta documentación proporciona una visión general del planteamiento del problema, los objetivos de negocio, el estado actual, la visión del estado futuro y los recursos disponibles para ustedes. ¡Vamos a sumergirnos!
Planteamiento del problema
¿Cómo podemos ayudar a los ciudadanos a entender mejor y más fácilmente cómo los gobiernos planifican, recaudan, gastan e invierten los recursos públicos a través de un chatbot conversacional impulsado por IA para mejorar la rendición de cuentas?
Los gobiernos gestionan vastos recursos públicos y los ciudadanos deben comprender estas actividades para fomentar la transparencia y la rendición de cuentas. Su tarea consiste en mejorar la participación ciudadana aprovechando un chatbot impulsado por IA para simplificar y aclarar la información del gasto del gobierno.
Objetivos de Negocio
-
Aumentar la Participación Ciudadana:
- Mejorar la plataforma MapaInversiones con respuestas rápidas a las consultas ciudadanas, impulsadas por IA.
- Crear una interfaz intuitiva que facilite la interacción.
-
Promover la Transparencia y la Rendición de Cuentas:
- Utilizar análisis impulsados por IA para analizar datos complejos de presupuestos, gastos y contrataciones gubernamentales.
-
Simplificar la Terminología Técnica:
- Traducir y simplificar términos técnicos gubernamentales para aumentar la conciencia ciudadana y la adopción de la plataforma.
-
Mejorar la Experiencia del Usuario:
- Integrar el chatbot con plataformas populares como WhatsApp.
- Ofrecer soporte multilingüe y opciones de accesibilidad.
-
Facilitar la Retroalimentación y la Participación del Usuario:
- Permitir que los usuarios proporcionen información sobre proyectos gubernamentales, presenten quejas y suban imágenes relacionadas con los recursos públicos a través del chatbot.
Estado Actual (Baseline)
- Prototipo Experimental:
- El chatbot de IA actual se basa en grandes modelos lingüísticos (LLM) que utilizan Langchain y Databricks (Delta Lake).
Visión del Estado Futuro
-
Interacciones en Lenguaje Natural:
- Facilitar interacciones que expliquen y resuman información sobre inversiones públicas, presupuestos y contrataciones.
-
Integración con Fuentes de Datos:
- Conectar el chatbot con fuentes de datos relacionales (RDBMS) y no relacionales (archivos PDF) para responder preguntas relevantes.
-
Generación de Contenidos Dinámicos:
- Permitir que el chatbot genere gráficos dinámicos, tablas explicativas y análisis.
-
Trazabilidad:
- Proporcionar trazabilidad de los recursos públicos en función de las consultas de los usuarios.
-
Mejor Educación Ciudadana:
- Mejorar la educación, comprensión y participación ciudadana haciendo la información fácilmente comprensible.
-
Integración con Redes Sociales:
- Posibilidad de comunicarse con el chatbot a través de WhatsApp.
-
Historial de Chat:
- Implementar una función de historial de chat para que los usuarios revisen interacciones pasadas.
-
Soporte Multilingüe Automatizado:
- Ofrecer soporte multilingüe automatizado y características de accesibilidad.
Brechas
-
Optimización de la Fiabilidad:
- Agregar mecanismos de evaluación y seguimiento para los resultados de los LLM para monitorear y mejorar la fiabilidad.
-
Mejoras en el Tiempo de Respuesta:
- Mejorar los tiempos de respuesta para una interacción más fluida.
-
Evolución Continua:
- Mantener el ritmo con los avances en LLM para mejorar la seguridad, fiabilidad y estabilidad.
-
Estrategia de Selección de Cadenas de LLM:
- Refinar las estrategias para optimizar la fiabilidad de los LLM y minimizar errores.
-
Soporte para Varios Formatos:
- Asegurar la compatibilidad con diferentes formatos de entrada/salida (CSV, XLS, PDF, imágenes, texto, gráficos).
-
Compatibilidad con Estándares Internacionales:
- Asegurar la compatibilidad con los estándares internacionales de datos abiertos y repositorios.
Resultados Propuestos
- Nueva Versión del Prototipo:
- Desarrollar una nueva versión del prototipo de chatbot de IA con código fuente, documentación y especificaciones de interoperabilidad.
- Asegurar la precisión de las pruebas basadas en un conjunto de datos de validación.
Público Objetivo
- Ciudadanos
- Ciudadanos y organizaciones informadas
- Periodistas de investigación
Pautas Técnicas
-
Comparación de LLMs:
- Utilizar LLMs líderes como OpenAI, Llama2 y Mistral.
-
Técnicas de Consulta de Datos Tabulares:
- Utilizar consultas basadas en SQL, Cadena de Pensamiento, Agentes de DataFrame y Langgraph para la interacción con datos.
-
Marcos de Desarrollo:
- Aprovechar Langchain, Langsmith, Llama Index y Truera para desarrollar y monitorear aplicaciones impulsadas por LLM.
-
Tecnologías de Datos:
- Emplear SQL, Databricks, Data Lake y Delta Lake para la gestión de datos.
Recursos Proporcionados
-
Conjuntos de Datos: Los participantes utilizarán los conjuntos de datos de República Dominicana y Paraguay para construir prototipos y el conjunto de datos de validación para medir la precisión del rendimiento.
-
Conjunto de Datos de Validación contiene: Descargar aquí
- Preguntas relevantes y bien formuladas en el contexto de la inversión pública. Estas preguntas han sido recopiladas de diversas audiencias como ciudadanos, funcionarios gubernamentales, ciudadanos interesados, periodistas, académicos, etc., para evaluar cómo funciona la herramienta con diferentes puntos de vista y consultas a niveles tanto técnicos como no técnicos.
- Consulta: Consultas dentro del conjunto de datos que contienen información que responde parcial o completamente a la pregunta.
- Respuesta de la Consulta: Información resultante de la consulta. Esta información se obtiene de la fuente de datos institucional.
- Respuesta en Texto: Respuesta en lenguaje natural para el usuario.
-
Cómo Descargar los Datos:
- Navegue a la página de conjuntos de datos del portal y filtre por país, seleccione República Dominicana y descargue los 3 conjuntos de datos. Siga el mismo proceso para Paraguay. El conjunto de datos de validación contiene las preguntas y respuestas para República Dominicana (DOM) y Paraguay (PY).
-
-
Recursos de Desarrollo:
- Repositorio de GitHub: Cree un clon privado del repositorio del Portal de Datos de MapaInversiones e invite a los siguientes miembros del equipo de soporte técnico:
- @carolesaz
- @anyelamilena12
- @Mikanebu
- @jorge-py
- @vlasvlasvlas
- @Darkhan1019
- @Lidiaproykina
- @RonaldojCampos
- Servidor de Discord: Utilice los canales designados para la comunicación directa con el equipo técnico y los usuarios/probadores. Se ha enviado una invitación para unirse al servidor a todos los equipos competidores.
- Repositorio de GitHub: Cree un clon privado del repositorio del Portal de Datos de MapaInversiones e invite a los siguientes miembros del equipo de soporte técnico:
-
Recursos de Datos Adicionales:
- Portal de Datos Abiertos de la República Dominicana: Link
- Estándar de Datos de Contratación Abierta de la República Dominicana: Link
- EMERGENCIAS - Procesos de Compras de la República Dominicana: Link
- EMERGENCIAS - Contratos de Compras de la República Dominicana: Link
- Portal de Datos Abiertos de Paraguay: Link
Empezando
-
Familiarícese con el planteamiento del Problema:
- Comprenda los desafíos actuales y la visión futura para el chatbot de IA.
-
Revise los Recursos y Datos Proporcionados:
- Explore las herramientas, documentación y conjuntos de datos proporcionados para apoyar sus esfuerzos de desarrollo.
-
Formule su Enfoque:
- Desarrolle un plan para abordar el planteamiento del problema, aprovechando los recursos y herramientas disponibles.
-
Colabore e Innove:
- Trabaje en estrecha colaboración con su equipo y aproveche el equipo de soporte del TechSprint para desarrollar un prototipo innovador.
¡Por favor, no dude en contactarnos si tiene alguna pregunta! ¡Feliz programación!