Documento no encontrado! Por favor, inténtelo de nuevo

Dirección Nacional de Datos e Información Pública

Consumo vía API. (acceso programático a los datos). Page 24. Generación de valor. Page 25. Valor agregado sobre los Datos. Exploración y análisis de los.
5MB Größe 36 Downloads 47 vistas
Dirección Nacional de Datos e Información Pública Subsecretaría de Innovación Pública y Gobierno Abierto Ministerio de Modernización

Dr. Martin Elias Costa Analista de datos @meliascosta Lic. Natalia Sampietro Dir. de Datos públicos @nasampietro

Dirección de Datos Públicos

Objetivos: - Mejorar la gestión de la información pública - Mejorar la apertura de la información pública - General valor agregado a partir de los datos

Para mejorar la gestión

Gestión de Datos e Información Infraestructura. Generación del contexto propicio para una gestión eficiente de datos e información. (contexto humano, normativo, tecnológico, etc.)

Gestión de Datos e Información Metodologías. Identificación e integración de distintas fuentes de datos, favoreciendo la interoperabilidad entre las mismas.

Guías de Buenas Prácticas

Guías de Buenas Prácticas

Para mejorar la apertura

¿Qué son datos abiertos? ● Disponibles y accesibles (se bajan de internet) ● Reutilizables y redistribuibles (los términos de uso son permisivos y los datos son legibles por una PC) ● Público universal (todos pueden usarlos)

Una parte del movimiento “open” ● ● ● ● ●

Software de código abierto Ciencia abierta Educación abierta Gobierno abierto etc.

El caballito de batalla del dato abierto

Otros portales.

La estrategia de integración.

Otros portales.

La estrategia de integración.

La estrategia de integración.

Fuentes de datos

Nacionales Portal Nacional Datos de áreas específicas: Min. Justicia , Min. CyT , Min. Energía, Min. Agroindustria, Arsat, PAMI, Ente Nac. de Comunicaciones Datos geoespaciales: IDERA, CONAE Datos socioeconómicos: INDEC, Ss. de Programación Macroeconómica

Internacionales https://github.com/caesar0301/awesome-public-datasets

Consumo vía API (acceso programático a los datos)

Generación de valor

Valor agregado sobre los Datos Exploración y análisis de los datos para la generación de producto interno y externo. Promoviendo la participación de reutilizadores internos y externos.

Tres ejemplos: Precios, Preguntas del congreso y Monitoreo de Aedes

Procesamiento del Lenguaje Natural en el Congreso

PLN Preguntas en el Congreso ¿Cómo organizar esta información no estructurada? Jefatura de Gabinete

Informes al Co ngreso

Pregun

tas de

legisla

dores

PLN Preguntas en el Congreso ¿Cómo puedo categorizar las preguntas que recibo eficientemente? Etiquetado automático ¿Cómo puedo saber si ya respondí preguntas similares? Búsqueda de textos similares

PLN Vectorización de textos En cuanto al relevamiento de la recuperación de armas de fuego y municiones, indique como fue realizada esa recuperación teniendo en cuenta: -por cada provincia -por tipos de armas de fuego por municiones considerando cada tipo aclarando quienes han sido las personas que hicieron la entrega de las mismas;si eran "legales" y cuántas provenían del "mercado gris" (armas no registradas ni usadas para delinquir") y del negro; las recibidas por el programa de entrega voluntaria;como las incautadas por cuestiones administrativas y aquellas miles enviadas por los poderes judiciales con orden de destrucción.

TF - IDF

PLN Vectorización de textos

Palabras con mayor TFIDF En cuanto al relevamiento de la recuperación de armas de fuego y municiones, indique como fue realizada esa recuperación teniendo en cuenta: -por cada provincia -por tipos de armas de fuego por municiones considerando cada tipo aclarando quienes han sido las personas que hicieron la entrega de las mismas;si eran "legales" y cuántas provenían del "mercado gris" (armas no registradas ni usadas para delinquir") y del negro; las recibidas por el programa de entrega voluntaria;como las incautadas por cuestiones administrativas y aquellas miles enviadas por los poderes judiciales con orden de destrucción.

armas municiones recuperación entrega fuego destrucción miles legales tipos registradas

PLN Búsqueda de textos similares Cosine similarity

PLN Etiquetado automático Support Vector Machines

Con 700 casos de entrenamiento se logra una performance del 80% de etiquetas correctas entre las primeras 5 de 20 opciones (50% para la primera opción).

PLN Una herramienta

PLN Una herramienta

Etiquetado asistido por SVM (mejora con el tiempo)

PLN el código

https://github.com/datosgobar/textar

Monitoreo de Aedes

¿Qué es un sensor de ovipostura? El ovisensor es un dispositivo que permite detectar la presencia del mosquito Aedes Aegypti en un área dada.

Huevos de Aedes

Todas las semanas debe revisarse la lengüeta que se encuentra dentro del recipiente para relevar la presencia de huevos de mosquito.

¿Cómo funciona el sistema de relevamiento de CABA? Análisis automático 

ODK collect

ODK collect

Google Fusion Tables

ODK collect

Análisis automático ¿Cómo funciona? 1) Identificación del bajalengua 2) Segmentación de objetos potenciales 3) Clasificación

Identificación del bajalenguas Imagen original

Detección de bordes

Detección de rectas

Detección de regiones candidatas Segmentación por umbral variable:

Detección de regiones candidatas Al encontrar una región con propiedades compatibles: -

Area Convexidad Aspect ratio

Se crea un template

Detección de regiones candidatas Para regiones de muchos candidatos contiguos: -

Prueba con templates de cantidad variable: Maxima Correlacion

Clasificación Por ahora el algoritmo funciona solo con umbrales simples en la correlación con los templates y el contraste de la región. Pero la idea es agregar algunas propiedades más y entrenar un clasificador.

El código (beta) https://github.com/datosgobar/detector-aedes

Herramientas usadas:

Seaborn

Gracias!

http://datos.gob.ar

https://twitter.com/datosgobar

https://datosgobar.github.io/