Workshop Big Data

Machine Learning

Organizadores:

Dr. Pedro Flores Pérez

Dra. Leticia Adriana Ramírez

Programa

HORA PONENCIA
10:30 - 11:00 Minería de Datos en el Hogar
Joshua Mendoza Jasso, Has-it SC.
11:00 - 11:30 Receso
12:30 - 13:30 Alpha Zero: Cómo y por qué funciona.
Julio Waissman Vilanova, Universidad de Sonora
13:00 - 13:30 Problemas de optimización en Big Data.
Joel Antonio Trejo Sánchez, CIMAT.
13:30 - 14:00 ¿Qué es blockchain y cómo funciona esta tecnología?
Juan Pablo Soto Barrera, Universidad de Sonora.
14:00 - 14:30 Uso de Big Data para la Generación de Información Pública.
José Alejandro Ruiz Sánchez, INEGI-Aguascalientes.

Miércoles 28 de agosto

Sala 4

10:30 – 11:00

Joshua Mendoza Jasso (Has-it SC)
Minería de datos en el hogar
Resumen

Pensemos que nuestro día a día puede ser visto mediante series de tiempo que indican cuanta energía estamos consumiendo, que nos puedan decir cuánta agua utilizamos en un mes y que además puedan indicarme la cantidad de gas que utilizamos por día. La tecnología, la minería de datos y la inteligencia artificial pueden ser herramientas que nos permitan en primera instancia analizar estas series de tiempo, en segundo lugar, preparar un modelo matemático para el análisis de estos datos y por último, extraer patrones de comportamiento de cada una de ellas.

12:30 – 13:00

Julio Waissman Vilanova (Universidad de Sonora)
Alpha Zero: Cómo y por qué funciona
Resumen

En mayo del 2017 el algoritmo AlphaGo fue el primer programa computacional en vencer al campeón mundial de Go. En octubre de 2017, Alpha Zero vence al algoritmo original de AlphaGo. Este nuevo algoritmo utiliza como información únicamente las reglas del juego y se entrena jugando contra él mismo. Para su desarrollo se utilizaron una combinación de métodos de inteligencia artificial que se utilizan en varias de las aplicaciones más actuales. En esta plática se dará una presentación general de Alpha Zero y se introducirán los métodos y la tecnología involucrada en su desarrollo.

13:00 – 13:30

Joel Antonio Trejo Sánchez (CIMAT)
Problemas de optimización en Big Data
Resumen

Hoy día se genera una gran de información de diversas fuentes, produciendo grandes volúmenes de datos (Big Data). El análisis y tratamiento de grandes volúmenes de datos representa un reto fundamental en la era tecnológica actual. En esta charla modelamos el problema de consultas en grandes volúmenes de datos como una variante del problema de cubrimiento de vértices, a la que se denomina cubrimiento de puntos de interés mínimo (Minimum Hub Cover). Dada una gráfica $G=(V,E)$, el problema de cubrimiento de puntos de interés mínimo consiste en encontrar un subconjunto $S$ de $V$ de cardinalidad mínima, de forma tal que los elementos de dicho subconjunto cumplen con ciertas características que los hacen idóneos para realizar consultas en grandes bases de datos. El problema del cubrimiento de puntos de interés, es un problema de optimización y pertenece a la clase de problemas NP-difícil. En esta charla mencionamos algunas estrategias para encontrar buenas soluciones para este problema

13:30 – 14:00

Juan Pablo Soto Barrera (Universidad de Sonora)
¿Qué es blockchain y cómo funciona esta tecnología?
Resumen

En esta charla hablaremos sobre la tecnología de blockchain, qué es, cómo funciona y cómo se está utilizando en el mercado. Hablaremos de algunas criptomonedas y casos de uso muy específicos que reflejan el alcance de esta tecnología.

14:00 – 14:30

José Alejandro Ruiz Sánchez (INEGI-Aguascalientes)
Uso de big data para la generación de información pública
Resumen

Las Oficinas de Estadística (OE) alrededor del mundo tienen la tarea de proveer de información oportuna que ayude a la sociedad y a los gobiernos a tomar las mejores decisiones posibles. Tradicionalmente la recopilación de información se ha realizado a través de encuestas, censos y registros administrativos; sin embargo, cada vez son más comunes las solicitudes de información con un mayor desglose espacial y granularidad temporal; por otro lado, el producir encuestas o censos con estas características resultaría en costos prohibitivos, por lo que las OE han comenzado a utilizar y experimentar con nuevas fuentes de información como lo son las redes sociales, páginas web, transacciones comerciales, imágenes satelitales, entre otras. En este sentido es que el INEGI está llevando a cabo estudios de casos en los que la información en grandes volúmenes puede contribuir a generar información pública con mayor oportunidad. Dentro de estos ejercicios se encuentran los proyectos “Estado de ánimo de los tuiteros en México”, “Cubo de datos geoespaciales” y “Afectaciones Económicas y de Movilidad causadas por el sismo de septiembre de 2017”.