Bienvenidos ENOAN 2021
Para desarrollar Ciencia de Datos, además de las bases teóricas (álgebra lineal, probabilidad, estadística y optimización principalmente) es necesario manejar diferentes aspectos técnicos más cercanos al procesamiento de los datos. Un tema que se le suele no dar el valor necesario es al uso de las diversas herramientas que facilitan la labor de un Científico de Datos en su trabajo del día a día. Este curso tiene como objetivo dar a conocer y enseñar los usos básicos de algunas de estas herramientas que se han vuelto fundamentales en el desarrollo de proyectos de Ciencia de Datos: Uso de contenedores, manejadores de versiones, la línea de comandos de UNIX y las libretas Jupyter como medio de investigación reproducible.
1. J. Janssens. “Data Science at the Command Line”. O’Relly, Early Release, 2021.
2. C. Newham. “Learning de Bash Shell”. O’Relly, 1995.
3. J. Loeliger y J. McCullogh. “Version Control with Git: Powerful Tools and Techniques for Collaborative Software Development”. O’Relly, 2009
4. A. Mouat. “Using Docker: Developing and Deploying Software with Containers”. O’Relly, 2015.
Conocimiento básico de programación. El curso no asume muchos conocimientos previos por parte de los participantes.
Los participantes deben tener una computadora con permisos necesarios para instalar software a nivel administrador (Docker principalmente). En algunos con el sistema operativo Windows es necesario configurar los permisos de virtualización del BIOS. Si bien son pocos casos es necesario estar consciente de eso.