Intro a Data Analytics en Geociencias con Python
Módulo 0: Introducción a Python.
Con este módulo aprenderás a instalar y configurar un ambiente de desarrollo en Python, que te va a permitir ejecutar scripts, instalar librerías externas y generar tus propias aplicaciones fácilmente.
Tópicos:
- Definición de Python
- Instalación y configuración del ambiente desarrollo Python
- Ejecución Scripts en Python
- Principales estructuras de datos nativas en Python
- Principales librerías en la ciencia de datos
- Distribución de aplicaciones
Duración : 6:35 min.
Duración Práctica : 30 min.
Complejidad : Baja
Recursos
Módulo 1: Carga de datos en Python.
En este módulo aprenderás a cargar un archivo de muestras (csv o xlsx) en pandas a través de su DataFrame.
Tópicos:
- Importación librería pandas.
- Estructura de Datos: DataFrame.
- Lectura de archivos con DataFrame: read_csv, read_excel.
- Exportación DataFrame a archivo: to_csv, to_xlsx.
Duración : 3:30 min.
Duración Práctica : 20 min.
Complejidad : Baja
Recursos
Módulo 2: Despliegue de datos y estadísticas básicas.
En este módulo aprenderás a visualizar espacialmente variables continuas y/o categóricas en Plotly a través de un DataFrame en Pandas. Aprenderás a generar estadísticas básicas sobre tus datos de entrada, así como también filtrar tus datos. Finalmente se exportarán los resultados.
Tópicos:
- Importación librerías: pandas, numpy y plotly.
- Descripción del contenido DataFrame al cargar muestras.
- Visualización espacial de variables continuas y categóricas.
- Estadísticas básicas.
- Generación de operaciones lógicas para filtros.
- Exportación resultados.
Duración : 7:38 min.
Duración Práctica : 30 min.
Complejidad : Media
Recursos
Módulo 3: Búsqueda de controles geológicos.
En este módulo aprenderás a determinar los atributos geológicos (Alteración, Zona Mineral, Dominio) que tengan algún control sobre la variable de interés (Bornita).
Tópicos:
- Importación librerías: pandas, plotly, probscale, matplotlib.
- Estadísticas básicas (globales).
- Estadísticas básicas por categoría con groupby.
- Gráficos de distribución acumulada por categoría (Probplot).
- Exportación de gráficos 2D con matplotlib.
- Visualización espacial por población de variables.
Duración : 10:55 min.
Duración Práctica : 30 min.
Complejidad : Media
Recursos
Módulo 4: Definición de unidad de estimación
En este módulo aprenderás a crear una unidad de estimación, a través de la definición de una nueva variable (columna) en nuestro DataFrame (pandas). Posteriormente, mediante operaciones lógicas, podrás crear nuevos códigos geológicos sujeto a las variables: alteración, zona mineral y dominio.
Tópicos:
- Importación librerías: pandas, plotly, probscale, matplotlib.
- Creación de nuevas columnas en DataFrame.
- Iteración sobre DataFrame mediante iterrows().
- Modificación de valores en el DataFrame mediante loc[].
- Visualización espacial.
Duración : 08:56 min.
Duración Práctica : 45 min.
Complejidad : Alta
Recursos
Módulo 5: Validación de UG
En este módulo aprenderás a validar una definición de unidad geológica, a través de la construcción de un conjunto de gráficos en Python, tales como: Histogramas, Boxplots y finalmente, un Scatter entre la Medía y Desviación Estándar
Tópicos:
- Importación librerías: pandas, plotly, probscale, matplotlib.
- Estadísticas básicas por UG con groupby.
- Gráficos de distribución acumulada por categoría (Probplot).
- Visualización espacial.
- Histogramas por UG (pandas -> hist).
- Boxplot por UG (pandas -> boxplot).
- Scatter: Media v/s STD.
Duración : 09:02 min.
Tiempo aprox a emplear : 30 min.
Complejidad : Media
Recursos
Módulo 6: Análisis Multivariable.
En este módulo aprenderás a realizar un análisis multivariable sobre las variables continúas, a través de la construcción de un conjunto de gráficos en Python, tales como: Matriz de correlación, Scatter y Media Condicional (o derivas).
Tópicos:
- Importación librerías: pandas, seaborn, plotly, probscale, matplotlib.
- Matriz de correlación a través del método corr (Pandas – DataFrame).
- HeatMap de la Matriz correlación (seaborn).
- Scatter entre variables continuas agrupadas por la unidad geológica.
- Media Condicional (o Derivas) en la coordenada East.
- Visualización espacial.
- Gráficos de distribución acumulada por categoría (Probplot).
Duración : 08:27 min.
Tiempo aprox a emplear : 45 min.
Complejidad : Alta
Recursos
Módulo 7: Exportación y generación de reporte.
En este módulo haremos un énfasis a los métodos en Pandas y Matplotlib que nos permiten exportar nuestros resultados.
Tópicos:
- Exportación DataFrame a archivo: to_csv.
- Exportación Gráficos a imagen (png o jpg): savefig.
Duración : 04:05 min.
Tiempo aprox a emplear : 15 min.
Complejidad : baja