Intro a Data Analytics en Geociencias con Python

Módulo 0: Introducción a Python.

Con este módulo aprenderás a instalar y configurar un ambiente de desarrollo en Python, que te va a permitir ejecutar scripts, instalar librerías externas y generar tus propias aplicaciones fácilmente.

Tópicos:

  • Definición de Python
  • Instalación y configuración del ambiente desarrollo Python
  • Ejecución Scripts en Python
  • Principales estructuras de datos nativas en Python
  • Principales librerías en la ciencia de datos
  • Distribución de aplicaciones

Duración : 6:35 min.
Duración Práctica : 30 min.
Complejidad : Baja

Recursos

Módulo 1: Carga de datos en Python.

En este módulo aprenderás a cargar un archivo de muestras (csv o xlsx) en pandas a través de su DataFrame.

Tópicos:

  • Importación librería pandas.
  • Estructura de Datos: DataFrame.
  • Lectura de archivos con DataFrame: read_csv, read_excel.
  • Exportación DataFrame a archivo: to_csv, to_xlsx.

Duración : 3:30 min.
Duración Práctica : 20 min.
Complejidad : Baja

Recursos

Módulo 2: Despliegue de datos y estadísticas básicas.

En este módulo aprenderás a visualizar espacialmente variables continuas y/o categóricas en Plotly a través de un DataFrame en Pandas. Aprenderás a generar estadísticas básicas sobre tus datos de entrada, así como también filtrar tus datos. Finalmente se exportarán los resultados.

Tópicos:

  • Importación librerías: pandas, numpy y plotly.
  • Descripción del contenido DataFrame al cargar muestras.
  • Visualización espacial de variables continuas y categóricas.
  • Estadísticas básicas.
  • Generación de operaciones lógicas para filtros.
  • Exportación resultados.

Duración : 7:38 min.
Duración Práctica : 30 min.
Complejidad : Media

Recursos

Módulo 3: Búsqueda de controles geológicos.

En este módulo aprenderás a determinar los atributos geológicos (Alteración, Zona Mineral, Dominio) que tengan algún control sobre la variable de interés (Bornita).

Tópicos:

  • Importación librerías: pandas, plotly, probscale, matplotlib.
  • Estadísticas básicas (globales).
  • Estadísticas básicas por categoría con groupby.
  • Gráficos de distribución acumulada por categoría (Probplot).
  • Exportación de gráficos 2D con matplotlib.
  • Visualización espacial por población de variables.

Duración : 10:55 min.
Duración Práctica : 30 min.
Complejidad : Media

Recursos

Módulo 4: Definición de unidad de estimación

En este módulo aprenderás a crear una unidad de estimación, a través de la definición de una nueva variable (columna) en nuestro DataFrame (pandas). Posteriormente, mediante operaciones lógicas, podrás crear nuevos códigos geológicos sujeto a las variables: alteración, zona mineral y dominio.

Tópicos:

  • Importación librerías: pandas, plotly, probscale, matplotlib.
  • Creación de nuevas columnas en DataFrame.
  • Iteración sobre DataFrame mediante iterrows().
  • Modificación de valores en el DataFrame mediante loc[].
  • Visualización espacial.

Duración : 08:56 min.
Duración Práctica : 45 min.
Complejidad : Alta

Recursos

Módulo 5: Validación de UG

En este módulo aprenderás a validar una definición de unidad geológica, a través de la construcción de un conjunto de gráficos en Python, tales como: Histogramas, Boxplots y finalmente, un Scatter entre la Medía y Desviación Estándar

Tópicos:

  • Importación librerías: pandas, plotly, probscale, matplotlib.
  • Estadísticas básicas por UG con groupby.
  • Gráficos de distribución acumulada por categoría (Probplot).
  • Visualización espacial.
  • Histogramas por UG (pandas -> hist).
  • Boxplot por UG (pandas -> boxplot).
  • Scatter: Media v/s STD.

Duración : 09:02 min.
Tiempo aprox a emplear : 30 min.
Complejidad : Media

Recursos

Módulo 6: Análisis Multivariable.

En este módulo aprenderás a realizar un análisis multivariable sobre las variables continúas, a través de la construcción de un conjunto de gráficos en Python, tales como: Matriz de correlación, Scatter y Media Condicional (o derivas).

Tópicos:

  • Importación librerías: pandas, seaborn, plotly, probscale, matplotlib.
  • Matriz de correlación a través del método corr (Pandas – DataFrame).
  • HeatMap de la Matriz correlación (seaborn).
  • Scatter entre variables continuas agrupadas por la unidad geológica.
  • Media Condicional (o Derivas) en la coordenada East.
  • Visualización espacial.
  • Gráficos de distribución acumulada por categoría (Probplot).

Duración : 08:27 min.
Tiempo aprox a emplear : 45 min.
Complejidad : Alta

Recursos

Módulo 7: Exportación y generación de reporte.

En este módulo haremos un énfasis a los métodos en Pandas y Matplotlib que nos permiten exportar nuestros resultados.

Tópicos:

  • Exportación DataFrame a archivo: to_csv.
  • Exportación Gráficos a imagen (png o jpg): savefig.

Duración : 04:05 min.
Tiempo aprox a emplear : 15 min.
Complejidad : baja

Recursos
es_CL