El archivo microplastico_Matlab_porlitro.xlsx
contiene datos de las concentraciones de microplásticos de diversos tamaños (fragmentos y fibras) medidos en diversas localizaciones durante una campaña de muestreo realizada en 2019.
Cada fila del archivo corresponde a una observación, para la que se recoge la fecha en que se realizaron las medidas, la estación (el lugar de la observación, caracterizado por su longitud y latitud), así como los valores de profundidad, presión, temperatura, salinidad y campo de velocidades en el momento de realizar las medidas.
Con esta información:
Realizar un análisis descriptivo de las distintas variables: valores mínimo y máximo, medias, desviaciones típicas, etc., globalmente y por estación.
Utiliza un modelo de regresión lineal simple para evaluar si existe asociación entre la concentración de fibras y la de microfragmentos.
Clasifica las profundidades en 4 niveles (p.ej., <50, entre 50 y 150, de 150 a 250 y más de 250, o cualquier otra agrupación de valores que resulte razonable). Utiliza el análisis de la varianza para decidir si existen diferencias significativas en las concentraciones de microplásticos (analiza por separado fibras y fragmentos) según estación y nivel de profundidad.
Incluye el nivel de profundidad y la estación como factores en el modelo que has ajustado en el punto 2, es decir, construye un modelo de análisis de la covarianza para la relación entre fibras y fragmentos evaluando si dicha asociación se ve afectada por la profundidad o la estación.
Construye un modelo de regresión múltiple para predecir la concentración de fibras en función de la profundidad, la presión, la temperatura y la salinidad. ¿Resulta significativa alguna variable en este modelo?
Incluye el mes del año y la estación como factores en el modelo anterior, e interpreta el modelo de análisis de la covarianza resultante (esto es, ¿depende linealmente la concentración de fibras de las variables continuas citadas? ¿Esa dependencia, en caso de existir, cambia con la localización o la fecha?)
Repite las dos cuestiones anteriores utilizando la concentración de fragmentos como variable respuesta.
Construye un modelo de regresión múltiple en el que la variable respuesta sea la concentración de fragmentos y las variables explicativas sean las que definen el campo de velocidades. Utiliza un método paso a paso para simplificar el modelo resultante y quedarte solo con aquellas variables cuyo efecto resulte significativo. ¿Mejora el modelo si se introducen además las variables utilizadas en el punto 6? Interpreta los resultados.
El siguiente código permite dibujar un mapa de la región. Para trazar la linea de costa de las islas y de África hay que descargar el archivo gshhg-bin-2.3.7.zip
de la web https://www.ngdc.noaa.gov/mgg/shorelines/data/gshhg/latest/ y descomprimirlo en la carpeta gshhg
desde la que el siguiente código lee el archivo gshhs_f.b
que contiene la región de Canarias:
# Librerías para dibujar mapas
library(tidyverse)
library(rnaturalearth)
library(sf)
library(readxl)
# Leo las lineas de costa
costas <- ne_countries(returnclass="sf")
microplasticos <- read_excel("datos/microplastico_Matlab_porlitro.xlsx")
# Dibujamos el mapa de forma que quede contenida esta región
library(maptools)
gshhs.f.b <- "gshhg/gshhs_f.b"
shore <- getRgshhsMap(gshhs.f.b, xlim = c(-19,-13), ylim = c(27,30))
## Data are polygon data
## Rgshhs: clipping 1 of 1 polygons ...
## Data are polygon data
shore <- fortify(shore)
mapa <- microplasticos %>%
ggplot(aes(y=Latitude, x=Longitude)) +
geom_point() +
geom_tile() +
geom_polygon(data = shore, aes(x=long, y = lat, group = group), color = "grey50", fill = "salmon") +
coord_quickmap(xlim=c(-19,-13), ylim=c(27, 30)) +
labs(title="Canary Islands", subtitle="Cruise Locations",
x="Longitude", y="Latitude", fill="SST (ºC)") +
theme(panel.background = element_rect(fill = "#abf3fb")) # Color del fondo
mapa
# Si se dispusiera de datos del campo de velocidades para cada punto del mapa, podrían añadirse mediante:
mapa +
geom_sf(data=velocity_field,aes(y=Latitude,x=Longitude,fill=velocity))
theme_light() +
scale_fill_distiller(palette='Spectral',breaks=15:22) +
guides(fill = guide_colourbar(barwidth = 25,
barheight = 0.5,
title.position = "left",
title.vjust = .1)) +
theme(legend.position="bottom")
Se puede incluir en el informe cualquier otro aspecto de interés que se detecte en estos datos. Para la presentación se valorará la elaboración de las tablas y gráficos adecuados y correctamente elaborados.