El archivo sharks.xlsx
contiene datos de 8443 tiburones capturados en Australia entre los años 2001 y 2014.
Cada fila de este archivo corresponde a un tiburón capturado, y contiene las siguientes variables:
Especie
Fecha de Captura
Área: área geográfica donde se realizó la captura
Latitud y Longitud del punto en que fue capturado el tiburón
Longitud en metros
Peso en kg
Sexo: M (Male, macho), F (Female, hembra)
Temperatura del agua en ºC en la zona de captura.
El objetivo del trabajo de análisis de datos es elaborar un informe en el que se describan las características principales de estas variables y se analicen las relaciones entre ellas. Los aspectos que pueden resultar de mayor interés son los siguientes:
Descripción de datos: Número y proporción de ejemplares de cada especie.
Descripción de datos: Características (media, desviación típica, mediana, cuartiles, máximo, mínimo, etc) del peso y longitud de las especies más abundantes.
Asociación entre longitud y peso en dichas especies. Para ello puedes dibujar un diagrama de nube de puntos para cada especie y añadir la linea de regresión peso-longitud. Utiliza el análisis de la covarianza para decidir si dicha relación es la misma en las distintas especies o se aprecian diferencias. Estudia también si en dicha relación interviene el sexo del ejemplar, o la temperatura del agua.
¿Se asocia la temperatura del agua con el tamaño del animal? Define una nueva variable con las temperaturas agrupadas (hasta 20º, de 20º a 24º, de 24º a 28º, más de 28º) y utiliza el análisis de la varianza para decidir si hay diferencias en tamaño asociadas a la temperatura.
Construye un modelo para predecir el número de ejemplares por mes para las 10 especies más abundantes, utilizando como variables explicativas la latitud, la longitud (geográfica) y la temperatura del agua. ¿Qué puedes concluir a partir de este modelo?
Variación temporal: atendiendo a las cinco especies más abundantes, ¿se observa variación temporal, esto es, aumento o disminución de las capturas con el tiempo?
Variación espacial: ¿se detectan más ejemplares de una especie que de otra según áreas geográficas? Construir una tabla con la proporción de tiburones de cada una de las cinco especies más frecuentes en las distintas zonas de muestreo. En particular, sería interesante situar los puntos de captura sobre un mapa, como se muestra a continuación:
# Librerías para dibujar mapas
library(rnaturalearth)
library(sf)
library(readxl)
# Leo las lineas de costa
costas <- ne_countries(returnclass="sf")
tiburones <- read_excel("datos/sharks.xlsx")
# Puntos correspondientes a las posiciones de los tiburones BULL WHALER
# y TIGER SHARK
bullTiger <- tiburones %>%
filter(`Species Name`%in%c("BULL WHALER","TIGER SHARK")) %>%
select(Longitude,Latitude,`Species Name`) %>%
filter(!is.na(Longitude)&!is.na(Latitude))
# Miramos el rango de coordenadas de longitud y latitud
bullTiger %>%
summarize(longitud=range(Longitude), latitud=range(Latitude))
## # A tibble: 2 × 2
## longitud latitud
## <dbl> <dbl>
## 1 118. -28.0
## 2 154. 28.2
# Dibujamos el mapa de forma que quede contenida esta región
# (hago el mapa algo más grande para que entre Australia)
ggplot()+
geom_sf(data = costas, color = "black",fill="lightsalmon3") +
coord_sf(xlim=c(110,154),ylim=c(-37,29))
# Convertimos las posiciones de los tiburones a coordenadas geográficas:
posiciones <- st_as_sf(bullTiger,
coords=c("Longitude","Latitude"),
crs=4326)
# Dibujamos las posiciones sobre el mapa y lo adornamos un poco:
ggplot()+
geom_sf(data=costas, color = "black", aes(fill="lightsalmon3")) +
geom_sf(data=posiciones, aes(color=`Species Name`,shape=`Species Name`)) +
coord_sf(xlim=c(110,154),ylim=c(-37,29)) +
scale_shape_manual(values=c(2,1)) + # Para la forma de los puntos
guides(fill=FALSE) +
theme(panel.background = element_rect(fill="lightblue")) # Color del oceano
# Apenas se distinguen las posiciones de las dos especies, porque están casi solapadas.
# Podemos hacer dos mapas, uno por cada especie:
ggplot()+
geom_sf(data=costas, color = "black") +
geom_sf(data=posiciones, aes(color=`Species Name`,shape=`Species Name`)) +
coord_sf(xlim=c(110,154),ylim=c(-37,29)) +
scale_shape_manual(values=c(2,1)) +
facet_wrap(~`Species Name`)# Para la forma de los puntos
Se puede incluir en el informe cualquier otro aspecto de interés que se detecte en estos datos. Para la presentación se valorará la elaboración de las tablas y gráficos adecuados y correctamente elaborados.