Estadistica y probabilidad

Probabilidad

Publicada en

Domingo por la mañana. Enciendes el televisor y en el noticiero están dando el reporte del tiempo. La chica del meteorológico dice que se espera un día soleado con un 10% de probabilidad de lluvia; piensas, «¡Qué día perfecto para salir a correr!» Estando ya en el parque, se acercan unas nubes, se va ocultando el sol, empieza a bajar la temperatura y, adivina: empieza a caer una lluvia torrencial y llegas totalmente empapado a tu casa. Pero, ¿no dijo la meteoróloga que hoy iba a ser un día soleado y que no iba a llover? Lamentablemente, la respuesta a esta pregunta es no; lo que la meteoróloga realmente dijo fue que era muy poco probable que lloviera, pero nunca dijo que no iba a llover. Entonces, ¿qué significa eso de 10% de probabilidad? Bueno, esto se refiere a cuán seguros podemos estar de que un evento —en este caso la lluvia—, ocurra o no ocurra. Hay que siempre estar conscientes de que la probabilidad nunca nos va a decir exactamente que suceso ocurrirá o no ocurrirá, salvo el caso que la probabilidad del evento sea 100% o 0% respectivamente, solamente nos da información de cuan factible es que ocurra un evento.

Cuando se habla del término probabilidad, desafortunadamente, es bastante difícil definirla sin ser en algún modo circular en la descripción. Comencemos con un ejemplo. Asumamos que tenemos una moneda, en la cual en un lado tiene una águila y el otro sol. Si lanzamos la moneda una y otra vez, podemos esperar que la proporción de tiradas que saldrá sol deba ser aproximadamente 1⁄2. Así que decimos que la probabilidad de que al tirar una moneda saldrá sol es 1⁄2. Esto es probabilidad: la proporción de veces que esperamos que un evento ocurrirá si realizamos el experimento una y otra vez. Notemos que no podemos decir la proporción exacta de veces que tenemos éxito. Esta es la dificultad en definir probabilidad. La probabilidad solamente existe porque intentamos medir un evento el cual no es preciso.

Una disputa entre apostadores en 1654 llevó a la creación de la teoría matemática de probabilidad por dos matemáticos franceses, Blaise Pascal y Pierre de Fermat. Así que la probabilidad se estudió, inicialmente, para resolver problemas relacionados con juegos de azar. Actualmente, esta se utiliza en una gran variedad de campos y por tal razón se sigue investigando la misma a través de todo el mundo.

Por ejemplo, en los diferentes juegos de cartas como el póquer o el dominó. Las personas que son exitosas en estos tipos de juegos no lo son porque tengan “suerte”, sino porque tienen conocimiento de probabilidad y pueden saber cuan exitosa puede ser la mano que tienen, mirando las cartas que han salido y tomando en consideración la cantidad de cartas que quedan en el paquete. El uso de la probabilidad en los juegos de azar es tan buena técnica para poder ganar, que en muchos lugares está prohibido.

La economía mundial se rige en gran parte por la probabilidad. La crisis económica en los Estados Unidos en el siglo pasado, se debió en cierto modo a la interpretación que se ha dado de modelos probabilísticos por parte de los especuladores del sector de los bienes raíces. El trabajo del especulador es comprar cuando el bien está barato (haciendo subir el precio) y vender cuando está caro (haciéndolo bajar) de manera que la evolución de los precios padece menos cambios drásticos. Ahora bien, los especuladores también pueden equivocarse: comprar cuando está caro (haciendo subir más el precio) y verse obligados a vender cuando esté barato (haciéndolo bajar todavía más). Así, cuando los especuladores anticipan mal la demanda de los consumidores, los movimientos de algunos de ellos destaparán el error de los restantes. Si una parte del precio de la vivienda está inflado por la especulación (es decir, por la probabilidad de que los precios continúen subiendo), una parálisis o reducción de repente de los mismos puede provocar la catarsis entre la demanda especulativa. El precio del petróleo varía como efecto directo de la probabilidad percibida de la estabilidad en el Oriente Medio, es decir mientras más probable es un conflicto bélico en Oriente Medio más aumenta el precio del combustible. De manera similar otros factores que afectan la economía son resultado de la probabilidad.

En general, la probabilidad nos ayuda en la vida diaria a evitar tomar riesgos innecesarios o ser más cautelosos al momento de tomar decisiones. Si manejas a una velocidad moderada es menos probable que tengas un accidente y si tienes un accidente es menos probable que sufras heridas graves si utilizas el cinturón de seguridad; si haces ejercicio es menos probable que sufras del corazón; si no fumas es menos probable que tengas cáncer de pulmón, y así sucesivamente podemos seguir nombrando infinidad de ejemplos en que la probabilidad nos ayuda a prever situaciones. Es decir, si bien nuestra vida no es completamente previsible, tampoco nos dejemos sorprender demasiado y busquemos la manera de mejorar nuestra situación respecto a esto.

Modelos

Covid19

Publicada en

Este documento es un ejercicio de análisis de datos usando R. No pretende ser una fuente de información ni un análisis de la situación actual.

Se incluye el código fuente para su uso con las reservas pertinentes.

Fuente de datos sobre el Covi19: https://ourworldindata.org/

df = read_csv("https://covid.ourworldindata.org/data/ecdc/full_data.csv")
## Parsed with column specification:
## cols(
##   date = col_date(format = ""),
##   location = col_character(),
##   new_cases = col_double(),
##   new_deaths = col_double(),
##   total_cases = col_double(),
##   total_deaths = col_double()
## )
df = df %>% rename(Pais = location) %>% rename(AcumuladoCasos = total_cases) %>% rename(AcumuladoMuertes = total_deaths) %>% rename(Casos = new_cases) %>% rename(Muertes = new_deaths)

df <- df %>%
filter(Pais %in% c("Mexico", "Brazil", "China", "Italy", "Spain", "United States", "South Korea ")) %>%
filter(AcumuladoCasos>0)
fecha <- max(df$date)
df1 <- df %>%
  dplyr::group_by(Pais) %>%
  dplyr::summarise(Casos = sum(Casos), Decesos=sum(Muertes))
paste("<h1>Fecha de corte ", fecha,  sep = "")
## [1] "<h1>Fecha de corte 2020-04-10"
paste("</h1>")
## [1] "</h1>"
kable(df1) %>%
  kable_styling(bootstrap_options = "striped", full_width = F)%>%
  add_header_above(c("Casos de Covid19 reportados" = 3))
Casos de Covid19 reportados
Pais Casos Decesos
Brazil 17857 941
China 82925 3340
Italy 143626 18281
Mexico 3441 194
Spain 152446 15238
United States 466033 16690
df2 <- df %>%
filter(Pais %in% c("Mexico"))

qplot(date,Casos,data=df, color = as.factor(Pais), geom=c("point", "line"), 
  main = "Casos confirmados nuevos",
  xlab = "Fecha",
  ylab = "Casos")

qplot(date,AcumuladoCasos,data=df, color = as.factor(Pais), geom=c("point", "line"), 
  facets = .~ Pais,
  main = "Casos confirmados totales",
  xlab = "Fecha",
  ylab = "Casos")

qplot(factor(Pais), AcumuladoCasos , data = df, 
      geom = "violin", stackdir = "center", binaxis = "y",
      color = factor(Pais), fill = factor(Pais),
      main = "Casos totales",
      xlab = "Fecha",
      ylab = "Casos confirmados totales")
## Warning: Ignoring unknown parameters: stackdir, binaxis

qplot(date,log(AcumuladoCasos),data=df, color = as.factor(Pais), geom=c("point", "line"),
      main = "Curvas de crecimiento",
      xlab = "Fecha",
      ylab = "logaritmo de casos totales")

qplot(date,Casos,data=df2, geom=c("point", "line"), 
  main = "Mexico",
  xlab = "Fecha",
  ylab = "Casos confirmados nuevos")

qplot(date,AcumuladoCasos,data=df2, geom=c("point", "line"), 
  facets = .~ Pais,
  main = "Mexico",
  xlab = "Fecha",
  ylab = "Casos confirmados totales")

qplot(date,log(AcumuladoCasos),data=df2, geom=c("point", "line"), 
  facets = .~ Pais,
  main = "Mexico",
  xlab = "Fecha",
  ylab = "Logaritmo de Casos confirmados totales")

df2 <- df %>%
filter(Pais %in% c("United States"))

qplot(date,Casos,data=df2, geom=c("point", "line"), 
  main = "United States",
  xlab = "Fecha",
  ylab = "Casos confirmados nuevos")