Probabilidad Francisco de Borja


2MB Größe 19 Downloads 128 vistas
Estadística y Método Analítico Francisco de Borja

Contenido de la formación online: Principios de estadística y probabilidad

Probabilidad condicional

8 – Probability: Fórmula frecuentista

9 - Conditional probability

Teorema de Bayes Correlación y causalidad

10 - Bayes Rule

Medias

11 - Correlation vs Causation

Capítulos de “Intro to Statistics” (Udacity): 1 - Teaser 2 - Looking at data

7 - Admissions Case Study 8 - Probability

12 - Averages

Teorema de Bayes https://es.wikipedia.org/wiki/Teorema_de_Bayes https://www.youtube.com/watch?v=MrX1pS0wiU0

El teorema de Bayes es válido en todas las aplicaciones de la teoría de la probabilidad. Sin embargo, hay una controversia sobre el tipo de probabilidades que emplea. En esencia, los seguidores de la estadística tradicional sólo admiten probabilidades basadas en experimentos repetibles y que tengan una confirmación empírica

los llamados estadísticos bayesianos permiten probabilidades subjetivas. El teorema puede servir entonces para indicar cómo debemos modificar nuestras probabilidades subjetivas cuando recibimos información adicional de un experimento. La estadística bayesiana está demostrando su utilidad en ciertas estimaciones basadas en el conocimiento subjetivo a priori y el hecho de permitir revisar esas estimaciones en función de la evidencia empírica es lo que está abriendo nuevas formas de hacer conocimiento. Una aplicación de esto son los clasificadores bayesianos que son frecuentemente usados en implementaciones de filtros de correo basura o spam, que se adaptan con el uso. Otra aplicación se encuentra en la fusión de datos, combinando información expresada en términos de densidad de probabilidad proveniente de distintos sensores.

The Dee Hunter

http://www.vadenumeros.es/sociales/probabilidad-condicionada.htm

Pick a random family uniformly among all families with exactly 2 children of which one (at least) is a girl.

What is the likelihood that the chosen family has 2 girls?

Under the usual assumption of gender uniformity at birth, the answer is 1/3, not 1/2 as many people initially assume

Why?

Juego de las secuencias de las monedas My Pattern is Better than Yours

1. Flip a fair coin twice. What is the probability that you get two heads (HH)? What is the probability that you get heads followed by tails (HT)? Are these probabilities the same?

(Yes, sure they are. No confusion yet.)

2. Flip a fair coin repeatedly until you get two heads in a row (HH). On average, how many flips should this take? What if we flip until we get heads followed by tails (HT)? Are the answers the same?

(Based on the previous problem, most folks assume that the answer is Yes, but the answer is No.).

3. Let's play a game: we flip a coin repeatedly until either HH emerges (I win) or HT emerges (you win). Is the game fair?

(Based on the previous problem, most folks assume that the answer is No, but the answer is Yes.)

4. We play the let's-flip-a-coin-until-a-pattern-emerges game. You pick HHT as your pattern, I pick THH. We flip a fair coin repeatedly until we get heads-heads-tails in a row (you win) or tails-heads-heads in a row (I win). Is the game fair?

(Based on symmetry, most folks assume that the answer is Yes, but the answer is No. I'm winning 75% of the games).

5. Seeing as THH is a better pattern, you request to pick it as your pattern. I graciously agree, and switch to TTH. I keep beating you most of the time. You switch to my TTH. I switch to HTT. I keep beating you. You switch to HTT. I switch to... HHT, your original losing pattern. Who's winning now?

(Most folks are by now expecting trouble, and guess correctly even though they feel it's impossible. Indeed, HHT is better than HTT, which is better than TTH, which is better than THH, which is better than HHT.)

Penney's game Penney's game, named after its inventor Walter Penney, is a binary (head/tail) sequence generating game between two players. Player A selects a sequence of heads and tails (of length 3 or larger), and shows this sequence to player B. Player B then selects another sequence of heads and tails of the same length. Subsequently, a fair coin is tossed until either player A's or player B's sequence appears as a consecutive subsequence of the coin toss outcomes. The player whose sequence appears first wins. Provided sequences of at least length three are used, the second player (B) has an edge over the starting player (A). This is because the game is nontransitive such that for any given sequence of length three or longer one can find another sequence that has higher probability of occurring first.

1st player's choice

2nd player's choice

Odds in favour of 2nd player

HHH

THH

7 to 1

HHT

THH

3 to 1

HTH

HHT

2 to 1

HTT

HHT

2 to 1

THH

TTH

2 to 1

THT

TTH

2 to 1

TTH

HTT

3 to 1

TTT

HTT

7 to 1

An easy way to remember the sequence for using as a bar trick is for the second player to start with the opposite of the middle choice of the first player, then follow it with the first player's first two choices.

So for the first player's choice of 1-2-3 the second player must choose (not-2)-1-2 where (not-2) is the opposite of the second choice of the first player. An intuitive explanation for this result, is that in any case that the sequence is not immediately the first player's choice, the chances for the first player getting their sequence-beginning, the opening two choices, are usually the chance that the second player will be getting their full sequence. So the second player will most likely "finish before" the first player [1]

Causalidad frente a Correlación During world war II (I think) Americans were planning to add armor plating to the bombers. Bomber often flew very slow and the Americans found that the bombers had consistent bullet holes in some places of the bomber.

I thought that you should add plating to the parts of the plane that had bullet holes. The truth is, you need to add plating to everwhere but the bullet holes. Why?

Because the planes that survived are the ones that were shot in the least useful part of the plane!

Caso Top Doctors

Caso Top Doctors es un sitio web en el que los usuarios acceden para encontrar doctores con los que pueden solicitar una cita online o ver el teléfono para llamar. El dueño del sitio web TopDoctors.es quiere identificar cuáles son las combinaciones de especialidad y provincia en las que hay más probabilidad de conseguir citas y visionados de teléfono.

Si pudiéramos mejorar el producto (website, doctores, información aportada, etc), ¿en qué combinaciones de especialidad y provincia debería enfocarme? (¿cuáles son aquellas que tienen más probabilidad de conseguir citas y visionados de teléfono en el futuro?) Material necesario: datos de comportamiento de usuario en topdoctors.es. Cuántos usuarios buscan doctores en cada especialidad y provincia, cuántos usuarios finalmente piden una cita online o ven el teléfono. Conocimientos necesarios: cálculo de probabilidades

ABP 1. Leer y analizar el problema: se busca que los alumnos entiendan el enunciado y lo que se les demanda. 2. Realizar una lluvia de ideas: supone que los alumnos tomen conciencia de la situación a la que se enfrentan. 3. Hacer una lista de aquello que se conoce: implica que los alumnos recurran a aquellos conocimientos de los que ya disponen, a los detalles del problema que conocen y que podrán utilizar para su posterior resolución. 4. Hacer una lista de aquello que no se conoce: este paso pretende hacer consciente lo que no se sabe y que necesitarán para resolver el problema, incluso es deseable que puedan formular preguntas que orienten la resolución del problema. 5. Hacer una lista de aquello que necesita hacerse para resolver el problema: los alumnos deben plantearse las acciones a seguir para realizar la resolución. 6. Definir el problema: se trata concretamente el problema que van a resolver y en el que se van a centrar. 7. Obtener información: aquí se espera que los alumnos se distribuyan las tareas de búsqueda de la información. 8. Presentar resultados: en este paso se espera que los alumnos que hayan trabajado en grupo estudien y comprendan, a la vez que compartan la información obtenida en el paso 7; y, por último, que elaboren dicha información de manera conjunta para poder resolver la situación planteada.