R

El monstRuo de las galletas estadísticas 28 Octubre, 2010

El profesor, con una caja de galletas en la mano, entra en una clase de 15 o más estudiantes y saca del bolsillo una baraja de cartas inglesa, nueva, envuelta en su plástico original sin abrir. El profesor pide a un estudiante voluntario que abra el envoltorio para pasar a quitar los comodines y barajar las cartas varias veces, delante de los alumnos. A continuación, los estudiantes son requeridos para ponerse en fila.

Van a jugar a un juego. Los estudiantes, por turnos, tomarán una carta de la parte superior de la baraja. Si la carta es negra, el afortunado habrá ganado una galleta. Si la carta es roja, el desafortunado estudiante se sentará en su sitio con las manos vacías. ¡Que empiece el juego!

El primer estudiante saca una carta: roja. Se oyen burlas y mofas, y el estudiante vuelve a su puesto. Está decepcionado, por supuesto, pero no demasiado. Después de todo se la jugaba al 50% y no ha ocurrido. Bueno, no pasa nada.

El segundo estudiante saca otra carta: roja otra vez. Se vuelven a oír mofas y burlas, y el segundo alumno se sienta en su sitio. También está decepcionado, pero de nuevo, no mucho, porque es probablemente su día de mala suerte. Vayamos con el siguiente.

El estudiante saca… ¡roja otra vez! Hay algunos listillos que levantan la voz indignados (para armar barullo, más que nada) pero hay otros que no se han molestado – están pensando. Es la tercera carta roja consecutiva, lo cual es posible, por supuesto, pero ¿qué es lo que está pasando aquí? No están seguros. Se concentran en la siguiente carta… saldrá negra, ¿no?

El cuarto saca su carta: roja. Hmmm. . . ahora hay quejas y refunfuños en lugar de mofas. Algunos del final de la fila se encogen de hombros y comienzan a sentarse en sus puestos, quejándose de que el profesor no quiere darles ni una galleta. Aunque aún quedan estudiantes en la fila, de pie, salivando, esperando a que salga la inevitable primera carta negra.

El quinto candidato saca una carta: roja. Ahora la cosa ya no tiene gracia. Mientras el resto de los estudiantes que quedaban se sientan en su puestos, la protesta continúa, y la clase entera demanda sus galletas.

Así comienza uno de los capítulos del lbro “Introduction to Probability and Statistics using R“, del profesor G. Jay Kerns. ¿Por qué lo traigo aquí a colación? Porque el profesor Jay ha publicado el libro bajo licencia GFDL. Y es uno de los libros de introducción a la probabilidad y estadística más asequibles que he visto hasta ahora. Todos los ejemplos que muestra son interesantes y además, vienen con un apartado del estilo: “¿Cómo se hace / calcula esto en R?” (como sabréis los lectores de este blog, R es un lenguaje y entorno de programación para análisis estadístico y gráfico, con licencia GPL) que hace que los conceptos se te queden grabados (la práctica es lo que tiene…)

¿Queréis seguir leyendo el ejemplo de las cartas? Sigamos…

Ten en mente el experimento anterior cuando leas las siguientes secciones de este capítulo (cap. 10 del libro) sobre “Test de hipótesis”. Cuando termines de leer el capítulo, vuelve aquí y lee la introducción de nuevo. Toda la jerga matemática que se usa está relacionada con los párrafos anteriores. Mientras tanto, te ayudaré a empezar a pensar en estos términos:

Hipótesis Nula: es una baraja de cartas (baraja inglesa) normal, barajada a conciencia.

Hipótesis Alternativa: o bien es una baraja trucada, o bien el profesor ha barajado con trampas.

Datos observados (muestra de la población): una secuencia de cartas sacadas de la baraja, 5 rojas consecutivas (!)

Si fuera un juego de cartas ordinario, bien barajado, la probabilidad de sacar 0 negras de una muestra de tamaño 5 (sin reemplazamiento) de una baraja de 26 cartas negras y 26 rojas, sería:

Hay dos temas muy importantes que quedan por tratar. El primero: al final todos los alumnos tuvieron su galleta. El segundo, los estudiantes, agresiva e invariablemente intentan siempre que el profesor enseñe las cartas de la baraja para comprobar si estamos hablando de una baraja normal o no. Nunca lo han conseguido 😉

¿Os gusta? Pues atentos a la jugada: aparte del PDF, el código fuente del libro, en LaTeX, también está disponible. ¿Salivais igual que los candidatos a ganar galletas? Pues leed esto, la traca final:

El profesor G. Jay Kerns, ha grabado en vídeo todas sus clases de introducción a la probabilidad y estadística usando R. TODAS. Y ha dejado los apuntes, vídeos (en distintos tamaños, incluído WebM, y versiones, incluída .3gp, para que puedas atender esas video-lecciones en tu móvil) y anotaciones disponibles para su descarga en la la web de su Universidad, bajo licencia GFDL.

Damas y caballeros, me quito el sombrero ante este señor. Chapeau!

Y por supuesto, aunque me lo he descargado en PDF y fotocopiado, ya he comprado una copia del libro en Lulu.com. Los 31 dólares mejor invertidos desde hace muuuuucho tiempo.

Categorias diariolinux R Vídeo
  • JoseRa dice:

    Se puede decir más alto pero no mejor.

    Buena redacción, -lo de la salivación me ha encantado- y
    buen marketing -a veces se hace hasta con fines altruistas.

    Hay otro libro encantador que habla de la Intifada y de la guerra de Irak,

    Statistics and Data with R: An applied approach through examples.
    Y. Cohen and J. Y. Cohen

    Los que frecuenteis los bajos fondos lo podeis descargar fácilmente.

    Saludos

  • Pablo dice:

    Muchas gracias por compartir esta información. Probabilidad y estadística son dos asignaturas pendientes en muchos de nosotros, por mucho que las hayamos cursado. Seguro que las clases y el enfoque práctico del libro nos ayuda muchísimo a todos.

    Saludos.

  • […] la página web de R hay numerosa documentación de R. Sin embargo, ha motivado esta entrada, como DiarioLinux nos contaba hace poco, que G Jay Kern ha publicado recientemente un libro de licencia libre sobre […]

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *