[R-es] Bootstrap data frame (Jesús Para Fernández)

JORGE OCAÑA REBULL jocana en ub.edu
Mie Ene 27 11:14:20 CET 2016


Hola Jesús,
Si no entiendo mal lo que planteas, has observado unas frecuencias
N = c(12, 0, 8, 6, 4, 2)
de pedidos acaecidos en 1:6 días, en total
n = sum(N)
pedidos. Llamemos P = (p1, p2, …, p6) a las probabilidades “teóricas” de pedido en cada día. En principio el vector N se puede considerar una realización de una distribución multinomial M(n; p1, …, p6).
P se puede estimar mediante las frecuencias relativas N / n, y una remuestra bootstrap correspondería a una realización de una multinomial M(n; N/n), es decir:
rmultinom(1, n, N/n)
o si deseas generar ‘b’ remuestras bootstrap:
rmultinom(b, n, N/n)

Fíjate que el proceso anterior es equivalente aunque más compacto y posiblemente más rápido al típico proceso que se suele designar como “bootstrap no paramétrico”, generar muestras aleatorias y con reemplazamiento de la muestra original. Las frecuencias anteriores serían asimilables a una gran muestra, un vector de ‘n’ valores 1, 2, …, 6, en la que hubiese 12 valores 1, ningún valor 2, 8 valores 3, etc. Tomando una muestra aleatoria (sample, etc.) de tamaño n del vector anterior y luego calculando las frecuencias de 1, …, 6 observadas en ella se reproduciría el proceso basado en la multinomial.

Este enfoque tiene el inconveniente de que convierte lo improbable en imposible, en ninguna remuestra bootstrap aparecerá el día 2. La solución consistiría en asumir algún modelo para las probabilidades p1, …, p6, de manera que se pudiesen estimar a partir de la muestra, de una manera más “refinada” que una simple frecuencia relativa. En este caso la estimación de p2, aunque seguramente pequeña, no sería 0. La idea de la multinomial seguiría siendo válida pero ahora a partir de estas nuevas estimaciones de las probabilidades.

Saludos

Jordi Ocaña Rebull
Dep. d’Estadística
Universitat de Barcelona



Aquest correu electrònic i els annexos poden contenir informació confidencial o protegida legalment i està adreçat exclusivament a la persona o entitat destinatària. Si no sou el destinatari final o la persona encarregada de rebre’l, no esteu autoritzat a llegir-lo, retenir-lo, modificar-lo, distribuir-lo, copiar-lo ni a revelar-ne el contingut. Si heu rebut aquest correu electrònic per error, us preguem que n’informeu al remitent i que elimineu del sistema el missatge i el material annex que pugui contenir. Gràcies per la vostra col·laboració.

Este correo electrónico y sus anexos pueden contener información confidencial o legalmente protegida y está exclusivamente dirigido a la persona o entidad destinataria. Si usted no es el destinatario final o la persona encargada de recibirlo, no está autorizado a leerlo, retenerlo, modificarlo, distribuirlo, copiarlo ni a revelar su contenido. Si ha recibido este mensaje electrónico por error, le rogamos que informe al remitente y elimine del sistema el mensaje y el material anexo que pueda contener. Gracias por su colaboración.

This email message and any documents attached to it may contain confidential or legally protected material and are intended solely for the use of the individual or organization to whom they are addressed. We remind you that if you are not the intended recipient of this email message or the person responsible for processing it, then you are not authorized to read, save, modify, send, copy or disclose any of its contents. If you have received this email message by mistake, we kindly ask you to inform the sender of this and to eliminate both the message and any attachments it carries from your account. Thank you for your collaboration.

	[[alternative HTML version deleted]]



Más información sobre la lista de distribución R-help-es