<font size=2 face="sans-serif">Hola de nuevo:</font>
<br>
<br><font size=2 face="sans-serif">Tirando por el camino de la distribución
Beta,(el de encontrar la distribución subyacente  porque de estimación
Bayesiana como me sugería Carlos estoy absolutamente pez), he alcanzado
el siguiente punto.</font>
<br>
<br><font size=2 face="sans-serif">He intentado ajustar una Beta de diversas
formas:</font>
<br>
<br><font size=2 face="sans-serif">1.-Usando el método de los momentos
mediante la función rriskFitdist.cont del paquete rriskDistributions (gracias
por descubrirmelo Carlos)</font>
<br><font size=2 face="sans-serif"> Resultado: una B(0.1096258 , 1.5452894).
Generada una simulación con esa distribución KS <u> rechaza el ajuste</u>.
</font>
<br><font size=2 face="sans-serif"> </font>
<br><font size=2 face="sans-serif">2.-Usando el método de los momentos
mediante  una estimación "manual" de los parámetros.</font>
<br><font size=2 face="sans-serif">Resultado: una B(0.1088774 , 1.53474).
Generada una simulación con esa distribución KS  <u>rechaza el ajuste</u>.
</font>
<br>
<br><font size=2 face="sans-serif">3.-Usando el método de la máxima verosimilitud
mediante la función rriskFitdist.cont del paquete rriskDistributions.</font>
<br><font size=2 face="sans-serif"> No hay resultado puesto que no
es posible obtener los parámetros por este método. Informa de un error
100 que no tengo ni idea de a que se refiere.</font>
<br><font size=2 face="sans-serif"> </font>
<br>
<br>
<br><font size=2 face="sans-serif">Por otra parte he intentado ajustar,
sin la premisa de que sea una Beta, alguna otra distribución a mis datos
así:</font>
<br>
<br><font size=2 face="sans-serif">4.-Usando el método de los percentiles
(deciles en mi caso)  mediante la función fit.perc del paquete rriskDistributions</font>
<br><font size=2 face="sans-serif"> Resultado: Aunque en la parte
gráfica, de la GUI que la función genera,, sugiere una Beta, en realidad
no se "queda" con  ninguna distribución.</font>
<br>
<br><font size=2 face="sans-serif">5.-Usando la funcion fit.cont del paquete
rriskDistributions.</font>
<br><font size=2 face="sans-serif">En la GUI de la función sugiere una
Normal aun cuando por KS se rechaza el ajuste en esa y el resto de distribuciones
ajustadas.</font>
<br><font size=2 face="sans-serif">La  cuestión es que he probado
con una Cauchy porque tanto por el valor del estadístico de KS (el menor
de todos) como por los gráficos mostrados parecía la menos mala.</font>
<br><font size=2 face="sans-serif">Al generar una simulación con los parámetros
obtenidos C(0.02681035 0.01475054) y ejecutar el test de KS tengo un  resultado
de que mi variable <u>si ajusta </u>a esa distribución, contradiciendo
el resultado     previo mostrado por la función y dejándome un
poco "descolocado".</font>
<br>
<br>
<br><font size=2 face="sans-serif">Visto lo visto parece ser que mi variable
V3 finalmente no es una Beta si no una Cauchy lo cual me deja aun mas confuso.</font>
<br>
<br><font size=2 face="sans-serif">Aun me queda atacar el proyecto vía
análisis cluster que tiene pinta de que va a ser la opción implementada
finalmente pero el tema del ajuste de una distribucion subyacente con R
me ha dejado bastante confuso.</font>
<br>
<br>
<br><font size=2 face="sans-serif">La sintaxis de R, sus resultados y el
fichero txt con los datos van a continuación:</font>
<br>
<br>
<br>
<br><font size=2 face="sans-serif">Mil gracias por llegar hasta aquí ;-)</font>
<br>
<br><font size=2 face="sans-serif"> </font>
<br><font size=2 color=blue face="Lucida Console">> </font><font size=2 color=#008000 face="Lucida Console">#####Cargamos
datos y librerias#</font><font size=2 color=blue face="Lucida Console"><br>
> library(rriskDistributions)<br>
> library(lattice)<br>
> Datos <-read.delim("c:\\Datos_2.txt",header=TRUE, dec=",",stringsAsFactors
=FALSE)<br>
> v3<-Datos$v3<br>
> <br>
> <br>
></font><font size=2 color=#008000 face="Lucida Console"> #####Histograma
vbl original y estadisticos basicos#</font><font size=2 color=blue face="Lucida Console"><br>
> histogram(v3, type="percent",  breaks=100,  endpoints=c(0,1))<br>
> mu <- mean(v3)<br>
> sigma <-var(v3)<br>
> num <- length(v3)<br>
> pctiles <- quantile(v3, c(0,0.1,0.2,0.3,0.4,0.5,0.6,0.7,0.8,0.9,1))</font>
<br><img src=cid:_1_0BCD3A340BCD0C74004412F2C1257D64>
<br>
<br><font size=2 color=blue face="Lucida Console">></font><font size=2 color=#008000 face="Lucida Console">
#####Funcion de optencion de alpha y beta según momentos "manual"#</font><font size=2 color=blue face="Lucida Console"><br>
> estBetaParams <- function(mu, var) <br>
+ {<br>
+   alpha <- ((1 - mu) / var - 1 / mu) * mu ^ 2<br>
+   beta <- alpha * (1 / mu - 1)<br>
+   return(params = list(alpha = alpha, beta = beta))<br>
+ }</font>
<br><font size=1 face="Arial"><br>
</font>
<p>
<br><font size=2 color=blue face="Lucida Console">> </font><font size=2 color=#008000 face="Lucida Console">#####Obtencion
de ditribucion beta por metodo de momentos usando paquete rriskDistributions#</font><font size=2 color=blue face="Lucida Console"><br>
> BetaAj_fit_mme <-  rriskFitdist.cont(v3,"beta",
method="mme")</font>
<br><font size=2 color=#008000 face="Lucida Console">> #####Generamos
Beta simulada con parametros obtenidos#</font><font size=2 color=blue face="Lucida Console"><br>
> BetaAj_fit_mme_data <- rbeta(num,BetaAj_fit_mme$estimate[1],BetaAj_fit_mme$estimate[2])<br>
> histogram(BetaAj_fit_mme_data, type="percent",  breaks=100,
 endpoints=c(0,1))</font>
<br><img src=cid:_1_0C6DD52C0C6DD188004412F2C1257D64>
<br>
<br><font size=2 color=#008000 face="Lucida Console">> #####Comprobamos
parametros por calculo "manual" de parametros por momentos#</font><font size=2 color=blue face="Lucida Console"><br>
> BetaAj_manual_params <- estBetaParams(mu,sigma)<br>
> BetaAj_manual_params<br>
</font><font size=2 face="Lucida Console">$alpha<br>
[1] 0.1088774<br>
<br>
$beta<br>
[1] 1.53474<br>
</font><font size=2 color=blue face="Lucida Console">> BetaAj_fit_mme$estimate<br>
</font><font size=2 face="Lucida Console">   shape1    shape2
<br>
0.1096258 1.5452894 </font>
<br><font size=2 color=#008000 face="Lucida Console">> #####Los parametros
estimados por rriskDistribution y de forma manual son aprox identicos#</font>
<br><font size=2 color=#008000 face="Lucida Console">> #####alpha->
0.1088774 vs0.1096258   beta -> 1.53474 vs 1.5452894 #</font>
<br>
<br><font size=2 color=#008000 face="Lucida Console">> #####Generamos
Beta simulada con parametros obtenidos por momentos de forma "manual"#</font>
<br><font size=2 color=blue face="Lucida Console">> BetaAj_manual_data
<- rbeta(num,BetaAj_manual_params$alpha,BetaAj_manual_params$beta )<br>
> histogram(BetaAj_manual_data, type="percent",  breaks=100,
 endpoints=c(0,1))</font>
<br><img src=cid:_1_0C6E0F8C0C6DDBF8004412F2C1257D64>
<br>
<br><font size=2 color=blue face="Lucida Console">> </font><font size=2 color=#008000 face="Lucida Console">#####Comprobamos
bondad de ajuste de Betas simuladas por metodo de momentos generadas por
rriskDistribution y de forma manual con nuestra v3#</font><font size=2 color=blue face="Lucida Console"><br>
> ks.Aj_fit_mme<- ks.test(v3,BetaAj_fit_mme_data)<br>
</font><font size=2 color=#c20000 face="Lucida Console">Warning message:<br>
In ks.test(v3, BetaAj_fit_mme_data) :<br>
  p-value will be approximate in the presence of ties<br>
</font><font size=2 color=blue face="Lucida Console">> ks.Aj_manual
<- ks.test(v3,BetaAj_manual_data)<br>
</font><font size=2 color=#c20000 face="Lucida Console">Warning message:<br>
In ks.test(v3, BetaAj_manual_data) :<br>
  p-value will be approximate in the presence of ties<br>
</font><font size=2 color=blue face="Lucida Console">> ks.Aj_fit_mme<br>
</font><font size=2 face="Lucida Console"><br>
                
Two-sample Kolmogorov-Smirnov test<br>
<br>
data:  v3 and BetaAj_fit_mme_data<br>
D = 0.5234, p-value < 2.2e-16<br>
alternative hypothesis: two-sided<br>
<br>
</font><font size=2 color=blue face="Lucida Console">> ks.Aj_manual<br>
</font><font size=2 face="Lucida Console"><br>
                
Two-sample Kolmogorov-Smirnov test<br>
<br>
data:  v3 and BetaAj_manual_data<br>
D = 0.4851, p-value < 2.2e-16<br>
alternative hypothesis: two-sided</font>
<br>
<br><font size=2 color=blue face="Lucida Console">> </font><font size=2 color=#008000 face="Lucida Console">#####KS
rechazado en ambos casos. Nuestra v3 no ajusta con las dos simulaciones
generadas#</font>
<br>
<br>
<br><font size=2 color=blue face="Lucida Console">></font><font size=2 color=#008000 face="Lucida Console">
#####Obtencion de ditribucion beta por maxima verosimilitud#</font><font size=2 color=blue face="Lucida Console"><br>
> BetaAj_fit_mle <-  rriskFitdist.cont(v3,"beta",
method="mle")<br>
</font><font size=2 color=#c20000 face="Lucida Console">Error in rriskFitdist.cont(v3,
"beta", method = "mle") : <br>
  the function mle failed to estimate the parameters, <br>
                with the error
code 100<br>
</font><font size=2 color=blue face="Lucida Console">> BetaAj_fit_mle<br>
</font><font size=2 color=#c20000 face="Lucida Console">Error: object 'BetaAj_fit_mle'
not found</font>
<br><font size=2 color=blue face="Lucida Console">></font><font size=2 color=#008000 face="Lucida Console">
#####No se puede obtener Beta por metodo maxima verosimilitud#</font>
<br>
<br>
<br>
<br>
<br><font size=2 color=blue face="Lucida Console">></font><font size=2 color=#008000 face="Lucida Console">
#####Obtencion de ditribucion por percentiles usando rriskDistribution</font>
<br><font size=2 color=blue face="Lucida Console">> Beta_pctil <-
fit.perc( c(0,0.1,0.2,0.3,0.4,0.5,0.6,0.7,0.8,0.9,1),pctiles)<br>
</font><font size=2 face="Lucida Console"><br>
-----------------------------------------------------------------------
<br>
Begin fitting distributions...<br>
Truncated normal distribution has been fitted successfully! <br>
Warning: non-central chi-square distribution could not be fitted! <br>
Warning: Pert distribution could not be fitted! <br>
Warning: Triangular distribution could not be fitted! <br>
</font><font size=2 color=#c20000 face="Lucida Console">Error: INVALID
INPUT, percentiles are out of the domain (0,inf) => Gompertz distribution
couldn't be fitted!<br>
</font><font size=2 face="Lucida Console">Warning: Gompertz distribution
could not be fitted! <br>
Normal distribution has been fitted successfully! <br>
Beta distribution has been fitted successfully! <br>
Cauchy distribution has been fitted successfully! <br>
Warning: Chi-square distribution could not be fitted! <br>
Logistic distribution has been fitted successfully! <br>
Warning: Student's t distribution could not be fitted! <br>
Exponential distribution has been fitted successfully! <br>
</font><font size=2 color=#c20000 face="Lucida Console">Error: INVALID
INPUT, percentiles are out of the domain [0,inf) => F distribution couldn't
be fitted!<br>
</font><font size=2 face="Lucida Console">Warning: F distribution could
not be fitted! <br>
Gamma distribution has been fitted successfully! <br>
Weibull distribution has been fitted successfully! <br>
</font><font size=2 color=#c20000 face="Lucida Console">Error: INVALID
INPUT, percentiles are out of the domain (0,inf) => Lognormal distribution
couldn't be fitted!<br>
</font><font size=2 face="Lucida Console">Warning: Lognormal distribution
could not be fitted! <br>
</font><font size=2 color=#c20000 face="Lucida Console">Error: INVALID
INPUT, uniform distribution can be fitted only by TWO given percentiles!<br>
</font><font size=2 face="Lucida Console">Warning: Uniform distribution
could not be fitted! <br>
End fitting distributions...<br>
-----------------------------------------------------------------------
<br>
Chosen continuous distribution is:  NA<br>
Fitted parameters are: <br>
[1] NA<br>
--------------------------------------------------------------------</font>
<br>
<br>
<br><img src=cid:_1_0D05C56809C20C0C004412F2C1257D64>
<br>
<br><font size=2 color=blue face="Lucida Console">></font><font size=2 color=#008000 face="Lucida Console">
#####Segun la parte grafica de la  GUI elige una Beta como distribucion
ajustada#</font>
<br><font size=2 color=blue face="Lucida Console">> Beta_pctil<br>
</font><font size=2 face="Lucida Console">$`p/q`<br>
       p      q<br>
0%   0.0 0.0000<br>
10%  0.1 0.0000<br>
20%  0.2 0.0160<br>
30%  0.3 0.0190<br>
40%  0.4 0.0240<br>
50%  0.5 0.0300<br>
60%  0.6 0.0360<br>
70%  0.7 0.0430<br>
80%  0.8 0.0638<br>
90%  0.9 0.1000<br>
100% 1.0 1.0000<br>
<br>
$chosenDistr<br>
[1] NA<br>
<br>
$fittedParams<br>
[1] NA</font>
<br>
<br><font size=2 color=blue face="Lucida Console">></font><font size=2 color=#008000 face="Lucida Console">
#####Realmente no elige ninguna distribucion</font>
<br>
<br>
<br><font size=2 color=blue face="Lucida Console">></font><font size=2 color=#008000 face="Lucida Console">
#####Obtencion de ditribucion continua que mejor ajusta usando rriskDistribution</font>
<br>
<br><font size=2 color=blue face="Lucida Console">> Ajust_Cont <-
fit.cont(v3)<br>
</font><font size=2 face="Lucida Console"><br>
-------------------------------------------------------------------<br>
Begin fitting distributions... <br>
Normal distribution has been fitted successfully! <br>
Cauchy distribution has been fitted successfully! <br>
Logistic distribution has been fitted successfully! <br>
Warning: Beta distribution couldn't be fitted! <br>
Exponential distribution has been fitted successfully! <br>
Warning: Chi-square distribution couldn't be fitted! <br>
Uniform distribution has been fitted successfully! <br>
Warning: gamma distribution couldn't be fitted! <br>
Warning: Lognormal distribution couldn't be fitted! <br>
Warning: Weibull distribution couldn't be fitted! <br>
Warning: F distribution couldn't be fitted! <br>
Student distribution has been fitted successfully! <br>
Gompertz distribution has been fitted successfully! <br>
Warning: Triangular distribution couldn't be fitted! <br>
End fitting distributions... <br>
------------------------------------------------------------------- <br>
               logL     AIC
    BIC Chisq(value) Chisq(p) AD(value)    H(AD) KS(value)
   H(KS)<br>
Normal       108.28 -212.55 -205.63      
851.81        0     50.62 rejected  
   0.33 rejected<br>
Cauchy        411.8 -819.61 -812.69      
 41.42        0      9.18 rejected
     0.16 rejected<br>
Logistic     240.66 -477.31 -470.39       243.54
       0     24.42 rejected    
 0.27 rejected<br>
Exponential  402.89 -803.78 -800.32          Inf
       0       Inf rejected    
 0.23 rejected<br>
Uniform        NULL    NULL    NULL
     1206.99        0    
  Inf     NULL      0.37 rejected<br>
Student     -219.33  440.65  444.11      6548.81
       0     78.14     NULL  
   0.50 rejected<br>
Gompertz     402.88 -801.76 -794.84        
 Inf        0       Inf  
  NULL      0.23 rejected<br>
-------------------------------------------------------------------</font>
<br>
<br><img src=cid:_1_0D063B780D0624D0004412F2C1257D64><font size=3><br>
</font>
<br><font size=2 color=blue face="Lucida Console">> </font><font size=2 color=#008000 face="Lucida Console">#####KS
rechazado en todos los casos. Nuestra variable original no ajusta con ninguna
de las distribuciones probadas #</font>
<br><font size=2 color=blue face="Lucida Console">> </font><font size=2 color=#008000 face="Lucida Console">#####La
funcion sugiere una Normal como la menos mala pero graficamente y por el
valor de KS la Cauchy parece la mas adecuada#</font>
<br>
<br><img src=cid:_1_0D066EC40D066AE4004412F2C1257D64>
<br>
<br><font size=2 face="Lucida Console">-------------------------------------------------------------------<br>
Chosen continuous distribution is:  Cauchy (cauchy)<br>
Fitted parameters are: <br>
  location      scale <br>
0.02681035 0.01475054 <br>
--------------------------------------------------------------------</font>
<br>
<br><font size=2 color=blue face="Lucida Console">> </font><font size=2 color=#008000 face="Lucida Console">#####Generamos
una Cauchy simulada y probamos su ajuste #</font>
<br><font size=2 color=blue face="Lucida Console">> Ajust_cau <-
rcauchy(235,0.0268103,0.01475054)<br>
> histogram(Ajust_cau, type="percent",  breaks=100,  endpoints=c(0,1))<br>
</font>
<br><img src=cid:_1_0D0693000D06864C004412F2C1257D64>
<br>
<br><font size=2 color=blue face="Lucida Console">> ks.test(v3,Ajust_cau)<br>
</font><font size=2 face="Lucida Console"><br>
                
Two-sample Kolmogorov-Smirnov test<br>
<br>
data:  v3 and Ajust_cau<br>
D = 0.1149, p-value = 0.0899<br>
alternative hypothesis: two-sided</font>
<br>
<br><font size=2 color=blue face="Lucida Console">> </font><font size=2 color=#008000 face="Lucida Console">#####Aparentemente
KS acepta el ajuste. ¿Porque en la GUI de fit.cont aparece como rechazado?
#</font>
<br>
<br>
<br>
<br>
<br>
<table width=100%>
<tr>
<td><img src=cid:_1_0C53788C0C53748C004412F2C1257D64 width=80 height=1>
<td width=100%>
<table width=100%>
<tr valign=top>
<td width=100%><font size=2 face="sans-serif"><b>{In Archive}  Re:
[R-es] Clasificacion de individuos</b></font></table>
<br>
<table width=100%>
<tr>
<td><font size=2 color=#e26200 face="sans-serif"><b>(Internet)</b></font>
<br><font size=2 color=#e26200 face="sans-serif"><b>jorgeivanvelez </b></font>
<td>
<td valign=top>
<table width=100%>
<tr valign=top>
<td><font size=2 color=#8f8f8f face="sans-serif">To:</font>
<td><font size=2 face="sans-serif">ihidalgo</font>
<tr valign=top>
<td><font size=1 color=#8f8f8f face="sans-serif">Cc:</font>
<td><font size=1 face="sans-serif">Jluis GILSANZ, r-help-es</font></table>
<br>
<td>
<div align=right><font size=1 face="sans-serif">30/09/2014 15:41</font></div></table>
<br></table>
<br>
<br>
<table width=100%>
<tr valign=top>
<td><font size=1 color=#8f8f8f face="sans-serif">Archive: </font>
<td><font size=1 face="sans-serif">This message is being viewed in an archive.</font></table>
<br>
<hr>
<br>
<br>
<br><font size=2 face="Arial">Me parece muy buena la idea de Isidro. 
En </font><a href="http://cran.r-project.org/web/views/Cluster.html"><font size=2 color=blue face="Arial"><u>http://cran.r-project.org/web/views/Cluster.html</u></font></a><font size=2 face="Arial">
hay infinidad de metodos para realizar la clasificacion que quieres. 
Otra posibilidad es utilizar un modelo de clases latentes o un cluster
jerarquico usando el paquete pvclust.  En ninguno de los casos la
normalidad es "necesaria".</font>
<br>
<br><font size=2 face="Arial">Por otro lado, si tus variables son porcentajes,
por que no trabajas con la distribucion Beta?  En R estan implementados
por supuesto la densidad, los percentiles y los numeros aleatorios (ver
?rbeta).  Si quieres hacer regresion, el paquete betareg es excelente
y vale la pena darle una mirada al articulo en JSS.</font>
<br>
<br><font size=2 face="Arial">Si estamos todos perdidos, quizas un poco
de contexto nos ayude a ayudarte.</font>
<br>
<br><font size=2 face="Arial">Saludos cordiales,</font>
<br><font size=2 face="Arial">Jorge.-</font>
<br>
<br>
<br>
<br><font size=3>2014-09-30 20:40 GMT+10:00 Isidro Hidalgo <</font><a href=mailto:ihidalgo@jccm.es target=_blank><font size=3 color=blue><u>ihidalgo@jccm.es</u></font></a><font size=3>>:</font>
<br><font size=3>¿Has probado a hacer directamente una clasificación de
los individuos con 3<br>
clusters? Es muy sencillo y quizá te funcione. En un espacio tridimensional
un<br>
cluster se hace más rápido que un disparo.<br>
<br>
Un saludo.<br>
Isidro<br>
<br>
> -----Mensaje original-----<br>
> De: </font><a href="mailto:r-help-es-bounces@r-project.org"><font size=3 color=blue><u>r-help-es-bounces@r-project.org</u></font></a><font size=3>
[mailto:</font><a href="mailto:r-help-es-bounces@r-"><font size=3 color=blue><u>r-help-es-bounces@r-</u></font></a><font size=3><br>
> </font><a href=http://project.org/ target=_blank><font size=3 color=blue><u>project.org</u></font></a><font size=3>]
En nombre de </font><a href=mailto:jluis.gilsanz@tasacionesh.com><font size=3 color=blue><u>jluis.gilsanz@tasacionesh.com</u></font></a><font size=3><br>
> Enviado el: martes, 30 de septiembre de 2014 12:24<br>
> Para: </font><a href="mailto:r-help-es@r-project.org"><font size=3 color=blue><u>r-help-es@r-project.org</u></font></a><font size=3><br>
> Asunto: [R-es] Clasificacion de individuos<br>
><br>
> Estimados apa eRos:<br>
><br>
> La duda o propuesta que os voy a plantear es a la vez metodol gica
y<br>
> relacionada con R.<br>
><br>
> Me encuentro trabajando con tres variables que son el resultado de
un<br>
> computo de porcentajes.<br>
> Me explico, se toma una muestra de n casos (unos 6.500 aprox)<br>
> pertenecientes a i individuos  (unos 230 aprox) en la que se
comprueba<br>
> si un determinado evento ha ocurrido o no, anot ndose 1 en caso de<br>
> dicha ocurrencia y 0 en caso de no ocurrencia.<br>
> Algo as  como:<br>
>  indiv  ocurrencia<br>
> --------        -----------------<br>
> 1       0<br>
> 1       0<br>
> 1       1<br>
> 2       0<br>
> 2       1<br>
> 3       0<br>
> 3       0<br>
> 3       0<br>
> 4       1<br>
> 4       1<br>
> .       .<br>
> .       .<br>
> .       .<br>
> n<br>
><br>
> Tras ello se computa el porcentaje de ocurrencias para cada individuo<br>
> obteniendo las variables que ser n estudiadas, obteniendo algo as
:<br>
><br>
> indiv   %<br>
> -----   ------<br>
> 1       0.333<br>
> 2       0.5<br>
> 3       0<br>
> 4       1<br>
> .       .<br>
> .       .<br>
> i<br>
><br>
> Este mismo proceso se repite en cada una de las tres variables objeto<br>
> de estudio.<br>
><br>
> Lo que se pretende es clasificar los i individuos en tres grupos seg
n<br>
> sus resultados en  cuanto a los porcentajes calculados (%):<br>
> -Por debajo de la media: Individuos que forman parte de la cola con<br>
> peores porcentajes. Aprox 10% -Por encima de la media:  Individuos
que<br>
> forman parte  de la cola con peores porcentajes. Aprox 10% -Acordes
a<br>
> la media: El 80% de individuos resultantes.<br>
><br>
> Se trata b sicamente de "rega ar" a los del primer grupo
y "felicitar"<br>
> los del segundo grupo ;-)<br>
><br>
> La cuesti n es que de las tres variables en estudio, las dos ultimas
no</font>
<br><font size=3>> son normales:<br>
><br>
> >stem(v1)<br>
><br>
> The decimal point is 1 digit(s) to the left of the |<br>
><br>
>    0 | 0000000000466899<br>
>    1 | 0133347777778999<br>
>    2 | 0000011233344555667778889999<br>
>    3 | 0001233333333334444567778888889999999999<br>
>    4 | 000001122233333344444566788889999<br>
>    5 | 000000000000011234444566667777889<br>
>    6 | 00122233345555777777788899<br>
>    7 | 00011222334455567779<br>
>    8 | 1333336668<br>
>    9 |<br>
>   10 | 0000000000000<br>
><br>
> >quantile(v1,c(0.1,0.9))<br>
>    10%    90%<br>
> 0.1670 0.7834<br>
><br>
><br>
><br>
> >stem(v2)<br>
><br>
> The decimal point is 1 digit(s) to the left of the |<br>
><br>
>    0 |<br>
> 00000000000000000000000000000000000000000000000000000000000000000000+75<br>
>    1 | 00000000111122233333444445677788888999<br>
>    2 | 0000122444557899<br>
>    3 | 0001123378999<br>
>    4 | 266<br>
>    5 | 0000<br>
>    6 | 57<br>
>    7 |<br>
>    8 | 3<br>
>    9 |<br>
>   10 | 000<br>
><br>
> >quantile(v2,c(0.1,0.9))<br>
> 10%   90%<br>
> 0.000 0.304<br>
><br>
><br>
><br>
> stem(V3)<br>
><br>
>  The decimal point is 1 digit(s) to the left of the |<br>
><br>
>    0 |<br>
> 00000000000000000000000000000000011111111122222222222222222222222222+12<br>
> 8<br>
>    1 | 000001133333477<br>
>    2 | 000<br>
>    3 | 3<br>
>    4 |<br>
>    5 | 000<br>
>    6 |<br>
>    7 |<br>
>    8 |<br>
>    9 |<br>
>   10 | 00000<br>
><br>
> >quantile(V3,c(0.1,0.9))<br>
> 10%   90%<br>
> 0.0 0.1<br>
><br>
><br>
><br>
> La primera variable V1 aparece como Normal segun los test de Kolmogorv-<br>
> Smirnov, Jarque-Bera (simetria), Agostino (simetria) y Anscombe<br>
> (curtosis) pero como No Normal segun el test de Shapiro-Wilks.<br>
> Las otras dos no aparecen como Normales en ninguno de los test,<br>
> logicamente al tener una asimetria tan fuerte.<br>
> He probado transformando mediante Box-Cox pero la ni la raiz<br>
> cuadadrada, ni 1/Variable me solucionan el problema y al haber muchos<br>
> casos con 0 la logaritmica tampoco me vale.<br>
><br>
><br>
><br>
> Asumiendo Normalidad puedo emplear los intervalos de confianza para</font>
<br><font size=3>> "rega ar" o "felicitar" a los
individuos y Puedo utilizar los<br>
> percentiles<br>
> 0.1 y 0,9 para obtener las clasificaciones en cualquier caso (normal
o<br>
> no normal).<br>
><br>
> Pero me surgen varias dudas:<br>
> -La principal de todas es la metodologia (y paquetes/funciones de
R<br>
> asociados) para llevar a cabo tarea de clasificacion.Actualmente estoy<br>
> valorando hacer la clasificacion mediante intervalos de confianza
(en<br>
> caso de poder transformar a "normales" las dos ultimas variables),<br>
> percentiles o directamente aplicando la desigualdad Chebychev.<br>
><br>
> - Que paquetes me ofrece R para obtener la distribucion de probabilidad<br>
> subyacente en una determinada muestra?.<br>
><br>
><br>
> - Que test, de los que se ofrecen en R, considerais como los mas<br>
> potentes<br>
> para comprobar si una muestra de estas caracteristicassigue una<br>
> determinada distribucion?.Yo utilizo ks.test y shapiro.test pero igual<br>
> hay<br>
> otros mejores en algun paquete que conozcais.Por la construccion de
las<br>
> variables habia supuesto que las variables debian de seguir una<br>
> distribucion U(0,1) pero el test ks solo concluye uniformidad en la<br>
> primera variable.<br>
><br>
><br>
> Muchas gracias a tod@s por leer hasta el final del ladrillo<br>
><br>
><br>
> Saludos<br>
><br>
><br>
><br>
><br>
><br>
><br>
><br>
><br>
><br>
><br>
> -- AVISO LEGAL --<br>
><br>
> Los datos personales que en esta comunicaci n aparecen, as  como
los<br>
> que nuestra<br>
> empresa mantiene de Vd. y de su empresa, son tratados con la finalidad<br>
> de mantener<br>
> el contacto as  como realizar las gestiones que en esta aparecen
(Ley<br>
> Org nica<br>
> 15/1999, de 13 de diciembre, de Protecci n de Datos de Car cter<br>
> Personal).<br>
> Puede ejercer sus derechos de acceso, rectificaci n, cancelaci n y<br>
> oposici n<br>
> dirigi ndose a </font><a href=mailto:atencion.clientes@tasacionesh.com><font size=3 color=blue><u>atencion.clientes@tasacionesh.com</u></font></a><font size=3><br>
> La utilizaci n de su direcci n de correo electr nico por parte de<br>
> nuestra empresa<br>
> queda sujeta a las disposiciones de la Ley 34/2002, de Servicios de
la<br>
> Sociedad de<br>
> la Informaci n y el Comercio Electr nico. Si Vd. recibe comunicaci
n<br>
> comercial por<br>
> nuestra parte y desea dejar de recibirla, rogamos nos lo comunique
por<br>
> v a electr nica<br>
> a trav s de la direcci n </font><a href=mailto:atencion.clientes@tasacionesh.com><font size=3 color=blue><u>atencion.clientes@tasacionesh.com</u></font></a><font size=3><br>
><br>
>       [[alternative HTML version deleted]]<br>
<br>
_______________________________________________<br>
R-help-es mailing list</font><font size=3 color=blue><u><br>
</u></font><a href="mailto:R-help-es@r-project.org"><font size=3 color=blue><u>R-help-es@r-project.org</u></font></a><font size=3 color=blue><u><br>
</u></font><a href="https://stat.ethz.ch/mailman/listinfo/r-help-es" target=_blank><font size=3 color=blue><u>https://stat.ethz.ch/mailman/listinfo/r-help-es</u></font></a>
<br>
<br>