<div dir="ltr">Gracias Carlos, te hice caso pero me da este otro error, que creo que está relacionado también con la memoria: <div>Error: cannot allocate vector of size 12.5 Gb.<div>He resuelto el problema aplicando XgBoost, que utiliza todos los nodos del ordenador. Aunque no hace lo mismo (es un boosting y no un bootstrap), mi intención era seleccionar las variables más importantes para no tener que trabajar con todas. XgBoost también da la importancia, y Gain, concretamente, lo hace de forma parecida a IncNodePurity. Me salen, además, las mismas que con random forest, cuando funcionó con 9107 genes de los 58036, por lo que me quedaré con esas variables.<br></div><div><br></div><div>Gracias, una vez más,</div><div>Manuel</div><div><br></div><div><br></div><div><br></div></div></div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">El vie, 1 abr 2022 a las 9:32, Carlos Ortega (<<a href="mailto:cof@qualityexcellence.es">cof@qualityexcellence.es</a>>) escribió:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><div dir="ltr"><div class="gmail_default" style="font-family:verdana,sans-serif;font-size:small">Hola Manuel,</div><div class="gmail_default" style="font-family:verdana,sans-serif;font-size:small"><br></div><div class="gmail_default" style="font-family:verdana,sans-serif;font-size:small">Yo probaría con "ranger", la implementación de "randomForest" pero en C++, tiene una mucha mejor gestión de la memoria.</div><div class="gmail_default" style="font-family:verdana,sans-serif;font-size:small">Y sin duda, para un problema de este tipo, notarás una gran diferencia en velocidad de ejecución.</div><div class="gmail_default" style="font-family:verdana,sans-serif;font-size:small"><br></div><div class="gmail_default" style="font-family:verdana,sans-serif;font-size:small">Gracias,</div><div class="gmail_default" style="font-family:verdana,sans-serif;font-size:small">Carlos Ortega</div><div class="gmail_default" style="font-family:verdana,sans-serif;font-size:small"><a href="http://www.qualityexcellence.es" target="_blank">www.qualityexcellence.es</a></div><div class="gmail_default" style="font-family:verdana,sans-serif;font-size:small"><br></div></div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">El vie, 1 abr 2022 a las 5:03, Manuel Mendoza (<<a href="mailto:mmendoza@fulbrightmail.org" target="_blank">mmendoza@fulbrightmail.org</a>>) escribió:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><div dir="ltr"><div>Buenos días, por primera vez he necesitado trabajar con una df que incluye nada menos que 58036 variables, que son grados de expresión génica (el nº de muestras es 933) y al hacer un random forest (paquete randomForest) me ha dado un error hasta ahora para mi desconocido: Error: protect(): protection stack overflow</div><div><br></div><div>Parece ser debido a la falta de memoria del ordenador, que es un laptop, aunque bastante potente. Con 9197 variables no tuve problemas y tardó mucho menos de lo que yo esperaba. </div><div>¿Es posible hacer algo?<br></div><div>Gracias,</div><div>Manuel</div><div><br></div><div><br></div><div>Memnory Usage Report<br><div><br></div><div><img src="cid:ii_l1ftq3b31" alt="image.png" style="margin-right: 0px;" width="328" height="191"><br></div><div><br></div><div><div><br> Con gc() me salió esto:</div><div><br>                  used      (Mb)         gc trigger        (Mb)           max used        (Mb)<br>Ncells  1120419      59.9           2413118      128.9            1717277         91.8<br>Vcells 56595010   431.8     1723373484   13148.3     1793563775    13683.9<br></div><div><br></div><div><br></div><div><br></div><div><br></div></div><div><br></div><div><br></div></div></div>
_______________________________________________<br>
R-help-es mailing list<br>
<a href="mailto:R-help-es@r-project.org" target="_blank">R-help-es@r-project.org</a><br>
<a href="https://stat.ethz.ch/mailman/listinfo/r-help-es" rel="noreferrer" target="_blank">https://stat.ethz.ch/mailman/listinfo/r-help-es</a><br>
</blockquote></div><br clear="all"><br>-- <br><div dir="ltr"><span style="font-family:verdana,sans-serif">Saludos,</span><br style="font-family:verdana,sans-serif">
<span style="font-family:verdana,sans-serif">Carlos Ortega</span><br style="font-family:verdana,sans-serif">
<span style="font-family:verdana,sans-serif"><a href="http://www.qualityexcellence.es" target="_blank">www.qualityexcellence.es</a></span></div>
</blockquote></div>