<div dir="ltr"><div class="gmail_default" style="font-family:verdana,sans-serif">Hemos hecho alguno en streaming, pero nos han dicho desde el MediaLab (el sitio donde celebramos las reuniones) que no tienen ahora gente que nos pueda ayudar para repetir esto en streaming, así que seguiremos con la opción del video...</div><div class="gmail_default" style="font-family:verdana,sans-serif"><br></div><div class="gmail_default" style="font-family:verdana,sans-serif">Bueno, no hace falta tampoco juntarse cada mes, pero seguro que por allá entre gente de empresas, universidades, etc. sí que podríais montar alguna reunión cada trimestre.. nosotros al principio éramos 6-7...</div></div><div class="gmail_extra"><br><div class="gmail_quote">El 4 de junio de 2017, 12:13, Jesús Para Fernández <span dir="ltr"><<a href="mailto:j.para.fernandez@hotmail.com" target="_blank">j.para.fernandez@hotmail.com</a>></span> escribió:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">





<div lang="ES" link="blue" vlink="purple">
<div class="m_-7833446892942851706WordSection1">
<p class="MsoNormal">Sigo el grupo de Madrid, pero en diferido. Es posible empezar a seguir al grupo en directo, es decir, mediante Skype o similar???</p>
<p class="MsoNormal"><br>
Aquí en el país vasco no hay nigun grupo de R y creo que aunque lo formaramos nunca llegaríamos a ser tan potentes como el de Madrid…</p>
<p class="MsoNormal"><u></u> <u></u></p>
<p class="MsoNormal">Enviado desde <a href="https://go.microsoft.com/fwlink/?LinkId=550986" target="_blank">
Correo</a> para Windows 10</p>
<p class="MsoNormal"><u></u> <u></u></p>
<div style="border:none;border-top:solid #e1e1e1 1.0pt;padding:3.0pt 0cm 0cm 0cm">
<p class="MsoNormal" style="border:none;padding:0cm"><b>De: </b><a href="mailto:cof@qualityexcellence.es" target="_blank">Carlos Ortega</a><br>
<b>Enviado: </b>domingo, 4 de junio de 2017 12:11<br>
<b>Para: </b><a href="mailto:j.para.fernandez@hotmail.com" target="_blank">Jesús Para Fernández</a><br>
<b>CC: </b><a href="mailto:ihidalgo@jccm.es" target="_blank">Isidro Hidalgo Arellano</a>; <a href="mailto:mspinola10@gmail.com" target="_blank">
Manuel Spínola</a>; <a href="mailto:r-help-es@r-project.org" target="_blank">Lista R</a><span class=""><br>
<b>Asunto: </b>Re: [R-es] CV en R</span></p>
</div>
<p class="MsoNormal"><u></u> <u></u></p>
<p class="MsoNormal"><span style="font-family:"Verdana",sans-serif">H2O va bien (muy bien) tanto en un ordenador sobremesa/portátil y sobre un clúster. En uno de sobremesa si tienes buena RAM y muchos cores, mejor. Y no tienes porqué usar Spark si no necesitas
 una solución tiempo real o "near real-time". H2O tiene otra solución para interaccionar con Spark (Sparkling Water).<u></u><u></u></span></p><span class="">
<div>
<p class="MsoNormal"><span style="font-family:"Verdana",sans-serif"><u></u> <u></u></span></p>
</div>
<div>
<p class="MsoNormal"><span style="font-family:"Verdana",sans-serif">Incluso sobre un clúster, puedes usar "sparklyr" y "rsparklyng" tanto para interaccionar con Spark sin salir de "R" (usando dplyr) y para interaccionar con H2O, igualmente sin salir de "R".
 Mira las páginas de RStudio que tratan estas dos soluciones o la presentación que hizo en el Grupo de Usuarios de R de Madrid de José Luis Cañadas que contó las dos alternativas.<u></u><u></u></span></p>
</div>
<div>
<p class="MsoNormal"><span style="font-family:"Verdana",sans-serif"><u></u> <u></u></span></p>
</div>
<div>
<p class="MsoNormal"><span style="font-family:"Verdana",sans-serif"><u></u> <u></u></span></p>
</div>
</span><div>
<p class="MsoNormal"><u></u> <u></u></p>
<div><span class="">
<p class="MsoNormal">El 4 de junio de 2017, 12:04, Jesús Para Fernández <<a href="mailto:j.para.fernandez@hotmail.com" target="_blank">j.para.fernandez@hotmail.com</a>> escribió:<u></u><u></u></p>
</span><blockquote style="border:none;border-left:solid #cccccc 1.0pt;padding:0cm 0cm 0cm 6.0pt;margin-left:4.8pt;margin-right:0cm">
<div>
<div id="m_-7833446892942851706m_-4462849576671099300divtagdefaultwrapper"><span class="">
<p><span style="font-size:12.0pt;color:black">H20 con grandes bases de datos y R funciona bien? O es necesario tirar de spark y demás???<u></u><u></u></span></p>
<p class="MsoNormal"><span style="font-size:12.0pt;color:black"><u></u> <u></u></span></p>
</span><div>
<p class="MsoNormal"><span style="font-size:12.0pt;color:black"><img border="0" width="457" height="2" style="width:4.7569in;height:.0208in" id="m_-7833446892942851706Horizontal_x0020_Line_x0020_1" src="cid:image001.png@01D2DD2B.F39C3A80"></span><span style="font-size:12.0pt;color:black"><u></u><u></u></span></p><span class="">
<div id="m_-7833446892942851706m_-4462849576671099300divRplyFwdMsg">
<p class="MsoNormal"><b><span style="color:black">De:</span></b><span style="color:black"> Carlos Ortega <<a href="mailto:cof@qualityexcellence.es" target="_blank">cof@qualityexcellence.es</a>><br>
<b>Enviado:</b> domingo, 4 de junio de 2017 12:02<br>
<b>Para:</b> Jesús Para Fernández<br>
<b>Cc:</b> Isidro Hidalgo Arellano; Manuel Spínola; Lista R<br>
<b>Asunto:</b> Re: [R-es] CV en R</span><span style="font-size:12.0pt;color:black">
<u></u><u></u></span></p>
<div>
<p class="MsoNormal"><span style="font-size:12.0pt;color:black"> <u></u><u></u></span></p>
</div>
</div>
</span><div>
<div><span class="">
<div>
<p class="MsoNormal"><span style="font-size:12.0pt;font-family:"Verdana",sans-serif;color:black">Si nos dices el tipo de problema que estás intentando solucionar y el tamaño del dataset podemos recomendarte algo más.<u></u><u></u></span></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:12.0pt;font-family:"Verdana",sans-serif;color:black">En tu pseudo-código mezclas algoritmos supervisados y no-supervisados.<u></u><u></u></span></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:12.0pt;font-family:"Verdana",sans-serif;color:black">Además de ranger, daría alguna oportunidad a "gbm" o como no a "xgboost". Y éstos los probaría dentro de H2O.<u></u><u></u></span></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:12.0pt;font-family:"Verdana",sans-serif;color:black"><u></u> <u></u></span></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:12.0pt;font-family:"Verdana",sans-serif;color:black">Saludos,<u></u><u></u></span></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:12.0pt;font-family:"Verdana",sans-serif;color:black">Carlos Ortega<u></u><u></u></span></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:12.0pt;font-family:"Verdana",sans-serif;color:black"><a href="http://www.qualityexcellence.es" target="_blank">www.qualityexcellence.es</a><u></u><u></u></span></p>
</div>
<div style="margin-bottom:15.0pt;overflow:auto" id="m_-7833446892942851706m_-4462849576671099300LPBorder_GT_14965706122110.5978674371367293">
<table class="m_-7833446892942851706MsoNormalTable" border="1" cellspacing="0" cellpadding="0" width="90%" style="width:90.0%;background:white;border-top:dotted #c8c8c8 1.0pt;border-left:none;border-bottom:dotted #c8c8c8 1.0pt;border-right:none">
<tbody>
<tr>
<td valign="top" style="border:none;padding:0cm 0cm 0cm 0cm">
<div id="m_-7833446892942851706m_-4462849576671099300LPTitle_14965706122090.12148427097137371">
<p class="MsoNormal" style="margin-top:15.0pt"><span style="font-size:16.0pt;font-family:"Segoe UI Light",sans-serif;color:#0078d7"><a href="http://www.qualityexcellence.es/" target="_blank">QualityExcellence</a><u></u><u></u></span></p>
</div>
<div>
<div>
<div style="margin-top:7.5pt;margin-bottom:12.0pt" id="m_-7833446892942851706m_-4462849576671099300LPMetadata_14965706122100.05230289010782441">
<p class="MsoNormal" style="margin-top:15.0pt;line-height:10.5pt"><span style="font-size:10.5pt;font-family:"Segoe UI",sans-serif;color:#666666"><a href="http://www.qualityexcellence.es" target="_blank">www.qualityexcellence.es</a><u></u><u></u></span></p>
</div>
<div id="m_-7833446892942851706m_-4462849576671099300LPDescription_14965706122100.08450972727232753">
<p class="MsoNormal" style="margin-top:15.0pt;line-height:15.0pt"><span style="font-size:10.5pt;font-family:"Segoe UI",sans-serif;color:#666666">QUALITY EXCELLENCE, consultores en calidad, procesos y mejora continua<u></u><u></u></span></p>
</div>
</div>
</div>
</td>
</tr>
</tbody>
</table>
</div>
</span><div>
<div>
<div>
<p class="MsoNormal"><span style="font-size:12.0pt;font-family:"Verdana",sans-serif;color:black"><u></u> <u></u></span></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:12.0pt;font-family:"Verdana",sans-serif;color:black"><u></u> <u></u></span></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:12.0pt;color:black"><u></u> <u></u></span></p>
<div><span class="">
<p class="MsoNormal"><span style="font-size:12.0pt;color:black">El 4 de junio de 2017, 9:50, Jesús Para Fernández <<a href="mailto:j.para.fernandez@hotmail.com" target="_blank">j.para.fernandez@hotmail.com</a>> escribió:<u></u><u></u></span></p>
</span><blockquote style="border:none;border-left:solid #cccccc 1.0pt;padding:0cm 0cm 0cm 6.0pt;margin-left:4.8pt;margin-right:0cm">
<div>
<div id="m_-7833446892942851706m_-4462849576671099300m_-1888002326253424967divtagdefaultwrapper"><span class="">
<p><span style="font-size:12.0pt;color:black">El paquete ranger la verdad es que es la bomba. Acabo de probarlo y va muy muy bien. Mucho más rápido que randomForest!!!!<br>
<br>
Gracias Carlos. Algún "secretillo" más??<u></u><u></u></span></p>
<p class="MsoNormal" style="margin-bottom:12.0pt"><span style="font-size:12.0pt;color:black"><u></u> <u></u></span></p>
</span><div>
<p class="MsoNormal"><span style="font-size:12.0pt;color:black"><img border="0" width="450" height="2" style="width:4.6875in;height:.0208in" id="m_-7833446892942851706Horizontal_x0020_Line_x0020_2" src="cid:image002.png@01D2DD2B.F39C3A80"></span><span style="font-size:12.0pt;color:black"><u></u><u></u></span></p><span class="">
<div id="m_-7833446892942851706m_-4462849576671099300m_-1888002326253424967divRplyFwdMsg">
<p class="MsoNormal"><b><span style="color:black">De:</span></b><span style="color:black"> Carlos Ortega <<a href="mailto:cof@qualityexcellence.es" target="_blank">cof@qualityexcellence.es</a>><br>
<b>Enviado:</b> sábado, 3 de junio de 2017 21:52<br>
<b>Para:</b> Jesús Para Fernández<br>
<b>Cc:</b> Isidro Hidalgo Arellano; Manuel Spínola; Lista R<br>
<b>Asunto:</b> Re: [R-es] CV en R</span><span style="font-size:12.0pt;color:black">
<u></u><u></u></span></p>
<div>
<p class="MsoNormal"><span style="font-size:12.0pt;color:black"> <u></u><u></u></span></p>
</div>
</div>
</span><div>
<div><span class="">
<div>
<p class="MsoNormal"><span style="font-size:12.0pt;font-family:"Verdana",sans-serif;color:black">Hola,<u></u><u></u></span></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:12.0pt;font-family:"Verdana",sans-serif;color:black"><u></u> <u></u></span></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:12.0pt;font-family:"Verdana",sans-serif;color:black">Puedes ver aquí un ejemplo de cómo comparar varios modelos usando "caret".<u></u><u></u></span></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:12.0pt;font-family:"Verdana",sans-serif;color:black"><u></u> <u></u></span></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:12.0pt;font-family:"Verdana",sans-serif;color:black"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank">https://stackoverflow.com/<wbr>questions/14800021/statistics-<wbr>of-prediction-for-multiple-<wbr>models-with-caret</a><u></u><u></u></span></p>
</div>
</span><div style="margin-bottom:15.0pt;overflow:auto" id="m_-7833446892942851706m_-4462849576671099300m_-1888002326253424967LPBorder_GT_14965626158290.3595688376362476">
<table class="m_-7833446892942851706MsoNormalTable" border="1" cellspacing="0" cellpadding="0" width="90%" style="width:90.0%;background:white;border-top:dotted #c8c8c8 1.0pt;border-left:none;border-bottom:dotted #c8c8c8 1.0pt;border-right:none">
<tbody>
<tr>
<td width="250" valign="top" style="width:187.5pt;border:none;padding:15.0pt 15.0pt 15.0pt .75pt">
<div style="margin-top:5.0pt;margin-bottom:5.0pt;display:table" id="m_-7833446892942851706m_-4462849576671099300m_-1888002326253424967LPImageContainer_14965626158270.7104165168755627">
<p class="MsoNormal" style="margin-top:15.0pt;background:white"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:windowtext;text-decoration:none"><u></u><u></u></span></a></p>
</div>
</td>
<td valign="top" style="border:none;padding:0cm 0cm 0cm 0cm;display:table-cell" id="m_-7833446892942851706m_-4462849576671099300m_-1888002326253424967TextCell_14965626158280.6118187924746128">
<div id="m_-7833446892942851706m_-4462849576671099300m_-1888002326253424967LPTitle_14965626158280.36062352219299587">
<p class="MsoNormal" style="margin-top:15.0pt"><span style="font-size:16.0pt;font-family:"Segoe UI Light",sans-serif;color:#0078d7"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:#0078d7;text-decoration:none"><u><span style="color:blue">Statistics
 of prediction for multiple models with caret</span></u><u></u><u></u></span></a></span></p>
</div><span class="">
<div style="margin-top:7.5pt;margin-bottom:12.0pt" id="m_-7833446892942851706m_-4462849576671099300m_-1888002326253424967LPMetadata_14965626158280.792116124678635">
<p class="MsoNormal" style="margin-top:15.0pt;line-height:10.5pt"><span style="font-size:10.5pt;font-family:"Segoe UI",sans-serif;color:#666666"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:#666666;text-decoration:none"><u><span style="color:blue">stackoverflow.com</span></u><u></u><u></u></span></a></span></p>
</div>
<div id="m_-7833446892942851706m_-4462849576671099300m_-1888002326253424967LPDescription_14965626158280.05875436548058466">
<p class="MsoNormal" style="margin-top:15.0pt;line-height:15.0pt"><span style="font-size:10.5pt;font-family:"Segoe UI",sans-serif;color:#666666"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:#666666;text-decoration:none">I
 am trying to get statistics of prediction for various training models with the package caret. Below is an example that illustrates my need: library(caret) # Training: # ... Get X and Y for trai...<u></u><u></u></span></a></span></p>
</div>
</span></td>
</tr>
</tbody>
</table>
</div><span class="">
<p class="MsoNormal"><span style="font-size:12.0pt;color:black"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:black;text-decoration:none"><u></u> <u></u></span></a></span></p>
<div>
<p class="MsoNormal"><span style="font-size:12.0pt;font-family:"Verdana",sans-serif;color:black"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:black;text-decoration:none"><u></u> <u></u></span></a></span></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:12.0pt;font-family:"Verdana",sans-serif;color:black"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:black;text-decoration:none">O
 mejor en el propio manual de "caret", en esta sección:<u></u><u></u></span></a></span></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:12.0pt;font-family:"Verdana",sans-serif;color:black"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:black;text-decoration:none"><u></u> <u></u></span></a></span></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:12.0pt;font-family:"Verdana",sans-serif;color:black"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:black;text-decoration:none"><u><span style="color:blue">https://topepo.github.io/<wbr>caret/model-training-and-<wbr>tuning.html#exploring-and-<wbr>comparing-resampling-<wbr>distributions</span></u></span><span style="font-family:"Calibri",sans-serif;color:black;text-decoration:none">
</span><span style="font-family:"Calibri",sans-serif;color:black;text-decoration:none"><u></u><u></u></span></a></span></p>
<div style="margin-bottom:15.0pt;overflow:auto" id="m_-7833446892942851706m_-4462849576671099300m_-1888002326253424967LPBorder_GT_14965626142810.1640649646446959">
<table class="m_-7833446892942851706MsoNormalTable" border="1" cellspacing="0" cellpadding="0" width="90%" style="width:90.0%;background:white;border-top:dotted #c8c8c8 1.0pt;border-left:none;border-bottom:dotted #c8c8c8 1.0pt;border-right:none">
<tbody>
<tr>
<td valign="top" style="border:none;padding:0cm 0cm 0cm 0cm">
<div id="m_-7833446892942851706m_-4462849576671099300m_-1888002326253424967LPTitle_14965626142800.8798137537793522">
<p class="MsoNormal" style="margin-top:15.0pt"><span style="font-size:16.0pt;font-family:"Segoe UI Light",sans-serif;color:#0078d7"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:#0078d7;text-decoration:none"><u><span style="color:blue">The
 caret Package - GitHub Pages</span></u><u></u><u></u></span></a></span></p>
</div>
<div style="margin-top:7.5pt;margin-bottom:12.0pt" id="m_-7833446892942851706m_-4462849576671099300m_-1888002326253424967LPMetadata_14965626142800.37896586761846973">
<p class="MsoNormal" style="margin-top:15.0pt;line-height:10.5pt"><span style="font-size:10.5pt;font-family:"Segoe UI",sans-serif;color:#666666"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:#666666;text-decoration:none"><u><span style="color:blue">topepo.github.io</span></u><u></u><u></u></span></a></span></p>
</div>
<div id="m_-7833446892942851706m_-4462849576671099300m_-1888002326253424967LPDescription_14965626142810.7299584709230043">
<p class="MsoNormal" style="margin-top:15.0pt;line-height:15.0pt"><span style="font-size:10.5pt;font-family:"Segoe UI",sans-serif;color:#666666"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:#666666;text-decoration:none">5.1
 Model Training and Parameter Tuning. The caret package has several functions that attempt to streamline the model building and evaluation process.<u></u><u></u></span></a></span></p>
</div>
</td>
</tr>
</tbody>
</table>
</div>
<p class="MsoNormal" style="margin-bottom:12.0pt"><span style="font-size:12.0pt;color:black"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:black;text-decoration:none"><u></u> <u></u></span></a></span></p>
</div>
<div>
<div>
<div>
<p class="MsoNormal"><span style="font-size:12.0pt;font-family:"Verdana",sans-serif;color:black"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:black;text-decoration:none"><u></u> <u></u></span></a></span></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:12.0pt;font-family:"Verdana",sans-serif;color:black"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:black;text-decoration:none">Y
 como recomendación te sugiero que usen "ranger" en vez de "randomForest", no solo por velocidad, si no también por las mejoras y ampliaciones de funcionalidad que incorpora.<u></u><u></u></span></a></span></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:12.0pt;font-family:"Verdana",sans-serif;color:black"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:black;text-decoration:none"><u></u> <u></u></span></a></span></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:12.0pt;font-family:"Verdana",sans-serif;color:black"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:black;text-decoration:none">Saludos,<u></u><u></u></span></a></span></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:12.0pt;font-family:"Verdana",sans-serif;color:black"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:black;text-decoration:none">Carlos
 Ortega<u></u><u></u></span></a></span></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:12.0pt;font-family:"Verdana",sans-serif;color:black"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:black;text-decoration:none"><u><span style="color:blue">www.qualityexcellence.es</span></u><u></u><u></u></span></a></span></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:12.0pt;font-family:"Verdana",sans-serif;color:black"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:black;text-decoration:none"><u></u> <u></u></span></a></span></p>
</div>
</div>
</div>
</span></div>
<div>
<div>
<div>
<p class="MsoNormal"><span style="font-size:12.0pt;color:black"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:black;text-decoration:none"><u></u> <u></u></span></a></span></p>
<div><span class="">
<p class="MsoNormal"><span style="font-size:12.0pt;color:black"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:black;text-decoration:none">El 2 de junio de 2017,
 19:58, Jesús Para Fernández <<u><span style="color:blue">j.para.fernandez@hotmail.com</span></u>> escribió:<u></u><u></u></span></a></span></p>
</span><blockquote style="border:none;border-left:solid #cccccc 1.0pt;padding:0cm 0cm 0cm 6.0pt;margin-left:4.8pt;margin-right:0cm">
<div><span class="">
<p class="MsoNormal"><span style="font-size:12.0pt;color:black"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:black;text-decoration:none">Para el tema de los
 árboles necesarios se ve muy bien haciendo plot(modelo) y se ve en que punto se han estabilizado o si necesitas más árboles.
<u></u><u></u></span></a></span></p>
</span><p class="MsoNormal"><span style="font-size:12.0pt;color:black"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:black;text-decoration:none"><img border="0" width="444" height="2" style="width:4.625in;height:.0208in" id="m_-7833446892942851706Horizontal_x0020_Line_x0020_3" src="cid:image003.png@01D2DD2B.F39C3A80"></span><span style="color:black;text-decoration:none"><u></u><u></u></span></a></span></p><span class="">
<div id="m_-7833446892942851706m_-4462849576671099300m_-1888002326253424967m_-9085677846165089365divRplyFwdMsg">
<p class="MsoNormal"><b><span style="color:black"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:black;text-decoration:none">De:</span><span style="color:black;font-weight:normal;text-decoration:none">
 Isidro Hidalgo Arellano <<u><span style="color:blue">ihidalgo@jccm.es</span></u>><br>
</span><span style="color:black;text-decoration:none">Enviado:</span><span style="color:black;font-weight:normal;text-decoration:none"> viernes, 2 de junio de 2017 15:01:37<br>
</span><span style="color:black;text-decoration:none">Para:</span><span style="color:black;font-weight:normal;text-decoration:none"> 'Jesús Para Fernández'; 'Manuel Spínola'<br>
</span><span style="color:black;text-decoration:none">Cc:</span><span style="color:black;font-weight:normal;text-decoration:none"> 'Carlos Ortega'; 'Lista R'
<u></u><u></u></span></a></span></b></p>
<div>
<div>
<p class="MsoNormal"><span style="color:black"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:black;text-decoration:none"><br>
<b>Asunto:</b> RE: [R-es] CV en R<u></u><u></u></span></a></span></p>
</div>
</div>
<div>
<p class="MsoNormal"><span style="font-size:12.0pt;color:black"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:black;text-decoration:none"> <u></u><u></u></span></a></span></p>
</div>
</div>
</span><div>
<div>
<div>
<div><span class="">
<p class="MsoNormal"><span style="color:#1f497d"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:#1f497d;text-decoration:none">No, llega un momento en el que más
 árboles no te supone mejoría, e incluso funciona peor. Que funcione peor lo atribuyo al ruido, porque en teoría no tiene mucho sentido, la verdad... Pero no he probado a coger más árboles de los "necesarios". Lo probaré…
</span><span style="color:black;text-decoration:none"><u></u><u></u></span></a></span></p>
<p class="MsoNormal"><span style="color:#1f497d"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:#1f497d;text-decoration:none">Un saludo</span><span style="color:black;text-decoration:none"><u></u><u></u></span></a></span></p>
<p class="MsoNormal"><span style="color:#1f497d"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:#1f497d;text-decoration:none"> </span><span style="color:black;text-decoration:none"><u></u><u></u></span></a></span></p>
<div>
<div style="border:none;border-top:solid #e1e1e1 1.0pt;padding:3.0pt 0cm 0cm 0cm">
<p class="MsoNormal"><b><span style="color:black"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:black;text-decoration:none">De:</span><span style="color:black;font-weight:normal;text-decoration:none">
 Jesús Para Fernández [mailto:<u><span style="color:blue">j.para.fernandez@<wbr>hotmail.com</span></u>]
<br>
</span><span style="color:black;text-decoration:none">Enviado el:</span><span style="color:black;font-weight:normal;text-decoration:none"> viernes, 02 de junio de 2017 14:54<br>
</span><span style="color:black;text-decoration:none">Para:</span><span style="color:black;font-weight:normal;text-decoration:none"> Isidro Hidalgo Arellano <<u><span style="color:blue">ihidalgo@jccm.es</span></u>>; 'Manuel Spínola' <<u><span style="color:blue">mspinola10@gmail.com</span></u>><br>
</span><span style="color:black;text-decoration:none">CC:</span><span style="color:black;font-weight:normal;text-decoration:none"> 'Carlos Ortega' <<u><span style="color:blue">cof@qualityexcellence.es</span></u>>; 'Lista R' <<u><span style="color:blue">r-help-es@r-project.org</span></u>><br>
</span><span style="color:black;text-decoration:none">Asunto:</span><span style="color:black;font-weight:normal;text-decoration:none"> Re: [R-es] CV en R</span><span style="color:black;font-weight:normal;text-decoration:none"><u></u><u></u></span></a></span></b></p>
</div>
</div>
<p class="MsoNormal"><span style="color:black"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:black;text-decoration:none"> <u></u><u></u></span></a></span></p>
</span><div id="m_-7833446892942851706m_-4462849576671099300m_-1888002326253424967m_-9085677846165089365divtagdefaultwrapper"><span class="">
<p><span style="font-size:12.0pt;color:black"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:black;text-decoration:none">Si, de eso soy consciente. Normalmente
 cuantos más arboles cojas es mejor no? el problema es que se incrementa el tiempo de computación...<u></u><u></u></span></a></span></p>
<p class="MsoNormal" style="margin-bottom:12.0pt"><span style="color:black"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:black;text-decoration:none"> <u></u><u></u></span></a></span></p>
</span><div>
<p class="MsoNormal" align="center" style="text-align:center"><span style="font-size:12.0pt;color:black"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:black;text-decoration:none"><img border="0" width="444" height="1" style="width:4.625in;height:.0138in" id="m_-7833446892942851706Horizontal_x0020_Line_x0020_4" src="cid:image004.png@01D2DD2B.F39C3A80"></span><span style="color:black;text-decoration:none"><u></u><u></u></span></a></span></p><div><div class="h5">
<div id="m_-7833446892942851706m_-4462849576671099300m_-1888002326253424967m_-9085677846165089365divRplyFwdMsg">
<p class="MsoNormal"><b><span style="color:black"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:black;text-decoration:none">De:</span><span style="color:black;font-weight:normal;text-decoration:none">
 Isidro Hidalgo Arellano <<u><span style="color:blue">ihidalgo@jccm.es</span></u>><br>
</span><span style="color:black;text-decoration:none">Enviado:</span><span style="color:black;font-weight:normal;text-decoration:none"> viernes, 2 de junio de 2017 14:50<br>
</span><span style="color:black;text-decoration:none">Para:</span><span style="color:black;font-weight:normal;text-decoration:none"> 'Manuel Spínola'<br>
</span><span style="color:black;text-decoration:none">Cc:</span><span style="color:black;font-weight:normal;text-decoration:none"> 'Jesús Para Fernández'; 'Carlos Ortega'; 'Lista R'<br>
</span><span style="color:black;text-decoration:none">Asunto:</span><span style="color:black;font-weight:normal;text-decoration:none"> RE: [R-es] CV en R</span><span style="color:black;font-weight:normal;text-decoration:none">
<u></u><u></u></span></a></span></b></p>
<div>
<p class="MsoNormal"><span style="color:black"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:black;text-decoration:none"> <u></u><u></u></span></a></span></p>
</div>
</div>
<div>
<div>
<p><span style="color:#1f497d"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:#1f497d;text-decoration:none">El algoritmo en sí no, pero si quieres ajustar los
 parámetros (número de árboles, tamaño del nodo, etc.) hay que hacerlo.</span><span style="font-size:12.0pt;color:black;text-decoration:none"><u></u><u></u></span></a></span></p>
<p><span style="color:#1f497d"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:#1f497d;text-decoration:none">En la práctica te puedo asegurar que hay diferencia
 entre usar 500 árboles o 100, igual que el tamaño del nodo que cojas; afinar los parámetros puede suponer ajustar bastante los resultados.</span><span style="font-size:12.0pt;color:black;text-decoration:none"><u></u><u></u></span></a></span></p>
<p><span style="color:#1f497d"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:#1f497d;text-decoration:none">Un saludo</span><span style="font-size:12.0pt;color:black;text-decoration:none"><u></u><u></u></span></a></span></p>
<p><span style="color:#1f497d"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:#1f497d;text-decoration:none"> </span><span style="font-size:12.0pt;color:black;text-decoration:none"><u></u><u></u></span></a></span></p>
<p><span style="color:#1f497d"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:#1f497d;text-decoration:none"> </span><span style="font-size:12.0pt;color:black;text-decoration:none"><u></u><u></u></span></a></span></p>
<p><span style="color:#1f497d"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:#1f497d;text-decoration:none">Isidro Hidalgo Arellano</span><span style="font-size:12.0pt;color:black;text-decoration:none"><u></u><u></u></span></a></span></p>
<p><span style="color:#1f497d"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:#1f497d;text-decoration:none">Observatorio del Mercado de Trabajo</span><span style="font-size:12.0pt;color:black;text-decoration:none"><u></u><u></u></span></a></span></p>
<p><span style="color:#1f497d"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:#1f497d;text-decoration:none">Consejería de Economía, Empresas y Empleo</span><span style="font-size:12.0pt;color:black;text-decoration:none"><u></u><u></u></span></a></span></p>
<p><span style="color:#1f497d"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:#1f497d;text-decoration:none"><u><span style="color:blue">http://www.castillalamancha.<wbr>es/</span></u></span><span style="font-size:12.0pt;color:black;text-decoration:none"><u></u><u></u></span></a></span></p>
<div style="margin-bottom:15.0pt;overflow:auto" id="m_-7833446892942851706m_-4462849576671099300m_-1888002326253424967m_-9085677846165089365LPBorder_GT_14964080292150.9233014231483192">
<table class="m_-7833446892942851706MsoNormalTable" border="1" cellspacing="0" cellpadding="0" width="90%" style="width:90.0%;background:white;border-top:dotted #c8c8c8 1.0pt;border-left:none;border-bottom:dotted #c8c8c8 1.0pt;border-right:none">
<tbody>
<tr>
<td valign="top" style="border:none;padding:0cm 0cm 0cm 0cm">
<div id="m_-7833446892942851706m_-4462849576671099300m_-1888002326253424967m_-9085677846165089365LPTitle_14964080292140.7238539581727332">
<p class="MsoNormal" style="margin-top:15.0pt"><span style="font-size:16.0pt;font-family:"Segoe UI Light",sans-serif;color:#0078d7"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:#0078d7;text-decoration:none"><u><span style="color:blue">Inicio
 | Gobierno de Castilla-La Mancha</span></u></span></a></span></p>
</div>
<div style="margin-top:7.5pt;margin-bottom:12.0pt" id="m_-7833446892942851706m_-4462849576671099300m_-1888002326253424967m_-9085677846165089365LPMetadata_14964080292140.18118588768764177">
<p class="MsoNormal" style="margin-top:15.0pt;line-height:10.5pt"><span style="font-size:10.5pt;font-family:"Segoe UI",sans-serif;color:#666666"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:#666666;text-decoration:none"><u><span style="color:blue">www.castillalamancha.es</span></u></span></a></span></p>
</div>
<div id="m_-7833446892942851706m_-4462849576671099300m_-1888002326253424967m_-9085677846165089365LPDescription_14964080292150.2905006868702227">
<p class="MsoNormal" style="margin-top:15.0pt;line-height:15.0pt"><span style="font-size:10.5pt;font-family:"Segoe UI",sans-serif;color:#666666"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:#666666;text-decoration:none">Web
 oficial del gobierno autonómico de Castilla-La Mancha con información sobre actividad administrativa, economía, educación, sanidad, servicios sociales, sede ...</span></a></span></p>
</div>
</td>
</tr>
</tbody>
</table>
</div>
<p class="MsoNormal"><span style="color:black"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:black;text-decoration:none"> <u></u><u></u></span></a></span></p>
<p><span style="color:#1f497d"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:#1f497d;text-decoration:none"> </span><span style="font-size:12.0pt;color:black;text-decoration:none"><u></u><u></u></span></a></span></p>
<p><span style="color:#1f497d"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:#1f497d;text-decoration:none"> </span><span style="font-size:12.0pt;color:black;text-decoration:none"><u></u><u></u></span></a></span></p>
<p><span style="color:#1f497d"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:#1f497d;text-decoration:none"> </span><span style="font-size:12.0pt;color:black;text-decoration:none"><u></u><u></u></span></a></span></p>
<p><b><span style="color:black"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:black;text-decoration:none">De:</span><span style="color:black;font-weight:normal;text-decoration:none">
 Manuel Spínola [<u><span style="color:blue">mailto:mspinola10@gmail.com</span></u>]
<br>
</span><span style="color:black;text-decoration:none">Enviado el:</span><span style="color:black;font-weight:normal;text-decoration:none"> viernes, 02 de junio de 2017 14:42<br>
</span><span style="color:black;text-decoration:none">Para:</span><span style="color:black;font-weight:normal;text-decoration:none"> Isidro Hidalgo Arellano <<u><span style="color:blue">ihidalgo@jccm.es</span></u>><br>
</span><span style="color:black;text-decoration:none">CC:</span><span style="color:black;font-weight:normal;text-decoration:none"> Jesús Para Fernández <<u><span style="color:blue">j.para.fernandez@hotmail.com</span></u>><wbr>; Carlos Ortega <<u><span style="color:blue">cof@qualityexcellence.es</span></u>>;
 Lista R <<u><span style="color:blue">r-help-es@r-project.org</span></u>><br>
</span><span style="color:black;text-decoration:none">Asunto:</span><span style="color:black;font-weight:normal;text-decoration:none"> Re: [R-es] CV en R</span><span style="font-size:12.0pt;color:black;font-weight:normal;text-decoration:none"><u></u><u></u></span></a></span></b></p>
<p><span style="font-size:12.0pt;color:black"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:black;text-decoration:none"> <u></u><u></u></span></a></span></p>
<div>
<p><span style="font-size:12.0pt;color:black"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:black;text-decoration:none">Hola,<u></u><u></u></span></a></span></p>
<div>
<p><span style="font-size:12.0pt;color:black"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:black;text-decoration:none"> <u></u><u></u></span></a></span></p>
</div>
<div>
<p><span style="font-size:12.0pt;color:black"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:black;text-decoration:none">No soy un experto en estas técnicas,
 pero hasta donde yo se, el algoritmo Random Forest no requiere cross validation.<u></u><u></u></span></a></span></p>
</div>
<div>
<p><span style="font-size:12.0pt;color:black"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:black;text-decoration:none"> <u></u><u></u></span></a></span></p>
</div>
<div>
<p><span style="font-size:12.0pt;color:black"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:black;text-decoration:none">Lo dice el mismo Leo Breiman que creo
 ha sido uno de los investigadores que más ha contribuido al desarrollo de Random Forest (<u><span style="color:blue">https://www.stat.berkeley.<wbr>edu/~breiman/RandomForests/cc_<wbr>home.htm</span></u>)<u></u><u></u></span></a></span></p>
<div style="margin-bottom:15.0pt;overflow:auto" id="m_-7833446892942851706m_-4462849576671099300m_-1888002326253424967m_-9085677846165089365LPBorder_GT_14964080297550.22420557605458558">
<table class="m_-7833446892942851706MsoNormalTable" border="1" cellspacing="0" cellpadding="0" width="90%" style="width:90.0%;background:white;border-top:dotted #c8c8c8 1.0pt;border-left:none;border-bottom:dotted #c8c8c8 1.0pt;border-right:none">
<tbody>
<tr>
<td valign="top" style="border:none;padding:0cm 0cm 0cm 0cm">
<div id="m_-7833446892942851706m_-4462849576671099300m_-1888002326253424967m_-9085677846165089365LPTitle_14964080297520.9458307265846073">
<p class="MsoNormal" style="margin-top:15.0pt"><span style="font-size:16.0pt;font-family:"Segoe UI Light",sans-serif;color:#0078d7"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:#0078d7;text-decoration:none"><u><span style="color:blue">Random
 forests - classification description</span></u></span></a></span></p>
</div>
<div style="margin-top:7.5pt;margin-bottom:12.0pt" id="m_-7833446892942851706m_-4462849576671099300m_-1888002326253424967m_-9085677846165089365LPMetadata_14964080297530.21158934712109123">
<p class="MsoNormal" style="margin-top:15.0pt;line-height:10.5pt"><span style="font-size:10.5pt;font-family:"Segoe UI",sans-serif;color:#666666"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:#666666;text-decoration:none"><u><span style="color:blue">www.stat.berkeley.edu</span></u></span></a></span></p>
</div>
<div id="m_-7833446892942851706m_-4462849576671099300m_-1888002326253424967m_-9085677846165089365LPDescription_14964080297540.8770774795173224">
<p class="MsoNormal" style="margin-top:15.0pt;line-height:15.0pt"><span style="font-size:10.5pt;font-family:"Segoe UI",sans-serif;color:#666666"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:#666666;text-decoration:none">Contents.
 Introduction Overview Features of random forests Remarks How Random Forests work The oob error estimate Variable importance Gini importance</span></a></span></p>
</div>
</td>
</tr>
</tbody>
</table>
</div>
<p class="MsoNormal"><span style="color:black"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:black;text-decoration:none"> <u></u><u></u></span></a></span></p>
</div>
<div>
<p><span style="font-size:12.0pt;color:black"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:black;text-decoration:none"> <u></u><u></u></span></a></span></p>
</div>
<div>
<p><span style="font-size:12.0pt;color:black"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:black;text-decoration:none">Manuel<u></u><u></u></span></a></span></p>
</div>
</div>
<div>
<p><span style="font-size:12.0pt;color:black"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:black;text-decoration:none"> <u></u><u></u></span></a></span></p>
<div>
<p><span style="font-size:12.0pt;color:black"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:black;text-decoration:none">El 2 de junio de 2017, 6:35, Isidro Hidalgo
 Arellano <<u><span style="color:blue">ihidalgo@jccm.es</span></u>> escribió:<u></u><u></u></span></a></span></p>
<blockquote style="border:none;border-left:solid #cccccc 1.0pt;padding:0cm 0cm 0cm 6.0pt;margin-left:4.8pt;margin-top:5.0pt;margin-right:0cm;margin-bottom:5.0pt">
<p><span style="font-size:12.0pt;color:black"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:black;text-decoration:none">Una vez que tienes la técnica y los parámetros
 óptimos resultantes de la<br>
validación cruzada, ya tienes el modelo que necesitas, NO tienes que hacer<br>
nada más. Si vuelves a modelar con todos los datos todo el trabajo de<br>
validación que has hecho lo envías a hacer gárgaras. Estarías construyendo<br>
un modelo con sobreajuste.<br>
<br>
<br>
<br>
Para quedarte tranquilo, haz la prueba, coge el modelo resultante de la<br>
validación y ve aplicándolo a los nuevos datos. Haz lo mismo con el que<br>
obtengas de ése paso final que NO debes dar, y que no te he puesto en mi<br>
código corregido, a saber:<br>
<br>
modelo.final<-randomForest(<wbr>respuesta~.,datos)<br>
<br>
<br>
<br>
Cuando los aplicas con los nuevos datos, ¿cuál funciona mejor?<br>
<br>
<br>
<br>
Un saludo<br>
<br>
<br>
<br>
<br>
<br>
Isidro Hidalgo Arellano<br>
<br>
Observatorio del Mercado de Trabajo<br>
<br>
Consejería de Economía, Empresas y Empleo<br>
<br>
<u><span style="color:blue">http://www.castillalamancha.<wbr>es/</span></u><br>
<br>
<br>
<br>
<br>
<br>
<br>
<br>
De: Jesús Para Fernández [mailto:<u><span style="color:blue">j.para.fernandez@<wbr>hotmail.com</span></u>]<br>
Enviado el: viernes, 02 de junio de 2017 14:21<br>
Para: Carlos Ortega <<u><span style="color:blue">cof@qualityexcellence.es</span></u>><br>
CC: Lista R <<u><span style="color:blue">r-help-es@r-project.org</span></u>>; Isidro Hidalgo Arellano<br>
<<u><span style="color:blue">ihidalgo@jccm.es</span></u>><br>
Asunto: Re: [R-es] CV en R<br>
<br>
<br>
<br>
Pero creo que hay un concepto que no termina de aclararse.<br>
<br>
<br>
<br>
Creo que lo importante es quedarse con el modelo bueno, por ejemplo,<br>
imaginemos que queremos probar los siguientes algoritmos: RF, SVM, KNN,<br>
LDA....<br>
<br>
<br>
<br>
Entonces hacemos lo siguiente:<br>
<br>
<br>
<br>
Probamos con todos ellos, para lo que se hacen particiones:<br>
<br>
<br>
<br>
Imaginemos que tengo un datasheet llamado datos, perfectamnte balanceado,<br>
sin datos faltantes, ni ruido ni nada asi. Entonces:<br>
<br>
<br>
<br>
for(i in 1:10){<br>
<br>
train #saco el train de los datos<br>
<br>
test #saco el test de los datos<br>
<br>
pruebo RF, con diferentes configuaraciones (bucles j,k)<br>
<br>
pruebo SVM, con diferentes configuaraciones (bucles j,k)<br>
<br>
pruebo KNN<br>
<br>
pruebo LDA<br>
<br>
<br>
<br>
guardo resultados<br>
<br>
<br>
<br>
}<br>
<br>
<br>
<br>
y sobre el que mejor de, entonces ya creo el modelo definitivo, con el<br>
conjunto de datos global. Si fuera un randomForest<br>
<br>
<br>
<br>
randomForest(respuesta~.,<wbr>ntree=500,nodesize=4,datos)<br>
<br>
<br>
<br>
Y ese es mi modelo para los proximos daots que vengan yq ue no han formado<br>
parte del datasheet datos<br>
<br>
<br>
<br>
  _____<br>
<br>
De: Carlos Ortega < <mailto:<u><span style="color:blue">cof@qualityexcellence.<wbr>es</span></u>><br>
<u><span style="color:blue">cof@qualityexcellence.es</span></u>><br>
Enviado: viernes, 2 de junio de 2017 13:11<br>
Para: Jesús Para Fernández<br>
Cc: Lista R; Isidro Hidalgo Arellano<br>
Asunto: Re: [R-es] CV en R<br>
<br>
<br>
<br>
Hola,<br>
<br>
<br>
<br>
Eso es justamente lo que hace "caret" de una manera muy sencilla y sin que<br>
tú te tengas que preocupar de quedarte con el mejor bucket  (del CV) o con<br>
la mejor combinación en tu "grid search".<br>
<br>
<br>
<br>
Te recomiendo que uses "caret" para esto....<br>
<br>
Puedes incluso evaluar los dos algoritmos "RF" y "svm" a la vez y conocer<br>
realmente el nivel de precisión que ofrecen ambos.<br>
<br>
Y claro, inicialmente puedes elegir el conjunto de entrenamiento sobre el<br>
que haces el CV dejando el resto "test" para validar el nivel de predicción.<br>
<br>
<br>
<br>
Gracias,<br>
<br>
Carlos Ortega<br>
<br>
 <<u><span style="color:blue">http://www.<wbr>qualityexcellence.es</span></u>> <u><span style="color:blue">www.qualityexcellence.es</span></u><br>
<br>
<br>
 <<u><span style="color:blue">http://www.<wbr>qualityexcellence.es/</span></u>> QualityExcellence<br>
<br>
 <<u><span style="color:blue">http://www.<wbr>qualityexcellence.es</span></u>> <u><span style="color:blue">www.qualityexcellence.es</span></u><br>
<br>
QUALITY EXCELLENCE, consultores en calidad, procesos y mejora continua<br>
<br>
<br>
<br>
<br>
<br>
El 2 de junio de 2017, 13:06, Isidro Hidalgo Arellano <<br>
<mailto:<u><span style="color:blue">ihidalgo@jccm.es</span></u>> <u><span style="color:blue">ihidalgo@jccm.es</span></u>> escribió:<u></u><u></u></span></a></span></p>
<div>
<div>
<p><span style="font-size:12.0pt;color:black"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:black;text-decoration:none"><br>
No me has parecido para nada borde.<br>
<br>
<br>
<br>
Ok. Centrémonos en RF y bajemos el nº de parámetros a 2: ntree y nodesize.<br>
<br>
Te haces una parrilla de ntree: 100, 200, 300, 400, 500<br>
<br>
Otra de nodesize: 3, 6, 10<br>
<br>
Con esto tienes 15 combinaciones.<br>
<br>
Vamos al código. Simplemente crea una lista donde metes los resultados (y<br>
tienes que añadir los parámetros, que has omitido)<br>
<br>
Después graficas usando un mapa de calor para ver qué combinación de<br>
parámetros te da el mejor resultado (en abscisas ntree y en ordenadas<br>
nodesize). Una vez que veas los intervalos de parámetros que mejor se<br>
comportan, afinas el resultado con otra validación cruzada:<br>
<br>
<br>
<br>
for(i in 1:15){<br>
<br>
<br>
<br>
numeros<-sample(1:1500,1500*0.<wbr>7)<br>
<br>
<br>
<br>
train<-datos[numeros,]<br>
<br>
<br>
<br>
test<-datos[-numeros,]<br>
<br>
<br>
<br>
<br>
<br>
#modeloRF<br>
<br>
<br>
<br>
resultadoRF <- list()<br>
<br>
<br>
<br>
modelo.rf<-randomForest(<wbr>respuesta~,train)<br>
<br>
<br>
<br>
prediccion<-predict(modelo.rf,<wbr>test)<br>
<br>
<br>
<br>
fp<-table(prediccion,test$<wbr>respuesta)[2,1]<br>
<br>
fn<-table(prediccion,test$<wbr>respuesta)[1,2]<br>
<br>
error<-(fp+fn)/nrow(train.<wbr>balanceado)<br>
<br>
resultadoRF[[i]]<-rbind(<wbr>resultado,data.frame(error=<wbr>error,modelo="rf"))<br>
<br>
<br>
<br>
#modelo SVM<br>
<br>
<br>
<br>
resultadoSVM <- list()<br>
<br>
<br>
<br>
modelo.svm<-svm(respuesta~,<wbr>train)<br>
<br>
<br>
<br>
prediccion<-predict(modelo.<wbr>svm,test)<br>
<br>
<br>
<br>
fp<-table(prediccion,test$<wbr>respuesta)[2,1]<br>
<br>
fn<-table(prediccion,test$<wbr>respuesta)[1,2]<br>
<br>
error<-(fp+fn)/nrow(train.<wbr>balanceado)<br>
<br>
resultadoSVM[[i]]<-rbind(<wbr>resultado,data.frame(error=<wbr>error,modelo="svm"))<br>
<br>
<br>
<br>
}<br>
<br>
<br>
<br>
Un saludo<br>
<br>
<br>
<br>
Isidro Hidalgo Arellano<br>
<br>
Observatorio del Mercado de Trabajo<br>
<br>
Consejería de Economía, Empresas y Empleo<u></u><u></u></span></a></span></p>
</div>
</div>
<p><span style="font-size:12.0pt;color:black"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:black;text-decoration:none"> <<u><span style="color:blue">http://www.castillalamancha.<wbr>es/</span></u>>
<u><span style="color:blue">http://www.castillalamancha.<wbr>es/</span></u><br>
<br>
<br>
<br>
<br>
<br>
<br>
<br>
De: Jesús Para Fernández [mailto: <mailto:<u><span style="color:blue">j.para.fernandez@<wbr>hotmail.com</span></u>><br>
<u><span style="color:blue">j.para.fernandez@hotmail.com</span></u>]<br>
Enviado el: viernes, 02 de junio de 2017 12:50<br>
Para: Isidro Hidalgo Arellano < <mailto:<u><span style="color:blue">ihidalgo@jccm.es</span></u>>
<u><span style="color:blue">ihidalgo@jccm.es</span></u>>;<br>
<mailto:<u><span style="color:blue">r-help-es@r-project.<wbr>org</span></u>> <u><span style="color:blue">r-help-es@r-project.org</span></u><br>
Asunto: Re: [R-es] CV en R<br>
<br>
<br>
<br>
Buenas,<br>
<br>
<br>
<br>
Puse los modelos lo mas simplificados, para centrar el tiro en el tema que<br>
me preocupa.<br>
<br>
<br>
<br>
Es una pena no poder hablar cara a cara, porque por email puedo sonar algo<br>
borde, pero no es así, al contrario estoy enormemente agradecido por tu<br>
ayuda, pero le veo un problema.<br>
<br>
Me dices que use un list para ir guardando el modelo, pero tal y como he<br>
propuesto en el bucle for, el modelo se crea 10 veces, es decir, que<br>
entiendo que si es un randomForest, tendria que entonces hacer una<br>
combinacion de esos 10 modelos con la funcion combine de RF para unir esos<br>
modelos, verdad?? Porque sino estaria en el mismo problema, generando un<br>
modelo generalista de una simple submuestra de los datos.<br>
<br>
<br>
<br>
Gracias por todo!!!<br>
<br>
Jesús<br>
<br>
<br>
<br>
  _____<br>
<br>
De: Isidro Hidalgo Arellano < <mailto:<u><span style="color:blue">ihidalgo@jccm.es</span></u>>
<u><span style="color:blue">ihidalgo@jccm.es</span></u><br>
<mailto: <mailto:<u><span style="color:blue">ihidalgo@jccm.es</span></u>> <u><span style="color:blue">ihidalgo@jccm.es</span></u>> ><br>
Enviado: viernes, 2 de junio de 2017 12:28<br>
Para: 'Jesús Para Fernández';  <mailto:<u><span style="color:blue">r-help-es@r-project.<wbr>org</span></u>><br>
<u><span style="color:blue">r-help-es@r-project.org</span></u><br>
<mailto: <mailto:<u><span style="color:blue">r-help-es@r-project.<wbr>org</span></u>> <u>
<span style="color:blue">r-help-es@r-project.org</span></u>><u></u><u></u></span></a></span></p>
<div>
<div>
<p><span style="font-size:12.0pt;color:black"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:black;text-decoration:none">Asunto: RE: [R-es] CV en R<br>
<br>
<br>
<br>
<br>
No me había fijado en el código, te había he contestado teóricamente.<br>
<br>
A ver, en ese código tienes varios problemas:<br>
<br>
-          No especificas los parámetros del modelo (para eso es la<br>
validación cruzada). En RF tendrías que especificar el número de árboles, la<br>
cantidad de puntos con los que acotar la regresión, etc. En SVM el tipo de<br>
kernel que vas a usar, la sensibilidad… NO SE TRATA SÓLO de hacer modelos<br>
con diferentes conjuntos de entrenamiento, sino de buscar los parámetros que<br>
mejor ajustan los datos.<br>
<br>
Te pongo un ejemplo: imagínate que tienes mucho ruido, en ese caso, en cada<br>
punto de regresión, tendrás que tomar un número de puntos mayor (parámetro<br>
"nodesize")<br>
<br>
-          Respecto a no guardar los modelos, es muy fácil con una lista.<br>
Cada modelo que hagas, guárdalo en un lista, junto con los datos de<br>
resultados que quieras (incluyendo los parámetros de especificación del<br>
modelo)<br>
<br>
Te recomiendo 2 cosas:<br>
<br>
-          Usa el paquete caret<br>
<br>
-          Lee este libro:<br>
 <<u><span style="color:blue">https://link.springer.com/<wbr>book/10.1007/978-1-4614-6849-3</span></u><wbr>><br>
<u><span style="color:blue">https://link.springer.com/<wbr>book/10.1007/978-1-4614-6849-3</span></u><br>
<br>
Con el libro matas varios pájaros de un tiro:<br>
<br>
-          Aprendes algo de teoría (poca), que siempre viene bien<br>
<br>
-          El autor es el creador del paquete caret<br>
<br>
Si tienes tiempo, yo buscaría un curso del MIT que es muy bueno, aunque de<br>
los duros, te lo tienes que programar casi todo desde 0, pero cuando acabas,<br>
la teoría (con éste sí) la has machacado bastante bien, y sabes lo que hace<br>
un SVM, un RF. Es éste:<u></u><u></u></span></a></span></p>
</div>
</div>
<p><span style="font-size:12.0pt;color:black"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:black;text-decoration:none"><<u><span style="color:blue">https://www.edx.org/course/<wbr>learning-data-introductory-<wbr>machine-caltechx-cs11<br>
56x</span></u>><br>
<u><span style="color:blue">https://www.edx.org/course/<wbr>learning-data-introductory-<wbr>machine-caltechx-cs115<br>
6x</span></u><br>
<br>
<br>
<br>
<br>
<<br>
<<u><span style="color:blue">https://www.edx.org/course/<wbr>learning-data-introductory-<wbr>machine-caltechx-cs11<br>
56x</span></u>><br>
<u><span style="color:blue">https://www.edx.org/course/<wbr>learning-data-introductory-<wbr>machine-caltechx-cs11<br>
56x</span></u>><br>
<br>
<br>
<<br>
<<u><span style="color:blue">https://www.edx.org/course/<wbr>learning-data-introductory-<wbr>machine-caltechx-cs11</span></u><br>
><br>
<u><span style="color:blue">https://www.edx.org/course/<wbr>learning-data-introductory-<wbr>machine-caltechx-cs11<br>
56x</span></u>> Learning From Data (Introductory Machine Learning) | edX<br>
<br>
 <<u><span style="color:blue">http://www.edx.org</span></u>> <u><span style="color:blue">www.edx.org</span></u> < <<u><span style="color:blue">http://www.edx.org</span></u>>
<u><span style="color:blue">http://www.edx.org</span></u>><br>
<br>
Introductory Machine Learning course covering theory, algorithms and<br>
applications. Our focus is on real understanding, not just "knowing."<br>
<br>
<br>
<br>
Tiene un libro asociado que está muy bien también.<br>
<br>
Si te da miedito, hay otro más suave, de los clásicos Hastie y Tibshirani:<br>
<br>
<<u><span style="color:blue">https://lagunita.stanford.<wbr>edu/courses/<wbr>HumanitiesSciences/<wbr>StatLearning/Winte<br>
r2016/about</span></u>><br>
<u><span style="color:blue">https://lagunita.stanford.edu/<wbr>courses/HumanitiesSciences/<wbr>StatLearning/Winter<br>
2016/about</span></u><br>
<br>
<br>
<br>
<<br>
<<u><span style="color:blue">https://lagunita.stanford.<wbr>edu/courses/<wbr>HumanitiesSciences/<wbr>StatLearning/Winte<br>
r2016/about</span></u>><br>
<u><span style="color:blue">https://lagunita.stanford.edu/<wbr>courses/HumanitiesSciences/<wbr>StatLearning/Winte<br>
r2016/about</span></u>> Statistical Learning | Stanford Lagunita<br>
<br>
 <<u><span style="color:blue">http://lagunita.stanford.edu</span></u><wbr>> <u><span style="color:blue">lagunita.stanford.edu</span></u><br>
<br>
StatLearning now self paced! The active course run for Statistical Learning<br>
has ended, but the course is now available in a self paced mode. You are<br>
welcome to join ...<br>
<br>
<br>
<br>
Éstos también tienen 2 libros muy buenos. El resumido es en el que se basa<br>
el curso anterior.<br>
<br>
<br>
<br>
De: Jesús Para Fernández [mailto: <mailto:<u><span style="color:blue">j.para.fernandez@<wbr>hotmail.com</span></u>><br>
<u><span style="color:blue">j.para.fernandez@hotmail.com</span></u>]<br>
Enviado el: viernes, 02 de junio de 2017 12:04<br>
Para: Isidro Hidalgo Arellano < <mailto:<u><span style="color:blue">ihidalgo@jccm.es</span></u>>
<u><span style="color:blue">ihidalgo@jccm.es</span></u><br>
<mailto: <mailto:<u><span style="color:blue">ihidalgo@jccm.es</span></u>> <u><span style="color:blue">ihidalgo@jccm.es</span></u>> >;<br>
 <mailto:<u><span style="color:blue">r-help-es@r-project.<wbr>org</span></u>> <u><span style="color:blue">r-help-es@r-project.org</span></u> <mailto:<br>
<mailto:<u><span style="color:blue">r-help-es@r-project.<wbr>org</span></u>> <u><span style="color:blue">r-help-es@r-project.org</span></u>><br>
Asunto: Re: [R-es] CV en R<br>
<br>
<br>
<br>
Es que es justo ahi donde no se como hacerlo.<br>
<br>
Es decir, dentro del bucle for hago las comprobaciones train test, y me da<br>
que de media el mejor es randomForest, pero claro, no me estoy quedando con<br>
el modelo, ya que no se va guardando....Entonces es cuando no se como seguir<br>
para quedarme con ese modelo....<br>
<br>
<br>
<br>
<br>
<br>
<br>
<br>
<br>
<br>
  _____<br>
<br>
De: Isidro Hidalgo Arellano < <mailto: <mailto:<u><span style="color:blue">ihidalgo@jccm.es</span></u>><br>
<u><span style="color:blue">ihidalgo@jccm.es</span></u>>  <mailto:<u><span style="color:blue">ihidalgo@jccm.es</span></u>>
<u><span style="color:blue">ihidalgo@jccm.es</span></u>><br>
Enviado: viernes, 2 de junio de 2017 11:59<br>
Para: 'Jesús Para Fernández';  <mailto: <mailto:<u><span style="color:blue">r-help-es@r-project.<wbr>org</span></u>><br>
<u><span style="color:blue">r-help-es@r-project.org</span></u>><br>
 <mailto:<u><span style="color:blue">r-help-es@r-project.<wbr>org</span></u>> <u><span style="color:blue">r-help-es@r-project.org</span></u><br>
Asunto: RE: [R-es] CV en R<br>
<br>
<br>
<br>
No, no. Si construyes el modelo con todos los datos, explícame para qué te<br>
ha servido la validación cruzada... ¿Sólo para saber si funciona mejor SVM o<br>
RF con ese conjunto de datos? Eso es insuficiente.<br>
Cuando construyes un modelo, lo haces entrenando con datos que el modelo NO<br>
VE, ahí está la gracia...<br>
Te tienes que quedar con el mejor modelo entrenado. Y después ver cómo te<br>
funciona en la vida real, es decir, con nuevos datos que el modelo NO HA<br>
VISTO.<br>
<br>
Un saludo.<br>
<br>
<br>
Isidro Hidalgo Arellano<br>
Observatorio del Mercado de Trabajo<br>
Consejería de Economía, Empresas y Empleo<br>
 < <<u><span style="color:blue">http://www.castillalamancha.<wbr>es/</span></u>> <u><span style="color:blue">http://www.castillalamancha.<wbr>es/</span></u>><br>
<<u><span style="color:blue">http://www.castillalamancha.<wbr>es/</span></u>> <u><span style="color:blue">http://www.castillalamancha.<wbr>es/</span></u><br>
<br>
<br>
 < <<u><span style="color:blue">http://www.castillalamancha.<wbr>es/</span></u>> <u><span style="color:blue">http://www.castillalamancha.<wbr>es/</span></u>> Inicio<br>
| Gobierno de Castilla-La Mancha<br>
<br>
 < <<u><span style="color:blue">http://www.castillalamancha.<wbr>es</span></u>> <u><span style="color:blue">http://www.castillalamancha.es</span></u><wbr>><br>
<<u><span style="color:blue">http://www.castillalamancha.<wbr>es</span></u>> <u><span style="color:blue">www.castillalamancha.es</span></u><br>
<br>
Web oficial del gobierno autonómico de Castilla-La Mancha con información<br>
sobre actividad administrativa, economía, educación, sanidad, servicios<br>
sociales, sede ...<br>
<br>
<br>
<br>
<br>
<br>
<br>
-----Mensaje original-----<br>
De: R-help-es [ <mailto: <mailto:<u><span style="color:blue">r-help-es-bounces@r-<wbr>project.org</span></u>><br>
<u><span style="color:blue">r-help-es-bounces@r-project.<wbr>org</span></u>><br>
mailto: <mailto:<u><span style="color:blue">r-help-es-bounces@r-<wbr>project.org</span></u>><br>
<u><span style="color:blue">r-help-es-bounces@r-project.<wbr>org</span></u>] En nombre de Jesús<br>
Para Fernández<br>
Enviado el: viernes, 02 de junio de 2017 11:48<br>
Para:  <mailto: <mailto:<u><span style="color:blue">r-help-es@r-project.<wbr>org</span></u>>
<u><span style="color:blue">r-help-es@r-project.org</span></u>><br>
<mailto:<u><span style="color:blue">r-help-es@r-project.<wbr>org</span></u>> <u><span style="color:blue">r-help-es@r-project.org</span></u><u></u><u></u></span></a></span></p>
<div>
<div>
<p><span style="font-size:12.0pt;color:black"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:black;text-decoration:none"><br>
Asunto: [R-es] CV en R<br>
<br>
Buenas,<br>
<br>
<br>
Estoy haciendo modelos y comparando cual es mejor. Para ello, uso CV de 10<br>
folds.<br>
<br>
<br>
Por ejemplo, hago la comparativa entre un svm y un randomForest para una<br>
serie de datos, por ello hago:<br>
<br>
<br>
midataset<-import.....<br>
<br>
<br>
#datos es un dataframe de 1500 filas y 15 variables<br>
<br>
<br>
for(i in 1:10){<br>
<br>
numeros<-sample(1:1500,1500*0.<wbr>7)<br>
<br>
train<-datos[numeros,]<br>
<br>
test<-datos[-numeros,]<br>
<br>
<br>
#modeloRF<br>
<br>
modelo.rf<-randomForest(<wbr>respuesta~,train)<br>
<br>
prediccion<-predict(modelo.rf,<wbr>test)<br>
<br>
fp<-table(prediccion,test$<wbr>respuesta)[2,1]<br>
fn<-table(prediccion,test$<wbr>respuesta)[1,2]<br>
error<-(fp+fn)/nrow(train.<wbr>balanceado)<br>
resultado<-rbind(resultado,<wbr>data.frame(error=error,modelo=<wbr>"rf"))<br>
<br>
#modelo SVM<br>
<br>
<br>
modelo.svm<-svm(respuesta~,<wbr>train)<br>
<br>
prediccion<-predict(modelo.<wbr>svm,test)<br>
<br>
fp<-table(prediccion,test$<wbr>respuesta)[2,1]<br>
fn<-table(prediccion,test$<wbr>respuesta)[1,2]<br>
error<-(fp+fn)/nrow(train.<wbr>balanceado)<br>
resultado<-rbind(resultado,<wbr>data.frame(error=error,modelo=<wbr>"svm"))<br>
<br>
}<br>
<br>
<br>
Mi pregunta es la siguiente. Si el modelo de RF es mejor, como me quedo con<br>
el modelo final? Tengo que crear el modelo de nuevo, sin tener en cuenta el<br>
train?<br>
<br>
<br>
modelo.final<-randomForest(<wbr>respuesta~.,datos)<br>
<br>
<br>
Gracias!!!!<br>
<br>
<br>
<br>
<br>
        [[alternative HTML version deleted]]<br>
<br>
______________________________<wbr>_________________<br>
R-help-es mailing list<u></u><u></u></span></a></span></p>
</div>
</div>
<p><span style="font-size:12.0pt;color:black"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:black;text-decoration:none"> <mailto: <mailto:<u><span style="color:blue">R-help-es@r-project.<wbr>org</span></u>>
<u><span style="color:blue">R-help-es@r-project.org</span></u>><br>
<mailto:<u><span style="color:blue">R-help-es@r-project.<wbr>org</span></u>> <u><span style="color:blue">R-help-es@r-project.org</span></u><br>
 < <<u><span style="color:blue">https://stat.ethz.ch/mailman/<wbr>listinfo/r-help-es</span></u>><br>
<u><span style="color:blue">https://stat.ethz.ch/mailman/<wbr>listinfo/r-help-es</span></u>><br>
<br>
 <<u><span style="color:blue">https://stat.ethz.ch/<wbr>mailman/listinfo/r-help-es</span></u>><br>
<u><span style="color:blue">https://stat.ethz.ch/mailman/<wbr>listinfo/r-help-es</span></u><br>
<br>
<br>
        [[alternative HTML version deleted]]<br>
<br>
<br>
______________________________<wbr>_________________<br>
R-help-es mailing list<br>
 <mailto:<u><span style="color:blue">R-help-es@r-project.<wbr>org</span></u>> <u><span style="color:blue">R-help-es@r-project.org</span></u><br>
 <<u><span style="color:blue">https://stat.ethz.ch/<wbr>mailman/listinfo/r-help-es</span></u>><br>
<u><span style="color:blue">https://stat.ethz.ch/mailman/<wbr>listinfo/r-help-es</span></u><br>
</span><span style="color:#888888;text-decoration:none"><br>
<br>
<br>
<br>
<br>
<br>
<br>
--<br>
<br>
Saludos,<br>
Carlos Ortega<br>
 <<u><span style="color:blue">http://www.<wbr>qualityexcellence.es</span></u>> <u><span style="color:blue">www.qualityexcellence.es</span></u><br>
<br>
<br>
        [[alternative HTML version deleted]]<br>
<br>
</span><span style="color:black;text-decoration:none"><br>
______________________________<wbr>_________________<br>
R-help-es mailing list<br>
<u><span style="color:blue">R-help-es@r-project.org</span></u><br>
<u><span style="color:blue">https://stat.ethz.ch/mailman/<wbr>listinfo/r-help-es</span></u><u></u><u></u></span></a></span></p>
</blockquote>
</div>
<p><span style="font-size:12.0pt;color:black"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:black;text-decoration:none"><br>
<br clear="all">
<u></u><u></u></span></a></span></p>
<div>
<p><span style="font-size:12.0pt;color:black"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:black;text-decoration:none"> <u></u><u></u></span></a></span></p>
</div>
<p><span style="font-size:12.0pt;color:black"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:black;text-decoration:none">--
<u></u><u></u></span></a></span></p>
<div>
<div>
<div>
<p><b><span style="font-size:12.0pt;color:black"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:black;text-decoration:none">Manuel Spínola, Ph.D.</span><span style="color:black;font-weight:normal;text-decoration:none">
<br>
Instituto Internacional en Conservación y Manejo de Vida Silvestre <br>
Universidad Nacional <br>
Apartado 1350-3000 <br>
Heredia <br>
COSTA RICA <br>
<u><span style="color:blue">mspinola@una.cr</span></u> <br>
<u><span style="color:blue">mspinola10@gmail.com</span></u> <br>
Teléfono: (506) 8706 - 4662<br>
Personal website: <u><span style="color:blue">Lobito de río</span></u> <br>
Institutional website: <u><span style="color:blue">ICOMVIS</span></u><u></u><u></u></span></a></span></b></p>
</div>
</div>
</div>
</div>
</div>
</div>
</div></div></div>
</div>
</div>
</div>
</div>
</div>
</div>
</blockquote>
</div><div><div class="h5">
<p class="MsoNormal"><span style="font-size:12.0pt;color:black"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:black;text-decoration:none"><br>
<br clear="all">
<u></u><u></u></span></a></span></p>
<div>
<p class="MsoNormal"><span style="font-size:12.0pt;color:black"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:black;text-decoration:none"><u></u> <u></u></span></a></span></p>
</div>
<p class="MsoNormal"><span style="font-size:12.0pt;color:black"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:black;text-decoration:none">--
<u></u><u></u></span></a></span></p>
<div>
<p class="MsoNormal"><span style="font-size:12.0pt;font-family:"Verdana",sans-serif;color:black"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:black;text-decoration:none">Saludos,<br>
Carlos Ortega<br>
<u><span style="color:blue">www.qualityexcellence.es</span></u></span><span style="font-family:"Calibri",sans-serif;color:black;text-decoration:none"><u></u><u></u></span></a></span></p>
</div>
</div></div></div>
</div>
</div>
</div>
</div>
</div>
</div>
</blockquote>
</div><div><div class="h5">
<p class="MsoNormal"><span style="font-size:12.0pt;color:black"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:black;text-decoration:none"><br>
<br clear="all">
<u></u><u></u></span></a></span></p>
<div>
<p class="MsoNormal"><span style="font-size:12.0pt;color:black"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:black;text-decoration:none"><u></u> <u></u></span></a></span></p>
</div>
<p class="MsoNormal"><span style="font-size:12.0pt;color:black"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:black;text-decoration:none">--
<u></u><u></u></span></a></span></p>
<div>
<p class="MsoNormal"><span style="font-size:12.0pt;font-family:"Verdana",sans-serif;color:black"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:black;text-decoration:none">Saludos,<br>
Carlos Ortega<br>
<u><span style="color:blue">www.qualityexcellence.es</span></u></span><span style="font-family:"Calibri",sans-serif;color:black;text-decoration:none"><u></u><u></u></span></a></span></p>
</div>
</div></div></div>
</div>
</div>
</div>
</div>
</div>
</div>
</div>
</blockquote>
</div>
<p class="MsoNormal"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:windowtext;text-decoration:none"><br>
<br clear="all">
<u></u><u></u></span></a></p>
<div>
<p class="MsoNormal"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:windowtext;text-decoration:none"><u></u> <u></u></span></a></p>
</div>
<p class="MsoNormal"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:windowtext;text-decoration:none">--
<u></u><u></u></span></a></p>
</div>
<p class="MsoNormal"><span style="font-family:"Verdana",sans-serif"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:windowtext;text-decoration:none">Saludos,<br>
Carlos Ortega<br>
<u><span style="color:blue">www.qualityexcellence.es</span></u></span><span style="font-family:"Calibri",sans-serif;color:windowtext;text-decoration:none"><u></u><u></u></span></a></span></p>
<p class="MsoNormal"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:windowtext;text-decoration:none"><u></u> <u></u></span></a></p>
</div>
</div>

</blockquote></div><br><br clear="all"><div><br></div>-- <br><div class="gmail_signature" data-smartmail="gmail_signature"><span style="font-family:verdana,sans-serif">Saludos,</span><br style="font-family:verdana,sans-serif">
<span style="font-family:verdana,sans-serif">Carlos Ortega</span><br style="font-family:verdana,sans-serif">
<span style="font-family:verdana,sans-serif"><a href="http://www.qualityexcellence.es" target="_blank">www.qualityexcellence.es</a></span></div>
</div>