<html xmlns:v="urn:schemas-microsoft-com:vml" xmlns:o="urn:schemas-microsoft-com:office:office" xmlns:w="urn:schemas-microsoft-com:office:word" xmlns:m="http://schemas.microsoft.com/office/2004/12/omml" xmlns="http://www.w3.org/TR/REC-html40">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=Windows-1252">
<meta name="Generator" content="Microsoft Word 15 (filtered medium)">
<!--[if !mso]><style>v\:* {behavior:url(#default#VML);}
o\:* {behavior:url(#default#VML);}
w\:* {behavior:url(#default#VML);}
.shape {behavior:url(#default#VML);}
</style><![endif]--><style><!--
/* Font Definitions */
@font-face
        {font-family:"Cambria Math";
        panose-1:2 4 5 3 5 4 6 3 2 4;}
@font-face
        {font-family:Calibri;
        panose-1:2 15 5 2 2 2 4 3 2 4;}
@font-face
        {font-family:Verdana;
        panose-1:2 11 6 4 3 5 4 4 2 4;}
@font-face
        {font-family:"Segoe UI Light";
        panose-1:2 11 5 2 4 2 4 2 2 3;}
@font-face
        {font-family:"Segoe UI";
        panose-1:2 11 5 2 4 2 4 2 2 3;}
/* Style Definitions */
p.MsoNormal, li.MsoNormal, div.MsoNormal
        {margin:0cm;
        margin-bottom:.0001pt;
        font-size:11.0pt;
        font-family:"Calibri",sans-serif;}
a:link, span.MsoHyperlink
        {mso-style-priority:99;
        color:blue;
        text-decoration:underline;}
a:visited, span.MsoHyperlinkFollowed
        {mso-style-priority:99;
        color:purple;
        text-decoration:underline;}
p.MsoListParagraph, li.MsoListParagraph, div.MsoListParagraph
        {mso-style-priority:34;
        margin-top:0cm;
        margin-right:0cm;
        margin-bottom:8.0pt;
        margin-left:36.0pt;
        mso-add-space:auto;
        line-height:105%;
        font-size:11.0pt;
        font-family:"Calibri",sans-serif;}
p.MsoListParagraphCxSpFirst, li.MsoListParagraphCxSpFirst, div.MsoListParagraphCxSpFirst
        {mso-style-priority:34;
        mso-style-type:export-only;
        margin-top:0cm;
        margin-right:0cm;
        margin-bottom:0cm;
        margin-left:36.0pt;
        margin-bottom:.0001pt;
        mso-add-space:auto;
        line-height:105%;
        font-size:11.0pt;
        font-family:"Calibri",sans-serif;}
p.MsoListParagraphCxSpMiddle, li.MsoListParagraphCxSpMiddle, div.MsoListParagraphCxSpMiddle
        {mso-style-priority:34;
        mso-style-type:export-only;
        margin-top:0cm;
        margin-right:0cm;
        margin-bottom:0cm;
        margin-left:36.0pt;
        margin-bottom:.0001pt;
        mso-add-space:auto;
        line-height:105%;
        font-size:11.0pt;
        font-family:"Calibri",sans-serif;}
p.MsoListParagraphCxSpLast, li.MsoListParagraphCxSpLast, div.MsoListParagraphCxSpLast
        {mso-style-priority:34;
        mso-style-type:export-only;
        margin-top:0cm;
        margin-right:0cm;
        margin-bottom:8.0pt;
        margin-left:36.0pt;
        mso-add-space:auto;
        line-height:105%;
        font-size:11.0pt;
        font-family:"Calibri",sans-serif;}
p.msonormal0, li.msonormal0, div.msonormal0
        {mso-style-name:msonormal;
        mso-margin-top-alt:auto;
        margin-right:0cm;
        mso-margin-bottom-alt:auto;
        margin-left:0cm;
        font-size:11.0pt;
        font-family:"Calibri",sans-serif;}
.MsoChpDefault
        {mso-style-type:export-only;}
@page WordSection1
        {size:612.0pt 792.0pt;
        margin:70.85pt 3.0cm 70.85pt 3.0cm;}
div.WordSection1
        {page:WordSection1;}
--></style>
</head>
<body lang="ES" link="blue" vlink="purple">
<div class="WordSection1">
<p class="MsoNormal">Sigo el grupo de Madrid, pero en diferido. Es posible empezar a seguir al grupo en directo, es decir, mediante Skype o similar???</p>
<p class="MsoNormal"><br>
Aquí en el país vasco no hay nigun grupo de R y creo que aunque lo formaramos nunca llegaríamos a ser tan potentes como el de Madrid…</p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">Enviado desde <a href="https://go.microsoft.com/fwlink/?LinkId=550986">
Correo</a> para Windows 10</p>
<p class="MsoNormal"><o:p> </o:p></p>
<div style="mso-element:para-border-div;border:none;border-top:solid #E1E1E1 1.0pt;padding:3.0pt 0cm 0cm 0cm">
<p class="MsoNormal" style="border:none;padding:0cm"><b>De: </b><a href="mailto:cof@qualityexcellence.es">Carlos Ortega</a><br>
<b>Enviado: </b>domingo, 4 de junio de 2017 12:11<br>
<b>Para: </b><a href="mailto:j.para.fernandez@hotmail.com">Jesús Para Fernández</a><br>
<b>CC: </b><a href="mailto:ihidalgo@jccm.es">Isidro Hidalgo Arellano</a>; <a href="mailto:mspinola10@gmail.com">
Manuel Spínola</a>; <a href="mailto:r-help-es@r-project.org">Lista R</a><br>
<b>Asunto: </b>Re: [R-es] CV en R</p>
</div>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal"><span style="font-family:"Verdana",sans-serif">H2O va bien (muy bien) tanto en un ordenador sobremesa/portátil y sobre un clúster. En uno de sobremesa si tienes buena RAM y muchos cores, mejor. Y no tienes porqué usar Spark si no necesitas
 una solución tiempo real o "near real-time". H2O tiene otra solución para interaccionar con Spark (Sparkling Water).<o:p></o:p></span></p>
<div>
<p class="MsoNormal"><span style="font-family:"Verdana",sans-serif"><o:p> </o:p></span></p>
</div>
<div>
<p class="MsoNormal"><span style="font-family:"Verdana",sans-serif">Incluso sobre un clúster, puedes usar "sparklyr" y "rsparklyng" tanto para interaccionar con Spark sin salir de "R" (usando dplyr) y para interaccionar con H2O, igualmente sin salir de "R".
 Mira las páginas de RStudio que tratan estas dos soluciones o la presentación que hizo en el Grupo de Usuarios de R de Madrid de José Luis Cañadas que contó las dos alternativas.<o:p></o:p></span></p>
</div>
<div>
<p class="MsoNormal"><span style="font-family:"Verdana",sans-serif"><o:p> </o:p></span></p>
</div>
<div>
<p class="MsoNormal"><span style="font-family:"Verdana",sans-serif"><o:p> </o:p></span></p>
</div>
<div>
<p class="MsoNormal"><o:p> </o:p></p>
<div>
<p class="MsoNormal">El 4 de junio de 2017, 12:04, Jesús Para Fernández <<a href="mailto:j.para.fernandez@hotmail.com" target="_blank">j.para.fernandez@hotmail.com</a>> escribió:<o:p></o:p></p>
<blockquote style="border:none;border-left:solid #CCCCCC 1.0pt;padding:0cm 0cm 0cm 6.0pt;margin-left:4.8pt;margin-right:0cm">
<div>
<div id="m_-4462849576671099300divtagdefaultwrapper">
<p><span style="font-size:12.0pt;color:black">H20 con grandes bases de datos y R funciona bien? O es necesario tirar de spark y demás???<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:12.0pt;color:black"><o:p> </o:p></span></p>
<div>
<p class="MsoNormal"><span style="font-size:12.0pt;color:black"><img border="0" width="457" height="2" style="width:4.7569in;height:.0208in" id="Horizontal_x0020_Line_x0020_1" src="cid:image001.png@01D2DD2B.F39C3A80"></span><span style="font-size:12.0pt;color:black"><o:p></o:p></span></p>
<div id="m_-4462849576671099300divRplyFwdMsg">
<p class="MsoNormal"><b><span style="color:black">De:</span></b><span style="color:black"> Carlos Ortega <<a href="mailto:cof@qualityexcellence.es" target="_blank">cof@qualityexcellence.es</a>><br>
<b>Enviado:</b> domingo, 4 de junio de 2017 12:02<br>
<b>Para:</b> Jesús Para Fernández<br>
<b>Cc:</b> Isidro Hidalgo Arellano; Manuel Spínola; Lista R<br>
<b>Asunto:</b> Re: [R-es] CV en R</span><span style="font-size:12.0pt;color:black">
<o:p></o:p></span></p>
<div>
<p class="MsoNormal"><span style="font-size:12.0pt;color:black"> <o:p></o:p></span></p>
</div>
</div>
<div>
<div>
<div>
<p class="MsoNormal"><span style="font-size:12.0pt;font-family:"Verdana",sans-serif;color:black">Si nos dices el tipo de problema que estás intentando solucionar y el tamaño del dataset podemos recomendarte algo más.<o:p></o:p></span></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:12.0pt;font-family:"Verdana",sans-serif;color:black">En tu pseudo-código mezclas algoritmos supervisados y no-supervisados.<o:p></o:p></span></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:12.0pt;font-family:"Verdana",sans-serif;color:black">Además de ranger, daría alguna oportunidad a "gbm" o como no a "xgboost". Y éstos los probaría dentro de H2O.<o:p></o:p></span></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:12.0pt;font-family:"Verdana",sans-serif;color:black"><o:p> </o:p></span></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:12.0pt;font-family:"Verdana",sans-serif;color:black">Saludos,<o:p></o:p></span></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:12.0pt;font-family:"Verdana",sans-serif;color:black">Carlos Ortega<o:p></o:p></span></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:12.0pt;font-family:"Verdana",sans-serif;color:black"><a href="http://www.qualityexcellence.es" target="_blank">www.qualityexcellence.es</a><o:p></o:p></span></p>
</div>
<div style="margin-bottom:15.0pt;overflow:auto" id="m_-4462849576671099300LPBorder_GT_14965706122110.5978674371367293">
<table class="MsoNormalTable" border="1" cellspacing="0" cellpadding="0" width="90%" style="width:90.0%;background:white;border-top:dotted #C8C8C8 1.0pt;border-left:none;border-bottom:dotted #C8C8C8 1.0pt;border-right:none">
<tbody>
<tr>
<td valign="top" style="border:none;padding:0cm 0cm 0cm 0cm">
<div id="m_-4462849576671099300LPTitle_14965706122090.12148427097137371">
<p class="MsoNormal" style="margin-top:15.0pt;mso-line-height-alt:15.75pt"><span style="font-size:16.0pt;font-family:"Segoe UI Light",sans-serif;color:#0078D7"><a href="http://www.qualityexcellence.es/" target="_blank">QualityExcellence</a><o:p></o:p></span></p>
</div>
<div>
<div>
<div style="margin-top:7.5pt;margin-bottom:12.0pt" id="m_-4462849576671099300LPMetadata_14965706122100.05230289010782441">
<p class="MsoNormal" style="margin-top:15.0pt;line-height:10.5pt"><span style="font-size:10.5pt;font-family:"Segoe UI",sans-serif;color:#666666"><a href="http://www.qualityexcellence.es" target="_blank">www.qualityexcellence.es</a><o:p></o:p></span></p>
</div>
<div id="m_-4462849576671099300LPDescription_14965706122100.08450972727232753">
<p class="MsoNormal" style="margin-top:15.0pt;line-height:15.0pt"><span style="font-size:10.5pt;font-family:"Segoe UI",sans-serif;color:#666666">QUALITY EXCELLENCE, consultores en calidad, procesos y mejora continua<o:p></o:p></span></p>
</div>
</div>
</div>
</td>
</tr>
</tbody>
</table>
</div>
<div>
<div>
<div>
<p class="MsoNormal"><span style="font-size:12.0pt;font-family:"Verdana",sans-serif;color:black"><o:p> </o:p></span></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:12.0pt;font-family:"Verdana",sans-serif;color:black"><o:p> </o:p></span></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:12.0pt;color:black"><o:p> </o:p></span></p>
<div>
<p class="MsoNormal"><span style="font-size:12.0pt;color:black">El 4 de junio de 2017, 9:50, Jesús Para Fernández <<a href="mailto:j.para.fernandez@hotmail.com" target="_blank">j.para.fernandez@hotmail.com</a>> escribió:<o:p></o:p></span></p>
<blockquote style="border:none;border-left:solid #CCCCCC 1.0pt;padding:0cm 0cm 0cm 6.0pt;margin-left:4.8pt;margin-right:0cm">
<div>
<div id="m_-4462849576671099300m_-1888002326253424967divtagdefaultwrapper">
<p><span style="font-size:12.0pt;color:black">El paquete ranger la verdad es que es la bomba. Acabo de probarlo y va muy muy bien. Mucho más rápido que randomForest!!!!<br>
<br>
Gracias Carlos. Algún "secretillo" más??<o:p></o:p></span></p>
<p class="MsoNormal" style="margin-bottom:12.0pt"><span style="font-size:12.0pt;color:black"><o:p> </o:p></span></p>
<div>
<p class="MsoNormal"><span style="font-size:12.0pt;color:black"><img border="0" width="450" height="2" style="width:4.6875in;height:.0208in" id="Horizontal_x0020_Line_x0020_2" src="cid:image002.png@01D2DD2B.F39C3A80"></span><span style="font-size:12.0pt;color:black"><o:p></o:p></span></p>
<div id="m_-4462849576671099300m_-1888002326253424967divRplyFwdMsg">
<p class="MsoNormal"><b><span style="color:black">De:</span></b><span style="color:black"> Carlos Ortega <<a href="mailto:cof@qualityexcellence.es" target="_blank">cof@qualityexcellence.es</a>><br>
<b>Enviado:</b> sábado, 3 de junio de 2017 21:52<br>
<b>Para:</b> Jesús Para Fernández<br>
<b>Cc:</b> Isidro Hidalgo Arellano; Manuel Spínola; Lista R<br>
<b>Asunto:</b> Re: [R-es] CV en R</span><span style="font-size:12.0pt;color:black">
<o:p></o:p></span></p>
<div>
<p class="MsoNormal"><span style="font-size:12.0pt;color:black"> <o:p></o:p></span></p>
</div>
</div>
<div>
<div>
<div>
<p class="MsoNormal"><span style="font-size:12.0pt;font-family:"Verdana",sans-serif;color:black">Hola,<o:p></o:p></span></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:12.0pt;font-family:"Verdana",sans-serif;color:black"><o:p> </o:p></span></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:12.0pt;font-family:"Verdana",sans-serif;color:black">Puedes ver aquí un ejemplo de cómo comparar varios modelos usando "caret".<o:p></o:p></span></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:12.0pt;font-family:"Verdana",sans-serif;color:black"><o:p> </o:p></span></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:12.0pt;font-family:"Verdana",sans-serif;color:black"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank">https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret</a><o:p></o:p></span></p>
</div>
<div style="margin-bottom:15.0pt;overflow:auto" id="m_-4462849576671099300m_-1888002326253424967LPBorder_GT_14965626158290.3595688376362476">
<table class="MsoNormalTable" border="1" cellspacing="0" cellpadding="0" width="90%" style="width:90.0%;background:white;border-top:dotted #C8C8C8 1.0pt;border-left:none;border-bottom:dotted #C8C8C8 1.0pt;border-right:none">
<tbody>
<tr>
<td width="250" valign="top" style="width:187.5pt;border:none;padding:15.0pt 15.0pt 15.0pt .75pt">
<div style="margin-top:5.0pt;margin-bottom:5.0pt;display:table" id="m_-4462849576671099300m_-1888002326253424967LPImageContainer_14965626158270.7104165168755627">
<p class="MsoNormal" style="margin-top:15.0pt;background:white"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:windowtext;text-decoration:none"><o:p></o:p></span></a></p>
</div>
</td>
<td valign="top" style="border:none;padding:0cm 0cm 0cm 0cm;display:table-cell" id="m_-4462849576671099300m_-1888002326253424967TextCell_14965626158280.6118187924746128">
<div id="m_-4462849576671099300m_-1888002326253424967LPTitle_14965626158280.36062352219299587">
<p class="MsoNormal" style="margin-top:15.0pt;mso-line-height-alt:15.75pt"><span style="font-size:16.0pt;font-family:"Segoe UI Light",sans-serif;color:#0078D7"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:#0078D7;text-decoration:none"><u><span style="color:blue">Statistics
 of prediction for multiple models with caret</span></u><o:p></o:p></span></a></span></p>
</div>
<div style="margin-top:7.5pt;margin-bottom:12.0pt" id="m_-4462849576671099300m_-1888002326253424967LPMetadata_14965626158280.792116124678635">
<p class="MsoNormal" style="margin-top:15.0pt;line-height:10.5pt"><span style="font-size:10.5pt;font-family:"Segoe UI",sans-serif;color:#666666"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:#666666;text-decoration:none"><u><span style="color:blue">stackoverflow.com</span></u><o:p></o:p></span></a></span></p>
</div>
<div id="m_-4462849576671099300m_-1888002326253424967LPDescription_14965626158280.05875436548058466">
<p class="MsoNormal" style="margin-top:15.0pt;line-height:15.0pt"><span style="font-size:10.5pt;font-family:"Segoe UI",sans-serif;color:#666666"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:#666666;text-decoration:none">I
 am trying to get statistics of prediction for various training models with the package caret. Below is an example that illustrates my need: library(caret) # Training: # ... Get X and Y for trai...<o:p></o:p></span></a></span></p>
</div>
</td>
</tr>
</tbody>
</table>
</div>
<p class="MsoNormal"><span style="font-size:12.0pt;color:black"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:black;text-decoration:none"><o:p> </o:p></span></a></span></p>
<div>
<p class="MsoNormal"><span style="font-size:12.0pt;font-family:"Verdana",sans-serif;color:black"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:black;text-decoration:none"><o:p> </o:p></span></a></span></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:12.0pt;font-family:"Verdana",sans-serif;color:black"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:black;text-decoration:none">O
 mejor en el propio manual de "caret", en esta sección:<o:p></o:p></span></a></span></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:12.0pt;font-family:"Verdana",sans-serif;color:black"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:black;text-decoration:none"><o:p> </o:p></span></a></span></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:12.0pt;font-family:"Verdana",sans-serif;color:black"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:black;text-decoration:none"><u><span style="color:blue">https://topepo.github.io/caret/model-training-and-tuning.html#exploring-and-comparing-resampling-distributions</span></u></span><span style="font-family:"Calibri",sans-serif;color:black;text-decoration:none">
</span><span style="font-family:"Calibri",sans-serif;color:black;text-decoration:none"><o:p></o:p></span></a></span></p>
<div style="margin-bottom:15.0pt;overflow:auto" id="m_-4462849576671099300m_-1888002326253424967LPBorder_GT_14965626142810.1640649646446959">
<table class="MsoNormalTable" border="1" cellspacing="0" cellpadding="0" width="90%" style="width:90.0%;background:white;border-top:dotted #C8C8C8 1.0pt;border-left:none;border-bottom:dotted #C8C8C8 1.0pt;border-right:none">
<tbody>
<tr>
<td valign="top" style="border:none;padding:0cm 0cm 0cm 0cm">
<div id="m_-4462849576671099300m_-1888002326253424967LPTitle_14965626142800.8798137537793522">
<p class="MsoNormal" style="margin-top:15.0pt;mso-line-height-alt:15.75pt"><span style="font-size:16.0pt;font-family:"Segoe UI Light",sans-serif;color:#0078D7"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:#0078D7;text-decoration:none"><u><span style="color:blue">The
 caret Package - GitHub Pages</span></u><o:p></o:p></span></a></span></p>
</div>
<div style="margin-top:7.5pt;margin-bottom:12.0pt" id="m_-4462849576671099300m_-1888002326253424967LPMetadata_14965626142800.37896586761846973">
<p class="MsoNormal" style="margin-top:15.0pt;line-height:10.5pt"><span style="font-size:10.5pt;font-family:"Segoe UI",sans-serif;color:#666666"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:#666666;text-decoration:none"><u><span style="color:blue">topepo.github.io</span></u><o:p></o:p></span></a></span></p>
</div>
<div id="m_-4462849576671099300m_-1888002326253424967LPDescription_14965626142810.7299584709230043">
<p class="MsoNormal" style="margin-top:15.0pt;line-height:15.0pt"><span style="font-size:10.5pt;font-family:"Segoe UI",sans-serif;color:#666666"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:#666666;text-decoration:none">5.1
 Model Training and Parameter Tuning. The caret package has several functions that attempt to streamline the model building and evaluation process.<o:p></o:p></span></a></span></p>
</div>
</td>
</tr>
</tbody>
</table>
</div>
<p class="MsoNormal" style="margin-bottom:12.0pt"><span style="font-size:12.0pt;color:black"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:black;text-decoration:none"><o:p> </o:p></span></a></span></p>
</div>
<div>
<div>
<div>
<p class="MsoNormal"><span style="font-size:12.0pt;font-family:"Verdana",sans-serif;color:black"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:black;text-decoration:none"><o:p> </o:p></span></a></span></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:12.0pt;font-family:"Verdana",sans-serif;color:black"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:black;text-decoration:none">Y
 como recomendación te sugiero que usen "ranger" en vez de "randomForest", no solo por velocidad, si no también por las mejoras y ampliaciones de funcionalidad que incorpora.<o:p></o:p></span></a></span></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:12.0pt;font-family:"Verdana",sans-serif;color:black"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:black;text-decoration:none"><o:p> </o:p></span></a></span></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:12.0pt;font-family:"Verdana",sans-serif;color:black"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:black;text-decoration:none">Saludos,<o:p></o:p></span></a></span></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:12.0pt;font-family:"Verdana",sans-serif;color:black"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:black;text-decoration:none">Carlos
 Ortega<o:p></o:p></span></a></span></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:12.0pt;font-family:"Verdana",sans-serif;color:black"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:black;text-decoration:none"><u><span style="color:blue">www.qualityexcellence.es</span></u><o:p></o:p></span></a></span></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:12.0pt;font-family:"Verdana",sans-serif;color:black"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:black;text-decoration:none"><o:p> </o:p></span></a></span></p>
</div>
</div>
</div>
</div>
<div>
<div>
<div>
<p class="MsoNormal"><span style="font-size:12.0pt;color:black"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:black;text-decoration:none"><o:p> </o:p></span></a></span></p>
<div>
<p class="MsoNormal"><span style="font-size:12.0pt;color:black"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:black;text-decoration:none">El 2 de junio de 2017,
 19:58, Jesús Para Fernández <<u><span style="color:blue">j.para.fernandez@hotmail.com</span></u>> escribió:<o:p></o:p></span></a></span></p>
<blockquote style="border:none;border-left:solid #CCCCCC 1.0pt;padding:0cm 0cm 0cm 6.0pt;margin-left:4.8pt;margin-right:0cm">
<div>
<p class="MsoNormal"><span style="font-size:12.0pt;color:black"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:black;text-decoration:none">Para el tema de los
 árboles necesarios se ve muy bien haciendo plot(modelo) y se ve en que punto se han estabilizado o si necesitas más árboles.
<o:p></o:p></span></a></span></p>
<p class="MsoNormal"><span style="font-size:12.0pt;color:black"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:black;text-decoration:none"><img border="0" width="444" height="2" style="width:4.625in;height:.0208in" id="Horizontal_x0020_Line_x0020_3" src="cid:image003.png@01D2DD2B.F39C3A80"></span><span style="color:black;text-decoration:none"><o:p></o:p></span></a></span></p>
<div id="m_-4462849576671099300m_-1888002326253424967m_-9085677846165089365divRplyFwdMsg">
<p class="MsoNormal"><b><span style="color:black"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:black;text-decoration:none">De:</span><span style="color:black;font-weight:normal;text-decoration:none">
 Isidro Hidalgo Arellano <<u><span style="color:blue">ihidalgo@jccm.es</span></u>><br>
</span><span style="color:black;text-decoration:none">Enviado:</span><span style="color:black;font-weight:normal;text-decoration:none"> viernes, 2 de junio de 2017 15:01:37<br>
</span><span style="color:black;text-decoration:none">Para:</span><span style="color:black;font-weight:normal;text-decoration:none"> 'Jesús Para Fernández'; 'Manuel Spínola'<br>
</span><span style="color:black;text-decoration:none">Cc:</span><span style="color:black;font-weight:normal;text-decoration:none"> 'Carlos Ortega'; 'Lista R'
<o:p></o:p></span></a></span></b></p>
<div>
<div>
<p class="MsoNormal"><span style="color:black"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:black;text-decoration:none"><br>
<b>Asunto:</b> RE: [R-es] CV en R<o:p></o:p></span></a></span></p>
</div>
</div>
<div>
<p class="MsoNormal"><span style="font-size:12.0pt;color:black"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:black;text-decoration:none"> <o:p></o:p></span></a></span></p>
</div>
</div>
<div>
<div>
<div>
<div>
<p class="MsoNormal"><span style="color:#1F497D"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:#1F497D;text-decoration:none">No, llega un momento en el que más
 árboles no te supone mejoría, e incluso funciona peor. Que funcione peor lo atribuyo al ruido, porque en teoría no tiene mucho sentido, la verdad... Pero no he probado a coger más árboles de los "necesarios". Lo probaré…
</span><span style="color:black;text-decoration:none"><o:p></o:p></span></a></span></p>
<p class="MsoNormal"><span style="color:#1F497D"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:#1F497D;text-decoration:none">Un saludo</span><span style="color:black;text-decoration:none"><o:p></o:p></span></a></span></p>
<p class="MsoNormal"><span style="color:#1F497D"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:#1F497D;text-decoration:none"> </span><span style="color:black;text-decoration:none"><o:p></o:p></span></a></span></p>
<div>
<div style="border:none;border-top:solid #E1E1E1 1.0pt;padding:3.0pt 0cm 0cm 0cm">
<p class="MsoNormal"><b><span style="color:black"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:black;text-decoration:none">De:</span><span style="color:black;font-weight:normal;text-decoration:none">
 Jesús Para Fernández [mailto:<u><span style="color:blue">j.para.fernandez@hotmail.com</span></u>]
<br>
</span><span style="color:black;text-decoration:none">Enviado el:</span><span style="color:black;font-weight:normal;text-decoration:none"> viernes, 02 de junio de 2017 14:54<br>
</span><span style="color:black;text-decoration:none">Para:</span><span style="color:black;font-weight:normal;text-decoration:none"> Isidro Hidalgo Arellano <<u><span style="color:blue">ihidalgo@jccm.es</span></u>>; 'Manuel Spínola' <<u><span style="color:blue">mspinola10@gmail.com</span></u>><br>
</span><span style="color:black;text-decoration:none">CC:</span><span style="color:black;font-weight:normal;text-decoration:none"> 'Carlos Ortega' <<u><span style="color:blue">cof@qualityexcellence.es</span></u>>; 'Lista R' <<u><span style="color:blue">r-help-es@r-project.org</span></u>><br>
</span><span style="color:black;text-decoration:none">Asunto:</span><span style="color:black;font-weight:normal;text-decoration:none"> Re: [R-es] CV en R</span><span style="color:black;font-weight:normal;text-decoration:none"><o:p></o:p></span></a></span></b></p>
</div>
</div>
<p class="MsoNormal"><span style="color:black"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:black;text-decoration:none"> <o:p></o:p></span></a></span></p>
<div id="m_-4462849576671099300m_-1888002326253424967m_-9085677846165089365divtagdefaultwrapper">
<p><span style="font-size:12.0pt;color:black"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:black;text-decoration:none">Si, de eso soy consciente. Normalmente
 cuantos más arboles cojas es mejor no? el problema es que se incrementa el tiempo de computación...<o:p></o:p></span></a></span></p>
<p class="MsoNormal" style="margin-bottom:12.0pt"><span style="color:black"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:black;text-decoration:none"> <o:p></o:p></span></a></span></p>
<div>
<p class="MsoNormal" align="center" style="text-align:center"><span style="font-size:12.0pt;color:black"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:black;text-decoration:none"><img border="0" width="444" height="1" style="width:4.625in;height:.0138in" id="Horizontal_x0020_Line_x0020_4" src="cid:image004.png@01D2DD2B.F39C3A80"></span><span style="color:black;text-decoration:none"><o:p></o:p></span></a></span></p>
<div id="m_-4462849576671099300m_-1888002326253424967m_-9085677846165089365divRplyFwdMsg">
<p class="MsoNormal"><b><span style="color:black"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:black;text-decoration:none">De:</span><span style="color:black;font-weight:normal;text-decoration:none">
 Isidro Hidalgo Arellano <<u><span style="color:blue">ihidalgo@jccm.es</span></u>><br>
</span><span style="color:black;text-decoration:none">Enviado:</span><span style="color:black;font-weight:normal;text-decoration:none"> viernes, 2 de junio de 2017 14:50<br>
</span><span style="color:black;text-decoration:none">Para:</span><span style="color:black;font-weight:normal;text-decoration:none"> 'Manuel Spínola'<br>
</span><span style="color:black;text-decoration:none">Cc:</span><span style="color:black;font-weight:normal;text-decoration:none"> 'Jesús Para Fernández'; 'Carlos Ortega'; 'Lista R'<br>
</span><span style="color:black;text-decoration:none">Asunto:</span><span style="color:black;font-weight:normal;text-decoration:none"> RE: [R-es] CV en R</span><span style="color:black;font-weight:normal;text-decoration:none">
<o:p></o:p></span></a></span></b></p>
<div>
<p class="MsoNormal"><span style="color:black"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:black;text-decoration:none"> <o:p></o:p></span></a></span></p>
</div>
</div>
<div>
<div>
<p><span style="color:#1F497D"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:#1F497D;text-decoration:none">El algoritmo en sí no, pero si quieres ajustar los
 parámetros (número de árboles, tamaño del nodo, etc.) hay que hacerlo.</span><span style="font-size:12.0pt;color:black;text-decoration:none"><o:p></o:p></span></a></span></p>
<p><span style="color:#1F497D"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:#1F497D;text-decoration:none">En la práctica te puedo asegurar que hay diferencia
 entre usar 500 árboles o 100, igual que el tamaño del nodo que cojas; afinar los parámetros puede suponer ajustar bastante los resultados.</span><span style="font-size:12.0pt;color:black;text-decoration:none"><o:p></o:p></span></a></span></p>
<p><span style="color:#1F497D"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:#1F497D;text-decoration:none">Un saludo</span><span style="font-size:12.0pt;color:black;text-decoration:none"><o:p></o:p></span></a></span></p>
<p><span style="color:#1F497D"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:#1F497D;text-decoration:none"> </span><span style="font-size:12.0pt;color:black;text-decoration:none"><o:p></o:p></span></a></span></p>
<p><span style="color:#1F497D"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:#1F497D;text-decoration:none"> </span><span style="font-size:12.0pt;color:black;text-decoration:none"><o:p></o:p></span></a></span></p>
<p><span style="color:#1F497D"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:#1F497D;text-decoration:none">Isidro Hidalgo Arellano</span><span style="font-size:12.0pt;color:black;text-decoration:none"><o:p></o:p></span></a></span></p>
<p><span style="color:#1F497D"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:#1F497D;text-decoration:none">Observatorio del Mercado de Trabajo</span><span style="font-size:12.0pt;color:black;text-decoration:none"><o:p></o:p></span></a></span></p>
<p><span style="color:#1F497D"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:#1F497D;text-decoration:none">Consejería de Economía, Empresas y Empleo</span><span style="font-size:12.0pt;color:black;text-decoration:none"><o:p></o:p></span></a></span></p>
<p><span style="color:#1F497D"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:#1F497D;text-decoration:none"><u><span style="color:blue">http://www.castillalamancha.es/</span></u></span><span style="font-size:12.0pt;color:black;text-decoration:none"><o:p></o:p></span></a></span></p>
<div style="margin-bottom:15.0pt;overflow:auto" id="m_-4462849576671099300m_-1888002326253424967m_-9085677846165089365LPBorder_GT_14964080292150.9233014231483192">
<table class="MsoNormalTable" border="1" cellspacing="0" cellpadding="0" width="90%" style="width:90.0%;background:white;border-top:dotted #C8C8C8 1.0pt;border-left:none;border-bottom:dotted #C8C8C8 1.0pt;border-right:none">
<tbody>
<tr>
<td valign="top" style="border:none;padding:0cm 0cm 0cm 0cm">
<div id="m_-4462849576671099300m_-1888002326253424967m_-9085677846165089365LPTitle_14964080292140.7238539581727332">
<p class="MsoNormal" style="margin-top:15.0pt"><span style="font-size:16.0pt;font-family:"Segoe UI Light",sans-serif;color:#0078D7"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:#0078D7;text-decoration:none"><u><span style="color:blue">Inicio
 | Gobierno de Castilla-La Mancha</span></u></span></a></span></p>
</div>
<div style="margin-top:7.5pt;margin-bottom:12.0pt" id="m_-4462849576671099300m_-1888002326253424967m_-9085677846165089365LPMetadata_14964080292140.18118588768764177">
<p class="MsoNormal" style="margin-top:15.0pt;line-height:10.5pt"><span style="font-size:10.5pt;font-family:"Segoe UI",sans-serif;color:#666666"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:#666666;text-decoration:none"><u><span style="color:blue">www.castillalamancha.es</span></u></span></a></span></p>
</div>
<div id="m_-4462849576671099300m_-1888002326253424967m_-9085677846165089365LPDescription_14964080292150.2905006868702227">
<p class="MsoNormal" style="margin-top:15.0pt;line-height:15.0pt"><span style="font-size:10.5pt;font-family:"Segoe UI",sans-serif;color:#666666"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:#666666;text-decoration:none">Web
 oficial del gobierno autonómico de Castilla-La Mancha con información sobre actividad administrativa, economía, educación, sanidad, servicios sociales, sede ...</span></a></span></p>
</div>
</td>
</tr>
</tbody>
</table>
</div>
<p class="MsoNormal"><span style="color:black"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:black;text-decoration:none"> <o:p></o:p></span></a></span></p>
<p><span style="color:#1F497D"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:#1F497D;text-decoration:none"> </span><span style="font-size:12.0pt;color:black;text-decoration:none"><o:p></o:p></span></a></span></p>
<p><span style="color:#1F497D"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:#1F497D;text-decoration:none"> </span><span style="font-size:12.0pt;color:black;text-decoration:none"><o:p></o:p></span></a></span></p>
<p><span style="color:#1F497D"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:#1F497D;text-decoration:none"> </span><span style="font-size:12.0pt;color:black;text-decoration:none"><o:p></o:p></span></a></span></p>
<p><b><span style="color:black"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:black;text-decoration:none">De:</span><span style="color:black;font-weight:normal;text-decoration:none">
 Manuel Spínola [<u><span style="color:blue">mailto:mspinola10@gmail.com</span></u>]
<br>
</span><span style="color:black;text-decoration:none">Enviado el:</span><span style="color:black;font-weight:normal;text-decoration:none"> viernes, 02 de junio de 2017 14:42<br>
</span><span style="color:black;text-decoration:none">Para:</span><span style="color:black;font-weight:normal;text-decoration:none"> Isidro Hidalgo Arellano <<u><span style="color:blue">ihidalgo@jccm.es</span></u>><br>
</span><span style="color:black;text-decoration:none">CC:</span><span style="color:black;font-weight:normal;text-decoration:none"> Jesús Para Fernández <<u><span style="color:blue">j.para.fernandez@hotmail.com</span></u>>; Carlos Ortega <<u><span style="color:blue">cof@qualityexcellence.es</span></u>>;
 Lista R <<u><span style="color:blue">r-help-es@r-project.org</span></u>><br>
</span><span style="color:black;text-decoration:none">Asunto:</span><span style="color:black;font-weight:normal;text-decoration:none"> Re: [R-es] CV en R</span><span style="font-size:12.0pt;color:black;font-weight:normal;text-decoration:none"><o:p></o:p></span></a></span></b></p>
<p><span style="font-size:12.0pt;color:black"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:black;text-decoration:none"> <o:p></o:p></span></a></span></p>
<div>
<p><span style="font-size:12.0pt;color:black"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:black;text-decoration:none">Hola,<o:p></o:p></span></a></span></p>
<div>
<p><span style="font-size:12.0pt;color:black"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:black;text-decoration:none"> <o:p></o:p></span></a></span></p>
</div>
<div>
<p><span style="font-size:12.0pt;color:black"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:black;text-decoration:none">No soy un experto en estas técnicas,
 pero hasta donde yo se, el algoritmo Random Forest no requiere cross validation.<o:p></o:p></span></a></span></p>
</div>
<div>
<p><span style="font-size:12.0pt;color:black"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:black;text-decoration:none"> <o:p></o:p></span></a></span></p>
</div>
<div>
<p><span style="font-size:12.0pt;color:black"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:black;text-decoration:none">Lo dice el mismo Leo Breiman que creo
 ha sido uno de los investigadores que más ha contribuido al desarrollo de Random Forest (<u><span style="color:blue">https://www.stat.berkeley.edu/~breiman/RandomForests/cc_home.htm</span></u>)<o:p></o:p></span></a></span></p>
<div style="margin-bottom:15.0pt;overflow:auto" id="m_-4462849576671099300m_-1888002326253424967m_-9085677846165089365LPBorder_GT_14964080297550.22420557605458558">
<table class="MsoNormalTable" border="1" cellspacing="0" cellpadding="0" width="90%" style="width:90.0%;background:white;border-top:dotted #C8C8C8 1.0pt;border-left:none;border-bottom:dotted #C8C8C8 1.0pt;border-right:none">
<tbody>
<tr>
<td valign="top" style="border:none;padding:0cm 0cm 0cm 0cm">
<div id="m_-4462849576671099300m_-1888002326253424967m_-9085677846165089365LPTitle_14964080297520.9458307265846073">
<p class="MsoNormal" style="margin-top:15.0pt"><span style="font-size:16.0pt;font-family:"Segoe UI Light",sans-serif;color:#0078D7"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:#0078D7;text-decoration:none"><u><span style="color:blue">Random
 forests - classification description</span></u></span></a></span></p>
</div>
<div style="margin-top:7.5pt;margin-bottom:12.0pt" id="m_-4462849576671099300m_-1888002326253424967m_-9085677846165089365LPMetadata_14964080297530.21158934712109123">
<p class="MsoNormal" style="margin-top:15.0pt;line-height:10.5pt"><span style="font-size:10.5pt;font-family:"Segoe UI",sans-serif;color:#666666"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:#666666;text-decoration:none"><u><span style="color:blue">www.stat.berkeley.edu</span></u></span></a></span></p>
</div>
<div id="m_-4462849576671099300m_-1888002326253424967m_-9085677846165089365LPDescription_14964080297540.8770774795173224">
<p class="MsoNormal" style="margin-top:15.0pt;line-height:15.0pt"><span style="font-size:10.5pt;font-family:"Segoe UI",sans-serif;color:#666666"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:#666666;text-decoration:none">Contents.
 Introduction Overview Features of random forests Remarks How Random Forests work The oob error estimate Variable importance Gini importance</span></a></span></p>
</div>
</td>
</tr>
</tbody>
</table>
</div>
<p class="MsoNormal"><span style="color:black"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:black;text-decoration:none"> <o:p></o:p></span></a></span></p>
</div>
<div>
<p><span style="font-size:12.0pt;color:black"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:black;text-decoration:none"> <o:p></o:p></span></a></span></p>
</div>
<div>
<p><span style="font-size:12.0pt;color:black"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:black;text-decoration:none">Manuel<o:p></o:p></span></a></span></p>
</div>
</div>
<div>
<p><span style="font-size:12.0pt;color:black"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:black;text-decoration:none"> <o:p></o:p></span></a></span></p>
<div>
<p><span style="font-size:12.0pt;color:black"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:black;text-decoration:none">El 2 de junio de 2017, 6:35, Isidro Hidalgo
 Arellano <<u><span style="color:blue">ihidalgo@jccm.es</span></u>> escribió:<o:p></o:p></span></a></span></p>
<blockquote style="border:none;border-left:solid #CCCCCC 1.0pt;padding:0cm 0cm 0cm 6.0pt;margin-left:4.8pt;margin-top:5.0pt;margin-right:0cm;margin-bottom:5.0pt">
<p><span style="font-size:12.0pt;color:black"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:black;text-decoration:none">Una vez que tienes la técnica y los parámetros
 óptimos resultantes de la<br>
validación cruzada, ya tienes el modelo que necesitas, NO tienes que hacer<br>
nada más. Si vuelves a modelar con todos los datos todo el trabajo de<br>
validación que has hecho lo envías a hacer gárgaras. Estarías construyendo<br>
un modelo con sobreajuste.<br>
<br>
<br>
<br>
Para quedarte tranquilo, haz la prueba, coge el modelo resultante de la<br>
validación y ve aplicándolo a los nuevos datos. Haz lo mismo con el que<br>
obtengas de ése paso final que NO debes dar, y que no te he puesto en mi<br>
código corregido, a saber:<br>
<br>
modelo.final<-randomForest(respuesta~.,datos)<br>
<br>
<br>
<br>
Cuando los aplicas con los nuevos datos, ¿cuál funciona mejor?<br>
<br>
<br>
<br>
Un saludo<br>
<br>
<br>
<br>
<br>
<br>
Isidro Hidalgo Arellano<br>
<br>
Observatorio del Mercado de Trabajo<br>
<br>
Consejería de Economía, Empresas y Empleo<br>
<br>
<u><span style="color:blue">http://www.castillalamancha.es/</span></u><br>
<br>
<br>
<br>
<br>
<br>
<br>
<br>
De: Jesús Para Fernández [mailto:<u><span style="color:blue">j.para.fernandez@hotmail.com</span></u>]<br>
Enviado el: viernes, 02 de junio de 2017 14:21<br>
Para: Carlos Ortega <<u><span style="color:blue">cof@qualityexcellence.es</span></u>><br>
CC: Lista R <<u><span style="color:blue">r-help-es@r-project.org</span></u>>; Isidro Hidalgo Arellano<br>
<<u><span style="color:blue">ihidalgo@jccm.es</span></u>><br>
Asunto: Re: [R-es] CV en R<br>
<br>
<br>
<br>
Pero creo que hay un concepto que no termina de aclararse.<br>
<br>
<br>
<br>
Creo que lo importante es quedarse con el modelo bueno, por ejemplo,<br>
imaginemos que queremos probar los siguientes algoritmos: RF, SVM, KNN,<br>
LDA....<br>
<br>
<br>
<br>
Entonces hacemos lo siguiente:<br>
<br>
<br>
<br>
Probamos con todos ellos, para lo que se hacen particiones:<br>
<br>
<br>
<br>
Imaginemos que tengo un datasheet llamado datos, perfectamnte balanceado,<br>
sin datos faltantes, ni ruido ni nada asi. Entonces:<br>
<br>
<br>
<br>
for(i in 1:10){<br>
<br>
train #saco el train de los datos<br>
<br>
test #saco el test de los datos<br>
<br>
pruebo RF, con diferentes configuaraciones (bucles j,k)<br>
<br>
pruebo SVM, con diferentes configuaraciones (bucles j,k)<br>
<br>
pruebo KNN<br>
<br>
pruebo LDA<br>
<br>
<br>
<br>
guardo resultados<br>
<br>
<br>
<br>
}<br>
<br>
<br>
<br>
y sobre el que mejor de, entonces ya creo el modelo definitivo, con el<br>
conjunto de datos global. Si fuera un randomForest<br>
<br>
<br>
<br>
randomForest(respuesta~.,ntree=500,nodesize=4,datos)<br>
<br>
<br>
<br>
Y ese es mi modelo para los proximos daots que vengan yq ue no han formado<br>
parte del datasheet datos<br>
<br>
<br>
<br>
  _____<br>
<br>
De: Carlos Ortega < <mailto:<u><span style="color:blue">cof@qualityexcellence.es</span></u>><br>
<u><span style="color:blue">cof@qualityexcellence.es</span></u>><br>
Enviado: viernes, 2 de junio de 2017 13:11<br>
Para: Jesús Para Fernández<br>
Cc: Lista R; Isidro Hidalgo Arellano<br>
Asunto: Re: [R-es] CV en R<br>
<br>
<br>
<br>
Hola,<br>
<br>
<br>
<br>
Eso es justamente lo que hace "caret" de una manera muy sencilla y sin que<br>
tú te tengas que preocupar de quedarte con el mejor bucket  (del CV) o con<br>
la mejor combinación en tu "grid search".<br>
<br>
<br>
<br>
Te recomiendo que uses "caret" para esto....<br>
<br>
Puedes incluso evaluar los dos algoritmos "RF" y "svm" a la vez y conocer<br>
realmente el nivel de precisión que ofrecen ambos.<br>
<br>
Y claro, inicialmente puedes elegir el conjunto de entrenamiento sobre el<br>
que haces el CV dejando el resto "test" para validar el nivel de predicción.<br>
<br>
<br>
<br>
Gracias,<br>
<br>
Carlos Ortega<br>
<br>
 <<u><span style="color:blue">http://www.qualityexcellence.es</span></u>> <u><span style="color:blue">www.qualityexcellence.es</span></u><br>
<br>
<br>
 <<u><span style="color:blue">http://www.qualityexcellence.es/</span></u>> QualityExcellence<br>
<br>
 <<u><span style="color:blue">http://www.qualityexcellence.es</span></u>> <u><span style="color:blue">www.qualityexcellence.es</span></u><br>
<br>
QUALITY EXCELLENCE, consultores en calidad, procesos y mejora continua<br>
<br>
<br>
<br>
<br>
<br>
El 2 de junio de 2017, 13:06, Isidro Hidalgo Arellano <<br>
<mailto:<u><span style="color:blue">ihidalgo@jccm.es</span></u>> <u><span style="color:blue">ihidalgo@jccm.es</span></u>> escribió:<o:p></o:p></span></a></span></p>
<div>
<div>
<p><span style="font-size:12.0pt;color:black"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:black;text-decoration:none"><br>
No me has parecido para nada borde.<br>
<br>
<br>
<br>
Ok. Centrémonos en RF y bajemos el nº de parámetros a 2: ntree y nodesize.<br>
<br>
Te haces una parrilla de ntree: 100, 200, 300, 400, 500<br>
<br>
Otra de nodesize: 3, 6, 10<br>
<br>
Con esto tienes 15 combinaciones.<br>
<br>
Vamos al código. Simplemente crea una lista donde metes los resultados (y<br>
tienes que añadir los parámetros, que has omitido)<br>
<br>
Después graficas usando un mapa de calor para ver qué combinación de<br>
parámetros te da el mejor resultado (en abscisas ntree y en ordenadas<br>
nodesize). Una vez que veas los intervalos de parámetros que mejor se<br>
comportan, afinas el resultado con otra validación cruzada:<br>
<br>
<br>
<br>
for(i in 1:15){<br>
<br>
<br>
<br>
numeros<-sample(1:1500,1500*0.7)<br>
<br>
<br>
<br>
train<-datos[numeros,]<br>
<br>
<br>
<br>
test<-datos[-numeros,]<br>
<br>
<br>
<br>
<br>
<br>
#modeloRF<br>
<br>
<br>
<br>
resultadoRF <- list()<br>
<br>
<br>
<br>
modelo.rf<-randomForest(respuesta~,train)<br>
<br>
<br>
<br>
prediccion<-predict(modelo.rf,test)<br>
<br>
<br>
<br>
fp<-table(prediccion,test$respuesta)[2,1]<br>
<br>
fn<-table(prediccion,test$respuesta)[1,2]<br>
<br>
error<-(fp+fn)/nrow(train.balanceado)<br>
<br>
resultadoRF[[i]]<-rbind(resultado,data.frame(error=error,modelo="rf"))<br>
<br>
<br>
<br>
#modelo SVM<br>
<br>
<br>
<br>
resultadoSVM <- list()<br>
<br>
<br>
<br>
modelo.svm<-svm(respuesta~,train)<br>
<br>
<br>
<br>
prediccion<-predict(modelo.svm,test)<br>
<br>
<br>
<br>
fp<-table(prediccion,test$respuesta)[2,1]<br>
<br>
fn<-table(prediccion,test$respuesta)[1,2]<br>
<br>
error<-(fp+fn)/nrow(train.balanceado)<br>
<br>
resultadoSVM[[i]]<-rbind(resultado,data.frame(error=error,modelo="svm"))<br>
<br>
<br>
<br>
}<br>
<br>
<br>
<br>
Un saludo<br>
<br>
<br>
<br>
Isidro Hidalgo Arellano<br>
<br>
Observatorio del Mercado de Trabajo<br>
<br>
Consejería de Economía, Empresas y Empleo<o:p></o:p></span></a></span></p>
</div>
</div>
<p><span style="font-size:12.0pt;color:black"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:black;text-decoration:none"> <<u><span style="color:blue">http://www.castillalamancha.es/</span></u>>
<u><span style="color:blue">http://www.castillalamancha.es/</span></u><br>
<br>
<br>
<br>
<br>
<br>
<br>
<br>
De: Jesús Para Fernández [mailto: <mailto:<u><span style="color:blue">j.para.fernandez@hotmail.com</span></u>><br>
<u><span style="color:blue">j.para.fernandez@hotmail.com</span></u>]<br>
Enviado el: viernes, 02 de junio de 2017 12:50<br>
Para: Isidro Hidalgo Arellano < <mailto:<u><span style="color:blue">ihidalgo@jccm.es</span></u>>
<u><span style="color:blue">ihidalgo@jccm.es</span></u>>;<br>
<mailto:<u><span style="color:blue">r-help-es@r-project.org</span></u>> <u><span style="color:blue">r-help-es@r-project.org</span></u><br>
Asunto: Re: [R-es] CV en R<br>
<br>
<br>
<br>
Buenas,<br>
<br>
<br>
<br>
Puse los modelos lo mas simplificados, para centrar el tiro en el tema que<br>
me preocupa.<br>
<br>
<br>
<br>
Es una pena no poder hablar cara a cara, porque por email puedo sonar algo<br>
borde, pero no es así, al contrario estoy enormemente agradecido por tu<br>
ayuda, pero le veo un problema.<br>
<br>
Me dices que use un list para ir guardando el modelo, pero tal y como he<br>
propuesto en el bucle for, el modelo se crea 10 veces, es decir, que<br>
entiendo que si es un randomForest, tendria que entonces hacer una<br>
combinacion de esos 10 modelos con la funcion combine de RF para unir esos<br>
modelos, verdad?? Porque sino estaria en el mismo problema, generando un<br>
modelo generalista de una simple submuestra de los datos.<br>
<br>
<br>
<br>
Gracias por todo!!!<br>
<br>
Jesús<br>
<br>
<br>
<br>
  _____<br>
<br>
De: Isidro Hidalgo Arellano < <mailto:<u><span style="color:blue">ihidalgo@jccm.es</span></u>>
<u><span style="color:blue">ihidalgo@jccm.es</span></u><br>
<mailto: <mailto:<u><span style="color:blue">ihidalgo@jccm.es</span></u>> <u><span style="color:blue">ihidalgo@jccm.es</span></u>> ><br>
Enviado: viernes, 2 de junio de 2017 12:28<br>
Para: 'Jesús Para Fernández';  <mailto:<u><span style="color:blue">r-help-es@r-project.org</span></u>><br>
<u><span style="color:blue">r-help-es@r-project.org</span></u><br>
<mailto: <mailto:<u><span style="color:blue">r-help-es@r-project.org</span></u>> <u>
<span style="color:blue">r-help-es@r-project.org</span></u>><o:p></o:p></span></a></span></p>
<div>
<div>
<p><span style="font-size:12.0pt;color:black"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:black;text-decoration:none">Asunto: RE: [R-es] CV en R<br>
<br>
<br>
<br>
<br>
No me había fijado en el código, te había he contestado teóricamente.<br>
<br>
A ver, en ese código tienes varios problemas:<br>
<br>
-          No especificas los parámetros del modelo (para eso es la<br>
validación cruzada). En RF tendrías que especificar el número de árboles, la<br>
cantidad de puntos con los que acotar la regresión, etc. En SVM el tipo de<br>
kernel que vas a usar, la sensibilidad… NO SE TRATA SÓLO de hacer modelos<br>
con diferentes conjuntos de entrenamiento, sino de buscar los parámetros que<br>
mejor ajustan los datos.<br>
<br>
Te pongo un ejemplo: imagínate que tienes mucho ruido, en ese caso, en cada<br>
punto de regresión, tendrás que tomar un número de puntos mayor (parámetro<br>
"nodesize")<br>
<br>
-          Respecto a no guardar los modelos, es muy fácil con una lista.<br>
Cada modelo que hagas, guárdalo en un lista, junto con los datos de<br>
resultados que quieras (incluyendo los parámetros de especificación del<br>
modelo)<br>
<br>
Te recomiendo 2 cosas:<br>
<br>
-          Usa el paquete caret<br>
<br>
-          Lee este libro:<br>
 <<u><span style="color:blue">https://link.springer.com/book/10.1007/978-1-4614-6849-3</span></u>><br>
<u><span style="color:blue">https://link.springer.com/book/10.1007/978-1-4614-6849-3</span></u><br>
<br>
Con el libro matas varios pájaros de un tiro:<br>
<br>
-          Aprendes algo de teoría (poca), que siempre viene bien<br>
<br>
-          El autor es el creador del paquete caret<br>
<br>
Si tienes tiempo, yo buscaría un curso del MIT que es muy bueno, aunque de<br>
los duros, te lo tienes que programar casi todo desde 0, pero cuando acabas,<br>
la teoría (con éste sí) la has machacado bastante bien, y sabes lo que hace<br>
un SVM, un RF. Es éste:<o:p></o:p></span></a></span></p>
</div>
</div>
<p><span style="font-size:12.0pt;color:black"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:black;text-decoration:none"><<u><span style="color:blue">https://www.edx.org/course/learning-data-introductory-machine-caltechx-cs11<br>
56x</span></u>><br>
<u><span style="color:blue">https://www.edx.org/course/learning-data-introductory-machine-caltechx-cs115<br>
6x</span></u><br>
<br>
<br>
<br>
<br>
<<br>
<<u><span style="color:blue">https://www.edx.org/course/learning-data-introductory-machine-caltechx-cs11<br>
56x</span></u>><br>
<u><span style="color:blue">https://www.edx.org/course/learning-data-introductory-machine-caltechx-cs11<br>
56x</span></u>><br>
<br>
<br>
<<br>
<<u><span style="color:blue">https://www.edx.org/course/learning-data-introductory-machine-caltechx-cs11</span></u><br>
><br>
<u><span style="color:blue">https://www.edx.org/course/learning-data-introductory-machine-caltechx-cs11<br>
56x</span></u>> Learning From Data (Introductory Machine Learning) | edX<br>
<br>
 <<u><span style="color:blue">http://www.edx.org</span></u>> <u><span style="color:blue">www.edx.org</span></u> < <<u><span style="color:blue">http://www.edx.org</span></u>>
<u><span style="color:blue">http://www.edx.org</span></u>><br>
<br>
Introductory Machine Learning course covering theory, algorithms and<br>
applications. Our focus is on real understanding, not just "knowing."<br>
<br>
<br>
<br>
Tiene un libro asociado que está muy bien también.<br>
<br>
Si te da miedito, hay otro más suave, de los clásicos Hastie y Tibshirani:<br>
<br>
<<u><span style="color:blue">https://lagunita.stanford.edu/courses/HumanitiesSciences/StatLearning/Winte<br>
r2016/about</span></u>><br>
<u><span style="color:blue">https://lagunita.stanford.edu/courses/HumanitiesSciences/StatLearning/Winter<br>
2016/about</span></u><br>
<br>
<br>
<br>
<<br>
<<u><span style="color:blue">https://lagunita.stanford.edu/courses/HumanitiesSciences/StatLearning/Winte<br>
r2016/about</span></u>><br>
<u><span style="color:blue">https://lagunita.stanford.edu/courses/HumanitiesSciences/StatLearning/Winte<br>
r2016/about</span></u>> Statistical Learning | Stanford Lagunita<br>
<br>
 <<u><span style="color:blue">http://lagunita.stanford.edu</span></u>> <u><span style="color:blue">lagunita.stanford.edu</span></u><br>
<br>
StatLearning now self paced! The active course run for Statistical Learning<br>
has ended, but the course is now available in a self paced mode. You are<br>
welcome to join ...<br>
<br>
<br>
<br>
Éstos también tienen 2 libros muy buenos. El resumido es en el que se basa<br>
el curso anterior.<br>
<br>
<br>
<br>
De: Jesús Para Fernández [mailto: <mailto:<u><span style="color:blue">j.para.fernandez@hotmail.com</span></u>><br>
<u><span style="color:blue">j.para.fernandez@hotmail.com</span></u>]<br>
Enviado el: viernes, 02 de junio de 2017 12:04<br>
Para: Isidro Hidalgo Arellano < <mailto:<u><span style="color:blue">ihidalgo@jccm.es</span></u>>
<u><span style="color:blue">ihidalgo@jccm.es</span></u><br>
<mailto: <mailto:<u><span style="color:blue">ihidalgo@jccm.es</span></u>> <u><span style="color:blue">ihidalgo@jccm.es</span></u>> >;<br>
 <mailto:<u><span style="color:blue">r-help-es@r-project.org</span></u>> <u><span style="color:blue">r-help-es@r-project.org</span></u> <mailto:<br>
<mailto:<u><span style="color:blue">r-help-es@r-project.org</span></u>> <u><span style="color:blue">r-help-es@r-project.org</span></u>><br>
Asunto: Re: [R-es] CV en R<br>
<br>
<br>
<br>
Es que es justo ahi donde no se como hacerlo.<br>
<br>
Es decir, dentro del bucle for hago las comprobaciones train test, y me da<br>
que de media el mejor es randomForest, pero claro, no me estoy quedando con<br>
el modelo, ya que no se va guardando....Entonces es cuando no se como seguir<br>
para quedarme con ese modelo....<br>
<br>
<br>
<br>
<br>
<br>
<br>
<br>
<br>
<br>
  _____<br>
<br>
De: Isidro Hidalgo Arellano < <mailto: <mailto:<u><span style="color:blue">ihidalgo@jccm.es</span></u>><br>
<u><span style="color:blue">ihidalgo@jccm.es</span></u>>  <mailto:<u><span style="color:blue">ihidalgo@jccm.es</span></u>>
<u><span style="color:blue">ihidalgo@jccm.es</span></u>><br>
Enviado: viernes, 2 de junio de 2017 11:59<br>
Para: 'Jesús Para Fernández';  <mailto: <mailto:<u><span style="color:blue">r-help-es@r-project.org</span></u>><br>
<u><span style="color:blue">r-help-es@r-project.org</span></u>><br>
 <mailto:<u><span style="color:blue">r-help-es@r-project.org</span></u>> <u><span style="color:blue">r-help-es@r-project.org</span></u><br>
Asunto: RE: [R-es] CV en R<br>
<br>
<br>
<br>
No, no. Si construyes el modelo con todos los datos, explícame para qué te<br>
ha servido la validación cruzada... ¿Sólo para saber si funciona mejor SVM o<br>
RF con ese conjunto de datos? Eso es insuficiente.<br>
Cuando construyes un modelo, lo haces entrenando con datos que el modelo NO<br>
VE, ahí está la gracia...<br>
Te tienes que quedar con el mejor modelo entrenado. Y después ver cómo te<br>
funciona en la vida real, es decir, con nuevos datos que el modelo NO HA<br>
VISTO.<br>
<br>
Un saludo.<br>
<br>
<br>
Isidro Hidalgo Arellano<br>
Observatorio del Mercado de Trabajo<br>
Consejería de Economía, Empresas y Empleo<br>
 < <<u><span style="color:blue">http://www.castillalamancha.es/</span></u>> <u><span style="color:blue">http://www.castillalamancha.es/</span></u>><br>
<<u><span style="color:blue">http://www.castillalamancha.es/</span></u>> <u><span style="color:blue">http://www.castillalamancha.es/</span></u><br>
<br>
<br>
 < <<u><span style="color:blue">http://www.castillalamancha.es/</span></u>> <u><span style="color:blue">http://www.castillalamancha.es/</span></u>> Inicio<br>
| Gobierno de Castilla-La Mancha<br>
<br>
 < <<u><span style="color:blue">http://www.castillalamancha.es</span></u>> <u><span style="color:blue">http://www.castillalamancha.es</span></u>><br>
<<u><span style="color:blue">http://www.castillalamancha.es</span></u>> <u><span style="color:blue">www.castillalamancha.es</span></u><br>
<br>
Web oficial del gobierno autonómico de Castilla-La Mancha con información<br>
sobre actividad administrativa, economía, educación, sanidad, servicios<br>
sociales, sede ...<br>
<br>
<br>
<br>
<br>
<br>
<br>
-----Mensaje original-----<br>
De: R-help-es [ <mailto: <mailto:<u><span style="color:blue">r-help-es-bounces@r-project.org</span></u>><br>
<u><span style="color:blue">r-help-es-bounces@r-project.org</span></u>><br>
mailto: <mailto:<u><span style="color:blue">r-help-es-bounces@r-project.org</span></u>><br>
<u><span style="color:blue">r-help-es-bounces@r-project.org</span></u>] En nombre de Jesús<br>
Para Fernández<br>
Enviado el: viernes, 02 de junio de 2017 11:48<br>
Para:  <mailto: <mailto:<u><span style="color:blue">r-help-es@r-project.org</span></u>>
<u><span style="color:blue">r-help-es@r-project.org</span></u>><br>
<mailto:<u><span style="color:blue">r-help-es@r-project.org</span></u>> <u><span style="color:blue">r-help-es@r-project.org</span></u><o:p></o:p></span></a></span></p>
<div>
<div>
<p><span style="font-size:12.0pt;color:black"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:black;text-decoration:none"><br>
Asunto: [R-es] CV en R<br>
<br>
Buenas,<br>
<br>
<br>
Estoy haciendo modelos y comparando cual es mejor. Para ello, uso CV de 10<br>
folds.<br>
<br>
<br>
Por ejemplo, hago la comparativa entre un svm y un randomForest para una<br>
serie de datos, por ello hago:<br>
<br>
<br>
midataset<-import.....<br>
<br>
<br>
#datos es un dataframe de 1500 filas y 15 variables<br>
<br>
<br>
for(i in 1:10){<br>
<br>
numeros<-sample(1:1500,1500*0.7)<br>
<br>
train<-datos[numeros,]<br>
<br>
test<-datos[-numeros,]<br>
<br>
<br>
#modeloRF<br>
<br>
modelo.rf<-randomForest(respuesta~,train)<br>
<br>
prediccion<-predict(modelo.rf,test)<br>
<br>
fp<-table(prediccion,test$respuesta)[2,1]<br>
fn<-table(prediccion,test$respuesta)[1,2]<br>
error<-(fp+fn)/nrow(train.balanceado)<br>
resultado<-rbind(resultado,data.frame(error=error,modelo="rf"))<br>
<br>
#modelo SVM<br>
<br>
<br>
modelo.svm<-svm(respuesta~,train)<br>
<br>
prediccion<-predict(modelo.svm,test)<br>
<br>
fp<-table(prediccion,test$respuesta)[2,1]<br>
fn<-table(prediccion,test$respuesta)[1,2]<br>
error<-(fp+fn)/nrow(train.balanceado)<br>
resultado<-rbind(resultado,data.frame(error=error,modelo="svm"))<br>
<br>
}<br>
<br>
<br>
Mi pregunta es la siguiente. Si el modelo de RF es mejor, como me quedo con<br>
el modelo final? Tengo que crear el modelo de nuevo, sin tener en cuenta el<br>
train?<br>
<br>
<br>
modelo.final<-randomForest(respuesta~.,datos)<br>
<br>
<br>
Gracias!!!!<br>
<br>
<br>
<br>
<br>
        [[alternative HTML version deleted]]<br>
<br>
_______________________________________________<br>
R-help-es mailing list<o:p></o:p></span></a></span></p>
</div>
</div>
<p><span style="font-size:12.0pt;color:black"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:black;text-decoration:none"> <mailto: <mailto:<u><span style="color:blue">R-help-es@r-project.org</span></u>>
<u><span style="color:blue">R-help-es@r-project.org</span></u>><br>
<mailto:<u><span style="color:blue">R-help-es@r-project.org</span></u>> <u><span style="color:blue">R-help-es@r-project.org</span></u><br>
 < <<u><span style="color:blue">https://stat.ethz.ch/mailman/listinfo/r-help-es</span></u>><br>
<u><span style="color:blue">https://stat.ethz.ch/mailman/listinfo/r-help-es</span></u>><br>
<br>
 <<u><span style="color:blue">https://stat.ethz.ch/mailman/listinfo/r-help-es</span></u>><br>
<u><span style="color:blue">https://stat.ethz.ch/mailman/listinfo/r-help-es</span></u><br>
<br>
<br>
        [[alternative HTML version deleted]]<br>
<br>
<br>
_______________________________________________<br>
R-help-es mailing list<br>
 <mailto:<u><span style="color:blue">R-help-es@r-project.org</span></u>> <u><span style="color:blue">R-help-es@r-project.org</span></u><br>
 <<u><span style="color:blue">https://stat.ethz.ch/mailman/listinfo/r-help-es</span></u>><br>
<u><span style="color:blue">https://stat.ethz.ch/mailman/listinfo/r-help-es</span></u><br>
</span><span style="color:#888888;text-decoration:none"><br>
<br>
<br>
<br>
<br>
<br>
<br>
--<br>
<br>
Saludos,<br>
Carlos Ortega<br>
 <<u><span style="color:blue">http://www.qualityexcellence.es</span></u>> <u><span style="color:blue">www.qualityexcellence.es</span></u><br>
<br>
<br>
        [[alternative HTML version deleted]]<br>
<br>
</span><span style="color:black;text-decoration:none"><br>
_______________________________________________<br>
R-help-es mailing list<br>
<u><span style="color:blue">R-help-es@r-project.org</span></u><br>
<u><span style="color:blue">https://stat.ethz.ch/mailman/listinfo/r-help-es</span></u><o:p></o:p></span></a></span></p>
</blockquote>
</div>
<p><span style="font-size:12.0pt;color:black"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:black;text-decoration:none"><br>
<br clear="all">
<o:p></o:p></span></a></span></p>
<div>
<p><span style="font-size:12.0pt;color:black"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:black;text-decoration:none"> <o:p></o:p></span></a></span></p>
</div>
<p><span style="font-size:12.0pt;color:black"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:black;text-decoration:none">--
<o:p></o:p></span></a></span></p>
<div>
<div>
<div>
<p><b><span style="font-size:12.0pt;color:black"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:black;text-decoration:none">Manuel Spínola, Ph.D.</span><span style="color:black;font-weight:normal;text-decoration:none">
<br>
Instituto Internacional en Conservación y Manejo de Vida Silvestre <br>
Universidad Nacional <br>
Apartado 1350-3000 <br>
Heredia <br>
COSTA RICA <br>
<u><span style="color:blue">mspinola@una.cr</span></u> <br>
<u><span style="color:blue">mspinola10@gmail.com</span></u> <br>
Teléfono: (506) 8706 - 4662<br>
Personal website: <u><span style="color:blue">Lobito de río</span></u> <br>
Institutional website: <u><span style="color:blue">ICOMVIS</span></u><o:p></o:p></span></a></span></b></p>
</div>
</div>
</div>
</div>
</div>
</div>
</div>
</div>
</div>
</div>
</div>
</div>
</div>
</blockquote>
</div>
<p class="MsoNormal"><span style="font-size:12.0pt;color:black"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:black;text-decoration:none"><br>
<br clear="all">
<o:p></o:p></span></a></span></p>
<div>
<p class="MsoNormal"><span style="font-size:12.0pt;color:black"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:black;text-decoration:none"><o:p> </o:p></span></a></span></p>
</div>
<p class="MsoNormal"><span style="font-size:12.0pt;color:black"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:black;text-decoration:none">--
<o:p></o:p></span></a></span></p>
<div>
<p class="MsoNormal"><span style="font-size:12.0pt;font-family:"Verdana",sans-serif;color:black"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:black;text-decoration:none">Saludos,<br>
Carlos Ortega<br>
<u><span style="color:blue">www.qualityexcellence.es</span></u></span><span style="font-family:"Calibri",sans-serif;color:black;text-decoration:none"><o:p></o:p></span></a></span></p>
</div>
</div>
</div>
</div>
</div>
</div>
</div>
</div>
</blockquote>
</div>
<p class="MsoNormal"><span style="font-size:12.0pt;color:black"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:black;text-decoration:none"><br>
<br clear="all">
<o:p></o:p></span></a></span></p>
<div>
<p class="MsoNormal"><span style="font-size:12.0pt;color:black"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:black;text-decoration:none"><o:p> </o:p></span></a></span></p>
</div>
<p class="MsoNormal"><span style="font-size:12.0pt;color:black"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:black;text-decoration:none">--
<o:p></o:p></span></a></span></p>
<div>
<p class="MsoNormal"><span style="font-size:12.0pt;font-family:"Verdana",sans-serif;color:black"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:black;text-decoration:none">Saludos,<br>
Carlos Ortega<br>
<u><span style="color:blue">www.qualityexcellence.es</span></u></span><span style="font-family:"Calibri",sans-serif;color:black;text-decoration:none"><o:p></o:p></span></a></span></p>
</div>
</div>
</div>
</div>
</div>
</div>
</div>
</div>
</div>
</blockquote>
</div>
<p class="MsoNormal"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:windowtext;text-decoration:none"><br>
<br clear="all">
<o:p></o:p></span></a></p>
<div>
<p class="MsoNormal"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:windowtext;text-decoration:none"><o:p> </o:p></span></a></p>
</div>
<p class="MsoNormal"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:windowtext;text-decoration:none">--
<o:p></o:p></span></a></p>
</div>
<p class="MsoNormal"><span style="font-family:"Verdana",sans-serif"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:windowtext;text-decoration:none">Saludos,<br>
Carlos Ortega<br>
<u><span style="color:blue">www.qualityexcellence.es</span></u></span><span style="font-family:"Calibri",sans-serif;color:windowtext;text-decoration:none"><o:p></o:p></span></a></span></p>
<p class="MsoNormal"><a href="https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret" target="_blank"><span style="color:windowtext;text-decoration:none"><o:p> </o:p></span></a></p>
</div>
</body>
</html>