<div dir="ltr">Hi<div><br></div><div>I need help in figuring out the length of historical data that I should use. I took stock prices(daily close) for two tickers from yahoo(200 days).I tried finding regression coefficient using PCA and I use 150 points for PCA. I find a coefficient Beta.<br clear="all"><div><br></div><div>Now to see whether the spread is mean reverting or not I use ADF. If I use 150 point long spread, It comes out to be nonstationary. If I use 200 points data the outcome is stationary</div><div><br></div><div>I again used 200 points to do the PCA and find regression. The spread comes out to be non stationary. From all these observation <b>I think</b> that this is not a stable relationship.</div><div><br></div><div>So following are my questions</div><div><ul><li>Is there a way to decide length of historical data to use?</li><li>Some relationship may be more stable than others. Is there away to quantify it?</li></ul><div>Any other insight in this regard will be appreciated(time frame, pairs vs basket). I have attached the plot and the script that was used to generate the plot.</div><div><br></div><div><br></div></div>-- <br><div>Regards<br>Amol<br><br>If all the seas were ink,<br>And all the reeds were pens,<br>And all the skies were parchment,<br>And all the men could write,<br>These would not suffice<br>To write down all the red tape<br>Of this Government.<br><br></div>
</div></div>