<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN">
<HTML><HEAD>
<META http-equiv=Content-Type content="text/html; charset=iso-8859-1">
<META content="MSHTML 5.50.4611.1300" name=GENERATOR>
<STYLE></STYLE>
</HEAD>
<BODY bgColor=#ffffff>
<DIV><FONT face=Arial size=2>I'm relatively new to R, and have looked through 
the documentation and FAQ, and have not been able to find out how I can 
accomplish something.&nbsp; If someone can point me in the right direction, I 
would greatly appreciate it.</FONT></DIV>
<DIV><FONT face=Arial size=2></FONT>&nbsp;</DIV>
<DIV><FONT face=Arial size=2>I am doing system performance tests, and end up 
with large volumes of data that consists of transaction timings, coupled with 
system timings.&nbsp; The analysis process is iterative, and I've been using 
Excel (too many limitations, but the pivot tables have been extremely useful) to 
do some of the drilldown processing, such as identifyng 
bottlenecks.</FONT></DIV>
<DIV><FONT face=Arial size=2></FONT>&nbsp;</DIV>
<DIV><FONT face=Arial size=2>To generalize the problem with an example, I have a 
series of data&nbsp;for which I would like to be able to produce a box 
plot.&nbsp; However,&nbsp;much of the data&nbsp;varies from run to run or from 
system to system.&nbsp; For example, the UNIX sar utility can produce a snapshot 
of disk activity for each disk in the system.&nbsp; Each snapshot lists a number 
of statistics for each disk, and after some cleanup with some utilities, you end 
up with something like:</FONT></DIV>
<DIV><FONT face=Arial size=2></FONT>&nbsp;</DIV>
<DIV><FONT face=Arial size=2>Time&nbsp;&nbsp;&nbsp; &nbsp;&nbsp;&nbsp; 
Device&nbsp;&nbsp;&nbsp; &nbsp;&nbsp;&nbsp; Busy&nbsp;&nbsp;&nbsp; 
&nbsp;&nbsp;&nbsp; Queue&nbsp;&nbsp;&nbsp; &nbsp;&nbsp;&nbsp; 
AvServ</FONT></DIV>
<DIV><FONT face=Arial 
size=2>10:00:00&nbsp;&nbsp;d1&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 
0.0&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;0.0&nbsp;&nbsp;&nbsp; 
&nbsp;&nbsp;&nbsp; &nbsp;&nbsp;&nbsp; 8.3</FONT></DIV>
<DIV><FONT face=Arial size=2>10:00:00&nbsp; 
d2&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 
35.5&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;5.6&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;37.8</FONT></DIV>
<DIV><FONT face=Arial size=2>10:00:00&nbsp; 
d3&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 
10.5&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 
0.8&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;16.0</FONT></DIV>
<DIV><FONT face=Arial 
size=2>10:00:30&nbsp;&nbsp;d1&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;0.8&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 
0.0&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 
10.2</FONT></DIV>
<DIV><FONT face=Arial size=2>10:00:30&nbsp; 
d2&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 
42.1&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;5.9&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;42.5</FONT></DIV>
<DIV><FONT face=Arial 
size=2>10:00:30&nbsp;&nbsp;d3&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 
3.2&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 
0.1&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 
12.0</FONT></DIV>
<DIV><FONT face=Arial size=2>........</FONT></DIV>
<DIV><FONT face=Arial size=2></FONT>&nbsp;</DIV>
<DIV><FONT face=Arial size=2>Each set of statistics for each disk (d1-d3) are 
repeated for each time snapshot. I'd like to be able to have a boxplot where I 
get the any of the statistics for each disk.&nbsp; Such that, I can have a box 
plot of the percent busy for each disk, or the average service time for each 
disk, etc. The basic problem I am having is how can I do this in an automated 
fashion, without knowing the names of the disks.&nbsp; I built a data.frame 
using read.csv (is this even the correct terminology), and tried using unique() 
to identify the names of the disks, but then I got all caught up in trying to 
build vectors of data for each disk on the specified column.&nbsp; And even 
then, if I did accomplish this, I couldn't figure out how to pas a variable 
number of vectors to boxplot.&nbsp; </FONT></DIV>
<DIV><FONT face=Arial size=2></FONT>&nbsp;</DIV>
<DIV><FONT face=Arial size=2>If someone can point me in the right 
direction,&nbsp;I can apply the concepts to other tasks I would like to 
accomplish.</FONT></DIV>
<DIV><FONT face=Arial size=2></FONT>&nbsp;</DIV>
<DIV><FONT face=Arial size=2>Thank you</FONT></DIV>
<DIV><FONT face=Arial size=2></FONT>&nbsp;</DIV>
<DIV><FONT face=Arial size=2></FONT>&nbsp;</DIV>
<DIV><FONT face=Arial size=2></FONT>&nbsp;</DIV></BODY></HTML>