[BioC] biomaRt vs biomart.org

Tefina Paloma tefina.paloma at gmail.com
Wed Sep 23 12:58:00 CEST 2009


Sean Davis <seandavi at ...> writes:


> Do you mean that they are not the same sequence or that they align to the
> genome with a gap?  This UTR covers two exons, so your sequence should align
> with a gap.
> 
> Sean
> 

If I put as query sequence the sequence from biomart.org, and as subject
sequence the sequence from biomaRt,
the alignment is like below


>lcl|2591 
Length=3154

 Score = 4798 bits (2598),  Expect = 0.0
 Identities = 2598/2598 (100%), Gaps = 0/2598 (0%)
 Strand=Plus/Plus

Query  534   GCAACCTGAAGCCCTTGGGAGCAACAGCGTACTCCTAACAATGACAACTAAACACAGGCA  593
             ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct  1     GCAACCTGAAGCCCTTGGGAGCAACAGCGTACTCCTAACAATGACAACTAAACACAGGCA  60

Query  594   CTGAGCATGTGCATTTGGCCAGACATGGTGCTTTCTTTGCATCATTTCATTGAActattt  653
             ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct  61    CTGAGCATGTGCATTTGGCCAGACATGGTGCTTTCTTTGCATCATTTCATTGAACTATTT  120

Query  654   tattctgttctgttctattctattctattctattctattctattctatttattTAGAGAT  713
             ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct  121   TATTCTGTTCTGTTCTATTCTATTCTATTCTATTCTATTCTATTCTATTTATTTAGAGAT  180

Query  714   CTCGCTCTGTCACCCAGGCTGGAGTGTAGTGGCATGTTCAGACCTCATTGCAGCCTTGAA  773
             ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct  181   CTCGCTCTGTCACCCAGGCTGGAGTGTAGTGGCATGTTCAGACCTCATTGCAGCCTTGAA  240

Query  774   CTCCTGGTCTCGAGTGATCCTCCCACCCCAGCCTCCCAAGTAGCTGGGACTACAGGCACT  833
             ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct  241   CTCCTGGTCTCGAGTGATCCTCCCACCCCAGCCTCCCAAGTAGCTGGGACTACAGGCACT  300

Query  834   CGCCACCAGGCCTAGTTAATTTTTGTAtttttttGTAGAGATGGGGTCTCACTGTGTTGC  893
             ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct  301   CGCCACCAGGCCTAGTTAATTTTTGTATTTTTTTGTAGAGATGGGGTCTCACTGTGTTGC  360

Query  894   CCACGCTGGTCTCAAACACCTGGGTTCAAGTGATTCATCCACCTCAGCCTCTTCAAGCAT  953
             ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct  361   CCACGCTGGTCTCAAACACCTGGGTTCAAGTGATTCATCCACCTCAGCCTCTTCAAGCAT  420

Query  954   TGGGATTACTGAACTAAGACACTGCAGTTGGCCTCGTTTAACTCTAGTAGAAATATCCAT  1013
             ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct  421   TGGGATTACTGAACTAAGACACTGCAGTTGGCCTCGTTTAACTCTAGTAGAAATATCCAT  480

Query  1014  GCAGGAAGTATGTGGGAATCGGGGCAGCAGGGACTCCAAGCAGGCACCCCAGAATTTCTT  1073
             ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct  481   GCAGGAAGTATGTGGGAATCGGGGCAGCAGGGACTCCAAGCAGGCACCCCAGAATTTCTT  540

Query  1074  CTGGGCTGTTCCTTCCCTGACTCCTGCAATTAGTCCTGCTTTTCCTTTGGCTCTGACTTG  1133
             ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct  541   CTGGGCTGTTCCTTCCCTGACTCCTGCAATTAGTCCTGCTTTTCCTTTGGCTCTGACTTG  600

Query  1134  CTTCGTCCTTTGGAATTCATTCTCGATGTTTCCCCACACTCATCTCTTTTCTTGGTTGTA  1193
             ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct  601   CTTCGTCCTTTGGAATTCATTCTCGATGTTTCCCCACACTCATCTCTTTTCTTGGTTGTA  660

Query  1194  TTCCCTTGGGACTGTTGGCTCAGGTTTGGGGATTTATTATGTTTAAAACTTCAGCCTCTG  1253
             ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct  661   TTCCCTTGGGACTGTTGGCTCAGGTTTGGGGATTTATTATGTTTAAAACTTCAGCCTCTG  720

Query  1254  TTTGGCTTCCTGGCACCAGGCTTTGTACTTCCTGCTCCTTGAATCTGGTAACTCCTATCC  1313
             ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct  721   TTTGGCTTCCTGGCACCAGGCTTTGTACTTCCTGCTCCTTGAATCTGGTAACTCCTATCC  780

Query  1314  CCACCTCCTTTCTGCCTACTCAAAGCTTCCAGTCTTTGGTGTTGGACAATCCCTGGATGA  1373
             ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct  781   CCACCTCCTTTCTGCCTACTCAAAGCTTCCAGTCTTTGGTGTTGGACAATCCCTGGATGA  840

Query  1374  TGACCAATCTCGTATGTCCTAAGGTATACAATAAAAAATACCAGGGTCAACAATCAACAG  1433
             ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct  841   TGACCAATCTCGTATGTCCTAAGGTATACAATAAAAAATACCAGGGTCAACAATCAACAG  900

Query  1434  GCATCTCTTTCTTGGGCCCATCTTGTTCTAGTGTCCCAGACATTCCAGTGTAGGCTTAGA  1493
             ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct  901   GCATCTCTTTCTTGGGCCCATCTTGTTCTAGTGTCCCAGACATTCCAGTGTAGGCTTAGA  960

Query  1494  TATAGATGGAAGTGTTCTAGTGTTTATGATGGACACCTGTTGAAAAGACCAAGTCTACCA  1553
             ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct  961   TATAGATGGAAGTGTTCTAGTGTTTATGATGGACACCTGTTGAAAAGACCAAGTCTACCA  1020

Query  1554  TGGCTGAGGTAGCTATGGAGGGTTTTACGTATTAACACAATGGTGAGGGTATCTTTACTG  1613
             ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct  1021  TGGCTGAGGTAGCTATGGAGGGTTTTACGTATTAACACAATGGTGAGGGTATCTTTACTG  1080

Query  1614  GTGTGAGCACAGTTCCACTGTATGGATGATCGTGATGCTGGAGTGGTCGATGGTTGGTAC  1673
             ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct  1081  GTGTGAGCACAGTTCCACTGTATGGATGATCGTGATGCTGGAGTGGTCGATGGTTGGTAC  1140

Query  1674  CTCCAGTGCCAGCTGGGGATTTATGGATGAACACAGGTGAGTAGTCAAGTGGGAAAAATG  1733
             ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct  1141  CTCCAGTGCCAGCTGGGGATTTATGGATGAACACAGGTGAGTAGTCAAGTGGGAAAAATG  1200

Query  1734  GCAGCATTCAGTTCATCTTCCTATTCTTCCTCCAGGTGTCTTCTTAGAATCAGGATCAGG  1793
             ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct  1201  GCAGCATTCAGTTCATCTTCCTATTCTTCCTCCAGGTGTCTTCTTAGAATCAGGATCAGG  1260

Query  1794  TGCAAACCCAGGGGGGTTCCTGTAGCAGCAGTGAAAATTCCAGTGCCTAAGCTATATATG  1853
             ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct  1261  TGCAAACCCAGGGGGGTTCCTGTAGCAGCAGTGAAAATTCCAGTGCCTAAGCTATATATG  1320

Query  1854  TTCAAGCAGGTCAGGTGGATGTCGCATGCGTCAGTTTGACTACAGCAGAACCATGAGAGA  1913
             ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct  1321  TTCAAGCAGGTCAGGTGGATGTCGCATGCGTCAGTTTGACTACAGCAGAACCATGAGAGA  1380

Query  1914  TGTTTCCTTTAGAGTTGGCCCACAAGACAGTCTGGCTGCAATCCACAGGCCACAGACAAC  1973
             ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct  1381  TGTTTCCTTTAGAGTTGGCCCACAAGACAGTCTGGCTGCAATCCACAGGCCACAGACAAC  1440

Query  1974  TGGAGGGAGTGGATCTCTCCCAGTTTCCTTCCACTTAGCATGAAAGCCTCAGAATAAGCA  2033
             ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct  1441  TGGAGGGAGTGGATCTCTCCCAGTTTCCTTCCACTTAGCATGAAAGCCTCAGAATAAGCA  1500

Query  2034  GCCCAGGGAGCAGAGAGACTGACATTAAAGCCTGCAATTCCTCTTCCAATTTTGATCACA  2093
             ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct  1501  GCCCAGGGAGCAGAGAGACTGACATTAAAGCCTGCAATTCCTCTTCCAATTTTGATCACA  1560

Query  2094  GCAGCCATTTAAACACAGGGTCTACCGAGGTTTAAAAAACTTGAACTGTGCTTAGTTGCA  2153
             ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct  1561  GCAGCCATTTAAACACAGGGTCTACCGAGGTTTAAAAAACTTGAACTGTGCTTAGTTGCA  1620

Query  2154  CTCTGAAATAGTCCTGCTCCTCCCCTGACCTACGAGAGACAGCAAAGAGACGTGTCAATA  2213
             ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct  1621  CTCTGAAATAGTCCTGCTCCTCCCCTGACCTACGAGAGACAGCAAAGAGACGTGTCAATA  1680

Query  2214  GCCTCCGCATGAGGCTTCAGAGGAGCAGCTGTGTATGGCAGGACGGAACAAAACCTGCCC  2273
             ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct  1681  GCCTCCGCATGAGGCTTCAGAGGAGCAGCTGTGTATGGCAGGACGGAACAAAACCTGCCC  1740

Query  2274  ATAGTATCTTTTACGACAACATGTTTCCACTTAATGCAGACCACTGAAAAGAATGTGGGA  2333
             ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct  1741  ATAGTATCTTTTACGACAACATGTTTCCACTTAATGCAGACCACTGAAAAGAATGTGGGA  1800

Query  2334  GCTTTTaaaaaaaaaTTATTATAAACATAGGTTTGTGACCTTGATGTGGAAGGCAGCTAG  2393
             ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct  1801  GCTTTTAAAAAAAAATTATTATAAACATAGGTTTGTGACCTTGATGTGGAAGGCAGCTAG  1860

Query  2394  AATCTCTGCTTTTAGAGGGCTAAGCAACACCAGGCAGCCTTCAATCTTAGAAGGGTTAAG  2453
             ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct  1861  AATCTCTGCTTTTAGAGGGCTAAGCAACACCAGGCAGCCTTCAATCTTAGAAGGGTTAAG  1920

Query  2454  CTGAAAGGGTCTCAAAAGGTCACGTGGTTTATATAATCCTACCTGCAGAAGAcccccccc  2513
             ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct  1921  CTGAAAGGGTCTCAAAAGGTCACGTGGTTTATATAATCCTACCTGCAGAAGACCCCCCCC  1980

Query  2514  cccGCCAGGCACAACGATTTTACAGACGAGGAATGTGAGGTGCGGAGAGGTTAAGGAAGG  2573
             ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct  1981  CCCGCCAGGCACAACGATTTTACAGACGAGGAATGTGAGGTGCGGAGAGGTTAAGGAAGG  2040

Query  2574  ATTTATCTTATTTGCATAAGGAGTGGAAGAACTGAAACCGAAGCCCCAGTTCCTTGACTG  2633
             ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct  2041  ATTTATCTTATTTGCATAAGGAGTGGAAGAACTGAAACCGAAGCCCCAGTTCCTTGACTG  2100

Query  2634  TAAATCCCGCACTTGCTTCCAACTGTCTTTCATCCAGATTATGGGATTCAGCTGCCTCTG  2693
             ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct  2101  TAAATCCCGCACTTGCTTCCAACTGTCTTTCATCCAGATTATGGGATTCAGCTGCCTCTG  2160

Query  2694  AAAACCTGTAGCCCAATAATGGTTATTCCCCAGGAGCCGCGCGAAGCATGAGCTAATTTT  2753
             ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct  2161  AAAACCTGTAGCCCAATAATGGTTATTCCCCAGGAGCCGCGCGAAGCATGAGCTAATTTT  2220

Query  2754  CAGTGAGCGCGGACTTTGGGGTAACGGTTCCAGCACAGCACATCCCTTTCTCCTCTTTTC  2813
             ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct  2221  CAGTGAGCGCGGACTTTGGGGTAACGGTTCCAGCACAGCACATCCCTTTCTCCTCTTTTC  2280

Query  2814  ACTCATCGTCACCGCTACCTGAAAACCCTGGCCGGGTGCTGGGGCTTGAGGAGCAGTTCC  2873
             ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct  2281  ACTCATCGTCACCGCTACCTGAAAACCCTGGCCGGGTGCTGGGGCTTGAGGAGCAGTTCC  2340

Query  2874  CACTTCCCAGTCTTTTTCACTTTTCACAGCTGCAAAGTTCAGGGAGTTGAACTGCAGTGC  2933
             ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct  2341  CACTTCCCAGTCTTTTTCACTTTTCACAGCTGCAAAGTTCAGGGAGTTGAACTGCAGTGC  2400

Query  2934  TTTCAGTTCACTGCTCACTCTGCCACGATCAATCTCTGTTGTAAATTTTCCTCCCAGAGC  2993
             ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct  2401  TTTCAGTTCACTGCTCACTCTGCCACGATCAATCTCTGTTGTAAATTTTCCTCCCAGAGC  2460

Query  2994  ACGTGACGATGCACTTCTTGACTATATATCCCAACTGCAGCAGCGGAGTTGTCAGAGCGC  3053
             ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct  2461  ACGTGACGATGCACTTCTTGACTATATATCCCAACTGCAGCAGCGGAGTTGTCAGAGCGC  2520

Query  3054  AGAGCCGGACAGAGCAGAAGAACCCTCTTGGACTGGACGATTTGGGAATTCAAAACTTGG  3113
             ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct  2521  AGAGCCGGACAGAGCAGAAGAACCCTCTTGGACTGGACGATTTGGGAATTCAAAACTTGG  2580

Query  3114  GACAAACTGTCAGCCTTG  3131
             ||||||||||||||||||
Sbjct  2581  GACAAACTGTCAGCCTTG  2598



More information about the Bioconductor mailing list