[BioC] biomaRt vs biomart.org
Tefina Paloma
tefina.paloma at gmail.com
Wed Sep 23 12:58:00 CEST 2009
Sean Davis <seandavi at ...> writes:
> Do you mean that they are not the same sequence or that they align to the
> genome with a gap? This UTR covers two exons, so your sequence should align
> with a gap.
>
> Sean
>
If I put as query sequence the sequence from biomart.org, and as subject
sequence the sequence from biomaRt,
the alignment is like below
>lcl|2591
Length=3154
Score = 4798 bits (2598), Expect = 0.0
Identities = 2598/2598 (100%), Gaps = 0/2598 (0%)
Strand=Plus/Plus
Query 534 GCAACCTGAAGCCCTTGGGAGCAACAGCGTACTCCTAACAATGACAACTAAACACAGGCA 593
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct 1 GCAACCTGAAGCCCTTGGGAGCAACAGCGTACTCCTAACAATGACAACTAAACACAGGCA 60
Query 594 CTGAGCATGTGCATTTGGCCAGACATGGTGCTTTCTTTGCATCATTTCATTGAActattt 653
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct 61 CTGAGCATGTGCATTTGGCCAGACATGGTGCTTTCTTTGCATCATTTCATTGAACTATTT 120
Query 654 tattctgttctgttctattctattctattctattctattctattctatttattTAGAGAT 713
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct 121 TATTCTGTTCTGTTCTATTCTATTCTATTCTATTCTATTCTATTCTATTTATTTAGAGAT 180
Query 714 CTCGCTCTGTCACCCAGGCTGGAGTGTAGTGGCATGTTCAGACCTCATTGCAGCCTTGAA 773
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct 181 CTCGCTCTGTCACCCAGGCTGGAGTGTAGTGGCATGTTCAGACCTCATTGCAGCCTTGAA 240
Query 774 CTCCTGGTCTCGAGTGATCCTCCCACCCCAGCCTCCCAAGTAGCTGGGACTACAGGCACT 833
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct 241 CTCCTGGTCTCGAGTGATCCTCCCACCCCAGCCTCCCAAGTAGCTGGGACTACAGGCACT 300
Query 834 CGCCACCAGGCCTAGTTAATTTTTGTAtttttttGTAGAGATGGGGTCTCACTGTGTTGC 893
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct 301 CGCCACCAGGCCTAGTTAATTTTTGTATTTTTTTGTAGAGATGGGGTCTCACTGTGTTGC 360
Query 894 CCACGCTGGTCTCAAACACCTGGGTTCAAGTGATTCATCCACCTCAGCCTCTTCAAGCAT 953
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct 361 CCACGCTGGTCTCAAACACCTGGGTTCAAGTGATTCATCCACCTCAGCCTCTTCAAGCAT 420
Query 954 TGGGATTACTGAACTAAGACACTGCAGTTGGCCTCGTTTAACTCTAGTAGAAATATCCAT 1013
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct 421 TGGGATTACTGAACTAAGACACTGCAGTTGGCCTCGTTTAACTCTAGTAGAAATATCCAT 480
Query 1014 GCAGGAAGTATGTGGGAATCGGGGCAGCAGGGACTCCAAGCAGGCACCCCAGAATTTCTT 1073
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct 481 GCAGGAAGTATGTGGGAATCGGGGCAGCAGGGACTCCAAGCAGGCACCCCAGAATTTCTT 540
Query 1074 CTGGGCTGTTCCTTCCCTGACTCCTGCAATTAGTCCTGCTTTTCCTTTGGCTCTGACTTG 1133
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct 541 CTGGGCTGTTCCTTCCCTGACTCCTGCAATTAGTCCTGCTTTTCCTTTGGCTCTGACTTG 600
Query 1134 CTTCGTCCTTTGGAATTCATTCTCGATGTTTCCCCACACTCATCTCTTTTCTTGGTTGTA 1193
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct 601 CTTCGTCCTTTGGAATTCATTCTCGATGTTTCCCCACACTCATCTCTTTTCTTGGTTGTA 660
Query 1194 TTCCCTTGGGACTGTTGGCTCAGGTTTGGGGATTTATTATGTTTAAAACTTCAGCCTCTG 1253
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct 661 TTCCCTTGGGACTGTTGGCTCAGGTTTGGGGATTTATTATGTTTAAAACTTCAGCCTCTG 720
Query 1254 TTTGGCTTCCTGGCACCAGGCTTTGTACTTCCTGCTCCTTGAATCTGGTAACTCCTATCC 1313
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct 721 TTTGGCTTCCTGGCACCAGGCTTTGTACTTCCTGCTCCTTGAATCTGGTAACTCCTATCC 780
Query 1314 CCACCTCCTTTCTGCCTACTCAAAGCTTCCAGTCTTTGGTGTTGGACAATCCCTGGATGA 1373
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct 781 CCACCTCCTTTCTGCCTACTCAAAGCTTCCAGTCTTTGGTGTTGGACAATCCCTGGATGA 840
Query 1374 TGACCAATCTCGTATGTCCTAAGGTATACAATAAAAAATACCAGGGTCAACAATCAACAG 1433
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct 841 TGACCAATCTCGTATGTCCTAAGGTATACAATAAAAAATACCAGGGTCAACAATCAACAG 900
Query 1434 GCATCTCTTTCTTGGGCCCATCTTGTTCTAGTGTCCCAGACATTCCAGTGTAGGCTTAGA 1493
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct 901 GCATCTCTTTCTTGGGCCCATCTTGTTCTAGTGTCCCAGACATTCCAGTGTAGGCTTAGA 960
Query 1494 TATAGATGGAAGTGTTCTAGTGTTTATGATGGACACCTGTTGAAAAGACCAAGTCTACCA 1553
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct 961 TATAGATGGAAGTGTTCTAGTGTTTATGATGGACACCTGTTGAAAAGACCAAGTCTACCA 1020
Query 1554 TGGCTGAGGTAGCTATGGAGGGTTTTACGTATTAACACAATGGTGAGGGTATCTTTACTG 1613
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct 1021 TGGCTGAGGTAGCTATGGAGGGTTTTACGTATTAACACAATGGTGAGGGTATCTTTACTG 1080
Query 1614 GTGTGAGCACAGTTCCACTGTATGGATGATCGTGATGCTGGAGTGGTCGATGGTTGGTAC 1673
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct 1081 GTGTGAGCACAGTTCCACTGTATGGATGATCGTGATGCTGGAGTGGTCGATGGTTGGTAC 1140
Query 1674 CTCCAGTGCCAGCTGGGGATTTATGGATGAACACAGGTGAGTAGTCAAGTGGGAAAAATG 1733
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct 1141 CTCCAGTGCCAGCTGGGGATTTATGGATGAACACAGGTGAGTAGTCAAGTGGGAAAAATG 1200
Query 1734 GCAGCATTCAGTTCATCTTCCTATTCTTCCTCCAGGTGTCTTCTTAGAATCAGGATCAGG 1793
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct 1201 GCAGCATTCAGTTCATCTTCCTATTCTTCCTCCAGGTGTCTTCTTAGAATCAGGATCAGG 1260
Query 1794 TGCAAACCCAGGGGGGTTCCTGTAGCAGCAGTGAAAATTCCAGTGCCTAAGCTATATATG 1853
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct 1261 TGCAAACCCAGGGGGGTTCCTGTAGCAGCAGTGAAAATTCCAGTGCCTAAGCTATATATG 1320
Query 1854 TTCAAGCAGGTCAGGTGGATGTCGCATGCGTCAGTTTGACTACAGCAGAACCATGAGAGA 1913
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct 1321 TTCAAGCAGGTCAGGTGGATGTCGCATGCGTCAGTTTGACTACAGCAGAACCATGAGAGA 1380
Query 1914 TGTTTCCTTTAGAGTTGGCCCACAAGACAGTCTGGCTGCAATCCACAGGCCACAGACAAC 1973
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct 1381 TGTTTCCTTTAGAGTTGGCCCACAAGACAGTCTGGCTGCAATCCACAGGCCACAGACAAC 1440
Query 1974 TGGAGGGAGTGGATCTCTCCCAGTTTCCTTCCACTTAGCATGAAAGCCTCAGAATAAGCA 2033
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct 1441 TGGAGGGAGTGGATCTCTCCCAGTTTCCTTCCACTTAGCATGAAAGCCTCAGAATAAGCA 1500
Query 2034 GCCCAGGGAGCAGAGAGACTGACATTAAAGCCTGCAATTCCTCTTCCAATTTTGATCACA 2093
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct 1501 GCCCAGGGAGCAGAGAGACTGACATTAAAGCCTGCAATTCCTCTTCCAATTTTGATCACA 1560
Query 2094 GCAGCCATTTAAACACAGGGTCTACCGAGGTTTAAAAAACTTGAACTGTGCTTAGTTGCA 2153
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct 1561 GCAGCCATTTAAACACAGGGTCTACCGAGGTTTAAAAAACTTGAACTGTGCTTAGTTGCA 1620
Query 2154 CTCTGAAATAGTCCTGCTCCTCCCCTGACCTACGAGAGACAGCAAAGAGACGTGTCAATA 2213
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct 1621 CTCTGAAATAGTCCTGCTCCTCCCCTGACCTACGAGAGACAGCAAAGAGACGTGTCAATA 1680
Query 2214 GCCTCCGCATGAGGCTTCAGAGGAGCAGCTGTGTATGGCAGGACGGAACAAAACCTGCCC 2273
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct 1681 GCCTCCGCATGAGGCTTCAGAGGAGCAGCTGTGTATGGCAGGACGGAACAAAACCTGCCC 1740
Query 2274 ATAGTATCTTTTACGACAACATGTTTCCACTTAATGCAGACCACTGAAAAGAATGTGGGA 2333
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct 1741 ATAGTATCTTTTACGACAACATGTTTCCACTTAATGCAGACCACTGAAAAGAATGTGGGA 1800
Query 2334 GCTTTTaaaaaaaaaTTATTATAAACATAGGTTTGTGACCTTGATGTGGAAGGCAGCTAG 2393
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct 1801 GCTTTTAAAAAAAAATTATTATAAACATAGGTTTGTGACCTTGATGTGGAAGGCAGCTAG 1860
Query 2394 AATCTCTGCTTTTAGAGGGCTAAGCAACACCAGGCAGCCTTCAATCTTAGAAGGGTTAAG 2453
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct 1861 AATCTCTGCTTTTAGAGGGCTAAGCAACACCAGGCAGCCTTCAATCTTAGAAGGGTTAAG 1920
Query 2454 CTGAAAGGGTCTCAAAAGGTCACGTGGTTTATATAATCCTACCTGCAGAAGAcccccccc 2513
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct 1921 CTGAAAGGGTCTCAAAAGGTCACGTGGTTTATATAATCCTACCTGCAGAAGACCCCCCCC 1980
Query 2514 cccGCCAGGCACAACGATTTTACAGACGAGGAATGTGAGGTGCGGAGAGGTTAAGGAAGG 2573
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct 1981 CCCGCCAGGCACAACGATTTTACAGACGAGGAATGTGAGGTGCGGAGAGGTTAAGGAAGG 2040
Query 2574 ATTTATCTTATTTGCATAAGGAGTGGAAGAACTGAAACCGAAGCCCCAGTTCCTTGACTG 2633
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct 2041 ATTTATCTTATTTGCATAAGGAGTGGAAGAACTGAAACCGAAGCCCCAGTTCCTTGACTG 2100
Query 2634 TAAATCCCGCACTTGCTTCCAACTGTCTTTCATCCAGATTATGGGATTCAGCTGCCTCTG 2693
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct 2101 TAAATCCCGCACTTGCTTCCAACTGTCTTTCATCCAGATTATGGGATTCAGCTGCCTCTG 2160
Query 2694 AAAACCTGTAGCCCAATAATGGTTATTCCCCAGGAGCCGCGCGAAGCATGAGCTAATTTT 2753
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct 2161 AAAACCTGTAGCCCAATAATGGTTATTCCCCAGGAGCCGCGCGAAGCATGAGCTAATTTT 2220
Query 2754 CAGTGAGCGCGGACTTTGGGGTAACGGTTCCAGCACAGCACATCCCTTTCTCCTCTTTTC 2813
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct 2221 CAGTGAGCGCGGACTTTGGGGTAACGGTTCCAGCACAGCACATCCCTTTCTCCTCTTTTC 2280
Query 2814 ACTCATCGTCACCGCTACCTGAAAACCCTGGCCGGGTGCTGGGGCTTGAGGAGCAGTTCC 2873
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct 2281 ACTCATCGTCACCGCTACCTGAAAACCCTGGCCGGGTGCTGGGGCTTGAGGAGCAGTTCC 2340
Query 2874 CACTTCCCAGTCTTTTTCACTTTTCACAGCTGCAAAGTTCAGGGAGTTGAACTGCAGTGC 2933
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct 2341 CACTTCCCAGTCTTTTTCACTTTTCACAGCTGCAAAGTTCAGGGAGTTGAACTGCAGTGC 2400
Query 2934 TTTCAGTTCACTGCTCACTCTGCCACGATCAATCTCTGTTGTAAATTTTCCTCCCAGAGC 2993
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct 2401 TTTCAGTTCACTGCTCACTCTGCCACGATCAATCTCTGTTGTAAATTTTCCTCCCAGAGC 2460
Query 2994 ACGTGACGATGCACTTCTTGACTATATATCCCAACTGCAGCAGCGGAGTTGTCAGAGCGC 3053
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct 2461 ACGTGACGATGCACTTCTTGACTATATATCCCAACTGCAGCAGCGGAGTTGTCAGAGCGC 2520
Query 3054 AGAGCCGGACAGAGCAGAAGAACCCTCTTGGACTGGACGATTTGGGAATTCAAAACTTGG 3113
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct 2521 AGAGCCGGACAGAGCAGAAGAACCCTCTTGGACTGGACGATTTGGGAATTCAAAACTTGG 2580
Query 3114 GACAAACTGTCAGCCTTG 3131
||||||||||||||||||
Sbjct 2581 GACAAACTGTCAGCCTTG 2598
More information about the Bioconductor
mailing list