Halsto_00040 : CDS information

close this sectionLocation

Organism
StrainHC34
Entry nameHalstoctacosanolide
Contig
Start / Stop / Direction50,682 / 66,650 / + [in whole cluster]
50,682 / 66,650 / + [in contig]
Location50682..66650 [in whole cluster]
50682..66650 [in contig]
TypeCDS
Length15,969 bp (5,322 aa)
Click on the icon to see Genetic map.

close this sectionAnnotation

Category1.1 PKS
Productpolyketide synthase
Product (GenBank)type I polyketide synthase
Gene
Gene (GenBank)hlsD
EC number
Keyword
Note
Note (GenBank)
Reference
ACC
PmId
[16568718] The complete biosynthetic gene cluster of the 28-membered polyketide macrolactones, halstoctacosanolides, from Streptomyces halstedii HC34. (J Antibiot (Tokyo). , 2006)
comment
halstoctacosanolide生合成に関与するgene clusterのクローニングを行い、完全長を決定した文献。
hlsD(5322aa): PKS(module 10-12)

module11のKR domainはたぶんinactiveだが、NADP-bindingに必要なactive site motif (GXGXXGXXXA)、並びにactive siteにおけるcatalytic triadであるLys, Ser, Tyr共に保存されており、inactiveとなる理由が明らかでない。

close this sectionPKS/NRPS Module

10 methylmalonyl-CoA
11 malonyl-CoA
12 malonyl-CoA
KS34..410
AT567..881
DH932..1098
ER1442..1757
KR1766..1945
ACP2049..2119
KS2142..2517
AT2677..2995
kr3307..3486
ACP3595..3665
KS3688..4064
AT4226..4548
KR4876..5052
ACP5158..5228

close this sectionSequence

selected fasta
>polyketide synthase [type I polyketide synthase]
MSNEDRLRHFLNEVTSELIDTRQRLNDVTAAAEEPLAIVGMACQYPGDVRSPEDLWKLVA
EGRDGISEFPTERGWDVDGLYHPDPEHQGTSYTREGGFLHRAGEFDAGFFGISPREALAM
DPQQRLLLETSWEAIESAGIDPLSLKGSSTGVFTGVMYHDYSTQLRTVPDGVEAFLGTGN
AGSVVSGRIAYVLGAEGPAVTIDTACSSSLVALHLACQALRQGDCTMALAGGVTVMATPG
TFVDFSRQRGLAVDGRCKSFAAAADGTGWAEGVGVLVVERLSDAERLGHPILAVVRSSAV
NQDGASNGLTAPNGPSQERVIRQALSAAGLSTADVDAVEAHGTGTNLGDPIEAQALLATY
GQGRPEGRPLRLGSLKSNIGHTQAAAGVAGVIKMVMALRHGVLPATLHVDEPTPHVDWAS
GAVELLTEAMPWPEVGRPRRAAVSSFGISGTNAHIVVEQAPESQIEVAASREETPAGSVA
WVVSGHGVDGVQAQAARLREWVLEHPQHSVTDIGFSLLSSRSLHRDRLVVLGSDRQVLVD
GLAAAAEGSPWPGLVQSSGDVSLNRAVFVFPGQGSQWVGMGRELYASSPVFRARLDECAA
ALDPLVEWSLIDVVRGGSGAPGLERVDVVQPVLWAVMVSLAAVWESWGVVPAAVVGHSQG
EIAAACVAGALSVEDAARVVALRSRAVRAMAGDGAMVSVALPAAEAEALTGDGVSLAAVN
GPSSVVLSGDRSALTPVVEGLTAQGVRTKWVPVDYASHSAHMDRIHDELLEILSGIEPKT
SRIPLYSTVSAEVIDTSVMDAGYWFDNIRGTVRFHETVQALITDGLTAFVEISPHPVLAM
SVQDTLDQAEATGLSIGTLRRDENEHETFLTAAAQLFVAGLSIDWHTAAFADLDTRRVDL
PTYAFQRDHYWLPAGGGQTGDAGSLGLGAVGHPLLGAAVSMAEGDVVVLTGRVSLRTHAW
LADHAVLGSVLLPGTAFLELAVRAGDQVGCARVEELVIQAPLVLTGDEAVDVQVMVGADE
SGYRSVDIYSRHRVEDNWQDQDAWVHHATGTLTSSKTDAQNSDLSVWPPRDAASIEVEDF
YAQLAAGGFAYGPAFRGLRAAWRRGDEVFAEVELPESEQDTAAEFGLHPALLDAALHAIT
FAAHGDFADQPAQGRLPFSWSGVSLEASGASLLRVHLRPAGDEAVSLLAADATGEPVLTV
DSLVLRPVTSEQLRTGDSGVVDNLYTVQWGPFAGPVGVSGRDVGEWAVLDLPELGGGVGA
VVEGLVACDVAVRVVGRECFAGGGSLPETLIVPVVGGGGDAVDVVCGVLGVVREWLGLVG
GVSRLVVVTWGAVSVGSGEGVGDVGGAGVWGLLRSAQSEHPGRFVLVDVEGVEGVGWGGL
VDGVVCGEGQVVVRGGGLLVPRLVRAGGGGLVIPETFTGGAEVVGGVGSGWCVGVGVGSG
VGTLEGLGVVGAGVGSGVGGGLGVGEVRVAVRAAGVNFRDVLIGLGVYPGEALLGSEGAG
VVVGVGEGVVNVGVGDRVMGLFLGGFGPEVVVDARMVVRLPVGWSFVEGATVPVVFLTAW
YGLVDLAGVRAGERLLVHAAAGGVGMAAVQLARHWGVEVFGTASEGKWEVLRGLGLDDAH
IASSRDLGFVEKFGREHSDGVSEGRSGGVDVVLNSLVGEFVDGSLGLLGEGGRFVEMGKL
DVRDAGVVGELWSGVWYRNFDLVEAGLDRIQEMLCELVGLFDVGVLEALPVRCWDVREVV
DALRFVQQARHVGKVVLRVPGGWGSGTVVVSGGTGVLGRAVVRYLVGCGVGRLLLLSRSG
AAGEGVAGLVGELEGLGVVVDVVACDVGDREALAGVLGGVSGEFPVTGVVHLAGVLDDGM
VGSLSEGQVRRVFAGKVDGLVNLDVLTRGMPVEGFVVFSSAAGVFGNAGQGNYAAANACV
DAVVARRRVEGLPGVSLAWGLWSEASGMTGHLDAGDHGRMSRGGAGGLSTGEGVALLDAA
LGLPQSLLVPIRLDGRQLQARADVGDVHPLLRGLVRSRSRRAASAVGIGVGGLGGRLVGL
VEGERRRVVLDLVRSHAATVLGHGDVAGVGAGRAFRELGFDSLTAVELRNRLNTATGVRL
PATLVFDYPTPTELADYLLVQMVGESGAADSVQVPISVSSEEPLAVVGMACRFPGGVGSP
DELWDFVLAGGDGISGLPVDRGWDVAGLFDPDPEREGTSYTREGGFLHDAAEFDPGFFGI
SPREALAMDPQQRLLLEASWEAVENAGIDPLSLKGTSTGVFAGVTYHDHAARLRTVPDGL
EGLLGIGASASIVSGRVAYLLGLEGPALTVDTACSSSLVALHLAGQALRQGECSMALAGG
VTVMSTPGTFVDFSRQRGLAADGRCKAFDVSADGFGPAEGVGMLVLERLSDAQRLGHPVL
AVIRGSAVNQDGASNGLTAPNGPSQQRVIRQALAAADLSPADVDVVEAHGTGTALGDPIE
AQALLATYGQDRPEDRPLRLGSIKSNIGHTQAAAGVAGVIKMVLAMQHGVLPATLHVNEP
TPHVDWASGAVELLTEATAWPETGKPRRAAVSSFGISGTNAHTIIEQAPAVDRVSDVPDA
DSASGVTVPWVVSARGVDGLRSQAARLREWALKHPEHSLVDVGHSLVVSRSAFEDRVVVL
GSDRDALLDGLAAAAQGGPWPGVVQGSSVGSGGGVAFLFTGQGAQRLGMGRELAERFPVF
ASALDEVCVQLDAHLERPLREVLFAEPDTEAAALLDETAFTQAALFAVEVALYRLVESWS
LTPDYLLGHSIGGLAAAYVAGVLSLEDAAEVVVARGRLMQALPKGGAMVSLQAAEDEVVE
SLGGLVSIAAVNGPQAVVISGDEDAVTAVADEWRSRGRKVKRLTVSHAFHSALMEPMLAT
FEQVLSGVTLNPPRIPVISDSTGLPLTAEQATSPAYWTAHVRNPVLFHQAITHLTGQGVN
SFLELGPDGVLSAMTRTSLAEDSDTTVVPLLRSGRQEPEAALTALAELYVNGVAVDWTVL
LDGARPVALPTYAFQHQRFWLETGTEIPAEAATEPGDSVFWRAVEQGDAGELASAFAAVG
VDASAVEWESVLPALSSWRQAQRVRSVADSWRYRVTWKPRAGRQSSTLTGTWLVVAPAED
LELVDQSVAALEAHGASVIVLRPTEGSDCGDRHMWAESLRRVVPSDEVDSLAGVVSLVGD
VAGTLGLVQGLGGVGVVAPLWCVTRGAVGVGGGDVVVSPVQGLVWGLGRVVGLEHPERWG
GVVDLPVSVDGRGWERFCSVLAGGGGEDQVAVRSSGVFVRRLVPAPAPAPAPAAVSVGEG
GWSPGGGTVLVTGGTGVMGARAARWLAARGAERLLLVSRAGETAPGVSELVAELTAMGSR
AEVVACDVADRDALAALLTAVPEEYPLTAVVHTAHHHDDEPLASMSAERYLPVLDAKWVG
AWNLHELTKDLPLSAFVLFSSGAGVWGGGGQGAYAAANAGLDALAEYRQGLGLPATAIAW
GPWQYQQDSSAVTDQSGALTDMDRRGLHPMAPEPAIDALGVALTRGETALVVADVDWERF
YPAFAVARPRPLLHDIPAVAALLAQDRDSDGDVQARSELAERLAGTSESERDRIVLTMVR
THVAAVLGHTGVDGVPAGRAFRDLGFDSLTAVELRNRLSKATGVALPATLVFDHPTPEKV
AALVVADVLEQRGTALPGQTVVAASPDEPLAVVGMACRFPGGVASPEELWQLVISGGDAI
SGFPADRDWDLAALYHPDPDHVGTSYTREGGFLYDAGEFDPGFFGISPREALAMDPQQRL
LLETSWEAVENAGIDPLSLRGRKVGVFTGMSYHDYAARLRSVPEGLEGYLGTGNAGSVMS
GRVAYVLGTEGPAVTVDTACSSSLVALHWAAQALRQGECSMALAGGVTVMATPGTFVDFS
RQRGLAPDGRCKAFAAGADGTGWSEGVGMVLVERLSDAERLGHPILAVIRSSAVNQDGAS
NGLTAPNGPSQQRVIRQALSTAGLTTADVDAVEAHGTGTNLGDPIEAQALLATYGQDRPE
ERPLFLGSLKSNIGHTQAAAGVAGLIKMVMALQHGVLPATLHVDEPTPHVDWASGAVELL
TEATPWPETGRPRRAAVSSFGISGTNAHTILEQAPVTEPTPVGGPQQSDDTPVGVLPWVL
SARGETALRGQSSRLADWVTARPEDTAVEVARSLMASRSAFEDRLVVLGADREELLAGVR
AVARGEACSGVIRTPSGVSVPEGRAFLFTGQGAQRLSMGRELAQRFPVFASALDEVCVQL
DAHLERPLREVLFAEPDTEAAALLDETVFTQAALFAVEVALYRLVESWSLTPDYLLGHSV
GGLAAAHVSGVLSLEDAAEVVAARGRLMQALPKGGAMVSLQASEDEVLESLQALETADRV
SIAAVNGPDTVVISGDDEAVTEVAGYWLVQDRKVKRLKVSHAFHSVLMEPMLAEFEEVVS
RVTLNAPRIPVVSDSTGELLTAEQATSPAYWVGHVRKPVRFHQAVTYLAEQGVSAFLELG
PDGVLSAMVRNSLVDGEVIATPLLRSGRAEPETALTALAELFVAGVAVEWSAVLGGGESG
RRVELPTYAFQRERYWLESGAAAAAEPAVGGVIAHGMDAGFWGAVERGDVEGLAGVLGSG
VSVDVWGEVLPELSSWWLGRRARSVVEGWRYRVEWRRVGGGLLSGGGGLSGTWVVVVPVG
VDVGLVDGCVGALVGCGVRVVVVGVDVGVLGDVEGLGSLVVGGLPEGVGVGDVSGVVSLL
GLVEGWFEGLGGVSLGVVGTLGLVRALGGVGVVAPLWCVTRGAVGVGGGDVVVSPVQGLV
WGLGRVVGLEHPERWGGVVDLPVSVDGRGWERFCSVLAGGGEDQVAVRSSGVFVRRLVPA
PAAVSGGGWVGGLSGGSVVVTGGTGVLGGRVARWLAGCGVGRLVLVSRSGAAGVGVDGLV
GELEGLGVVVDVVACDVADREAMAGVLGGVSGEFPLRAVVHAAGASGMGALEGLGVEEFA
GVVGAKVGGAVVLDELVGGVPLVLFSSGAGVWGGGGQGAYSAANAFLDGLAEYRRGRGLP
AVSIAWGPWADGGMAHGPEGSQDQLVSRGFVPLDPDIAIAAMEEAIEKDETTITVADIDW
AKFYPAFALARPRPLLHEIPEVAALLAEDEAGVPEKGAVSALAERLNSLTDGEQRQAVLD
MVRTEVAAVLNHAHAENIVETRTFRELGFDSLTAVELRNRLNSATGLRLPATLIFDYPTC
EAISDHLCKELLGSSFGAMTTSAVQSDFWSALQQVDYQKLQDAGVVAMVMGLLDGEPAEK
TVEEEPEPRPEIDEMDAVELLNLALRNKMQRNSAADSQGEEG
selected fasta
>polyketide synthase [type I polyketide synthase]
ATGAGCAACGAAGACCGACTTCGGCATTTCCTCAACGAAGTGACCTCCGAGCTGATCGAC
ACGCGTCAGCGGCTCAATGACGTCACGGCCGCCGCTGAAGAGCCACTGGCTATTGTGGGA
ATGGCCTGCCAATATCCAGGTGATGTAAGGTCGCCGGAGGACCTGTGGAAATTGGTCGCC
GAGGGACGCGACGGGATATCCGAGTTCCCGACGGAACGCGGCTGGGACGTGGACGGTCTC
TACCACCCCGACCCGGAGCACCAGGGCACTTCGTACACTCGTGAGGGCGGCTTCCTGCAC
CGCGCCGGTGAGTTCGATGCGGGCTTCTTCGGGATCTCGCCGCGTGAGGCGCTGGCGATG
GACCCCCAGCAGCGTCTCCTCCTGGAAACCTCCTGGGAGGCGATCGAGAGCGCGGGAATC
GACCCGCTCTCCCTGAAGGGCAGCTCGACCGGTGTCTTCACCGGTGTCATGTACCACGAC
TACTCGACCCAACTGCGGACCGTGCCCGATGGAGTCGAGGCATTCCTCGGCACGGGCAAC
GCGGGCAGTGTCGTGTCCGGGCGAATCGCCTATGTGCTCGGCGCCGAGGGCCCGGCAGTG
ACCATTGACACGGCCTGCTCATCGTCCCTGGTAGCCCTGCATTTGGCATGTCAGGCCCTG
CGCCAGGGCGACTGCACCATGGCGCTGGCCGGTGGTGTCACCGTGATGGCGACGCCGGGA
ACATTTGTGGATTTCAGCCGTCAGCGGGGTCTGGCGGTGGACGGCCGGTGCAAGTCCTTC
GCCGCCGCTGCGGACGGTACCGGCTGGGCCGAGGGCGTCGGTGTACTGGTGGTGGAGCGG
CTCTCGGACGCGGAGCGCCTGGGCCACCCGATCCTTGCGGTGGTCCGTTCCAGTGCGGTG
AATCAGGACGGTGCCAGCAACGGCCTGACGGCGCCGAATGGTCCGTCGCAGGAGCGGGTG
ATTCGTCAGGCCCTGTCGGCGGCAGGGTTGTCGACCGCCGATGTGGACGCGGTCGAGGCC
CACGGCACGGGCACGAATCTCGGTGACCCGATTGAGGCGCAGGCGCTGTTGGCGACCTAC
GGTCAGGGTCGGCCGGAGGGTCGTCCGCTGCGGTTGGGTTCGTTGAAGTCGAACATTGGT
CATACTCAGGCCGCTGCGGGTGTGGCGGGTGTGATCAAGATGGTGATGGCGCTGCGGCAT
GGTGTGTTGCCGGCGACGTTGCATGTGGATGAGCCGACGCCGCATGTCGATTGGGCGAGT
GGCGCGGTGGAGTTGCTGACGGAGGCTATGCCGTGGCCTGAGGTGGGTCGTCCGCGGCGG
GCCGCGGTTTCGTCGTTCGGTATCAGCGGTACGAACGCGCACATCGTTGTTGAGCAGGCG
CCTGAGAGTCAGATCGAGGTTGCGGCTTCGCGGGAGGAGACTCCTGCCGGCTCGGTGGCG
TGGGTGGTGTCGGGCCATGGTGTTGATGGTGTCCAGGCGCAGGCCGCGCGGCTGCGGGAG
TGGGTGCTGGAGCACCCGCAGCACAGTGTGACCGATATCGGCTTCTCGTTGTTGTCATCG
CGGTCGTTGCATCGGGACCGGTTGGTGGTGCTGGGTTCTGATCGTCAGGTTTTGGTGGAT
GGGCTGGCGGCGGCTGCTGAGGGATCGCCGTGGCCGGGGTTGGTTCAGTCGTCTGGGGAT
GTGTCGCTGAACCGGGCTGTGTTCGTCTTTCCGGGTCAGGGGTCGCAGTGGGTGGGGATG
GGGCGGGAGTTGTACGCATCTTCGCCTGTGTTTCGGGCGCGGTTGGATGAGTGTGCGGCT
GCGTTGGATCCGTTGGTGGAGTGGTCGCTGATTGATGTGGTGCGGGGTGGGTCCGGGGCT
CCTGGTCTGGAGCGGGTGGATGTGGTTCAGCCCGTGTTGTGGGCGGTGATGGTGTCGCTG
GCGGCGGTGTGGGAGTCGTGGGGTGTTGTTCCGGCTGCTGTGGTGGGTCATTCGCAGGGT
GAGATTGCTGCTGCGTGTGTGGCGGGGGCGCTGTCGGTGGAGGATGCGGCGCGGGTTGTG
GCGTTGCGGAGCCGTGCCGTGCGGGCGATGGCGGGTGACGGTGCGATGGTGTCGGTCGCG
CTCCCTGCCGCTGAGGCTGAGGCGTTGACCGGGGACGGTGTGTCGCTGGCGGCTGTCAAT
GGGCCGTCGTCGGTGGTGCTGTCGGGGGACCGGTCTGCCCTCACTCCCGTGGTGGAGGGA
CTGACTGCTCAGGGTGTGCGGACGAAGTGGGTGCCGGTGGACTACGCGTCCCACTCGGCC
CATATGGACCGCATCCATGACGAGCTGCTGGAGATCCTGTCCGGGATCGAGCCCAAGACC
TCCCGTATCCCGCTCTACTCCACGGTGTCGGCCGAGGTCATCGACACGTCGGTCATGGAT
GCCGGCTACTGGTTCGACAACATCCGGGGCACCGTCCGCTTCCACGAGACCGTCCAGGCC
CTGATCACCGACGGACTGACCGCCTTCGTGGAGATATCCCCGCACCCCGTCCTGGCGATG
AGCGTCCAGGACACCCTTGACCAGGCCGAAGCCACCGGTCTCTCCATCGGAACCCTCCGC
CGCGACGAGAACGAACACGAGACCTTCCTCACCGCCGCCGCCCAACTCTTCGTCGCCGGG
CTTTCCATCGACTGGCACACGGCCGCCTTCGCCGACCTCGACACCCGCCGAGTCGACCTC
CCTACCTACGCCTTCCAACGGGATCACTACTGGTTGCCCGCCGGCGGTGGGCAGACTGGT
GACGCGGGATCGTTGGGCCTGGGCGCGGTCGGACACCCTCTGCTGGGCGCGGCCGTGTCG
ATGGCCGAGGGTGATGTGGTCGTGCTGACCGGCCGCGTTTCCCTGCGCACACACGCCTGG
CTGGCCGACCACGCAGTCCTCGGTTCCGTACTCCTGCCCGGCACCGCCTTCCTGGAACTG
GCCGTACGCGCCGGTGACCAGGTCGGCTGCGCACGCGTCGAAGAACTGGTTATCCAGGCC
CCGCTGGTGCTCACCGGCGATGAGGCAGTGGATGTCCAGGTGATGGTCGGCGCCGACGAG
TCCGGGTACCGCTCCGTGGATATCTACTCCCGTCACCGTGTTGAGGACAACTGGCAGGAC
CAGGACGCCTGGGTCCACCATGCAACCGGCACCTTGACCAGTAGCAAGACGGATGCTCAG
AACAGTGATCTGTCGGTGTGGCCGCCCCGCGACGCGGCCTCGATTGAGGTCGAGGACTTT
TACGCACAGCTCGCCGCAGGCGGGTTTGCCTACGGTCCGGCGTTCCGGGGGCTGCGGGCT
GCCTGGCGCCGGGGCGACGAGGTGTTCGCCGAGGTGGAGCTGCCGGAGAGCGAGCAGGAC
ACAGCCGCCGAGTTCGGCCTCCACCCCGCGCTGCTCGACGCCGCGCTGCACGCGATCACA
TTCGCCGCGCATGGCGACTTCGCCGATCAGCCCGCACAGGGACGGTTGCCTTTCTCGTGG
TCAGGCGTGTCCCTGGAGGCGAGTGGCGCGTCCCTGCTACGCGTCCATCTGCGTCCCGCC
GGTGACGAGGCAGTGAGCCTGCTCGCGGCGGACGCCACCGGGGAGCCCGTGCTCACGGTC
GACTCGCTGGTACTGCGCCCGGTCACCTCCGAGCAGTTGCGTACCGGTGACAGCGGTGTG
GTCGACAACCTCTACACCGTTCAGTGGGGTCCGTTTGCTGGTCCGGTTGGGGTGAGTGGT
CGGGATGTGGGTGAGTGGGCGGTGCTTGATCTTCCTGAGTTGGGTGGGGGTGTTGGGGCG
GTTGTTGAGGGTTTGGTGGCTTGTGATGTTGCGGTGAGGGTTGTGGGTCGGGAGTGCTTT
GCGGGGGGTGGGTCTTTGCCGGAGACGTTGATTGTGCCGGTTGTTGGTGGGGGTGGGGAT
GCGGTGGATGTGGTGTGTGGTGTGTTGGGTGTGGTGCGGGAGTGGTTGGGGTTGGTTGGT
GGTGTGTCGCGGTTGGTGGTGGTGACGTGGGGTGCTGTGTCGGTGGGTTCGGGTGAGGGT
GTGGGGGATGTGGGTGGTGCTGGGGTGTGGGGTTTGTTGCGGAGTGCGCAGTCGGAGCAT
CCGGGTCGGTTTGTGTTGGTGGATGTGGAGGGTGTTGAGGGTGTGGGGTGGGGTGGGTTG
GTTGATGGTGTGGTGTGTGGTGAGGGTCAGGTTGTGGTGCGGGGTGGTGGGTTGTTGGTG
CCGCGGTTGGTGCGGGCTGGTGGTGGTGGGTTGGTGATTCCGGAGACATTCACGGGTGGG
GCTGAGGTTGTGGGTGGGGTGGGGTCTGGTTGGTGTGTGGGTGTGGGGGTGGGTTCTGGT
GTGGGGACGTTGGAGGGGTTGGGTGTGGTGGGTGCGGGTGTTGGTTCGGGTGTGGGTGGT
GGGTTGGGTGTGGGTGAGGTGAGGGTTGCGGTGCGTGCTGCGGGGGTGAATTTTCGTGAT
GTGTTGATTGGTTTGGGTGTGTATCCGGGGGAGGCGTTGTTGGGGAGTGAGGGTGCGGGT
GTGGTGGTGGGTGTGGGTGAGGGTGTGGTGAATGTGGGGGTGGGTGATCGGGTGATGGGT
TTGTTTTTGGGTGGGTTTGGTCCTGAGGTGGTGGTGGATGCGCGGATGGTGGTGCGGTTG
CCGGTGGGGTGGTCGTTTGTGGAGGGTGCGACGGTGCCGGTGGTGTTTTTGACGGCGTGG
TACGGGTTGGTGGATTTGGCGGGGGTGCGTGCGGGGGAGCGGTTGTTGGTGCATGCGGCG
GCTGGTGGTGTGGGGATGGCGGCGGTGCAGTTGGCGCGGCATTGGGGTGTGGAGGTGTTC
GGGACGGCGAGTGAGGGCAAGTGGGAGGTTCTTCGGGGGCTGGGGTTGGACGACGCGCAT
ATCGCATCTTCTCGGGACCTTGGCTTTGTGGAGAAATTCGGGCGTGAACATTCCGATGGT
GTTTCTGAGGGTCGGTCTGGTGGTGTGGATGTGGTGTTGAATTCGTTGGTGGGTGAGTTT
GTGGATGGGTCGTTGGGGTTGTTGGGTGAGGGGGGTCGGTTTGTTGAGATGGGGAAGTTG
GATGTGCGGGATGCGGGTGTGGTGGGGGAGTTGTGGTCGGGTGTTTGGTATCGGAATTTT
GATTTGGTGGAGGCGGGTTTGGATCGTATTCAGGAGATGTTGTGTGAGTTGGTGGGGTTG
TTTGATGTGGGTGTGTTGGAGGCGTTGCCGGTGCGGTGTTGGGATGTGCGGGAGGTGGTG
GATGCGTTGAGGTTTGTGCAGCAGGCGCGTCATGTGGGGAAGGTGGTGTTGCGGGTTCCT
GGTGGTTGGGGTTCGGGGACGGTGGTGGTGTCGGGTGGTACGGGTGTGTTGGGGCGTGCG
GTGGTGCGGTATTTGGTGGGGTGTGGTGTGGGGCGGTTGTTGTTGTTGAGTCGTTCGGGT
GCTGCGGGTGAGGGCGTTGCCGGGCTGGTGGGGGAGTTGGAGGGGTTGGGTGTGGTGGTG
GATGTGGTGGCGTGTGATGTGGGTGATCGTGAGGCGTTGGCGGGGGTTTTGGGTGGGGTG
TCGGGGGAGTTTCCGGTGACGGGTGTGGTGCATTTGGCGGGTGTGTTGGATGACGGGATG
GTGGGGTCGTTGTCGGAGGGTCAGGTGCGGCGGGTGTTTGCGGGGAAGGTGGATGGGTTG
GTGAATTTGGATGTGTTGACGCGGGGGATGCCGGTTGAGGGGTTTGTGGTGTTCTCGTCG
GCGGCTGGTGTGTTTGGTAATGCGGGGCAGGGGAATTATGCGGCGGCTAATGCGTGTGTG
GATGCGGTGGTGGCGCGGCGGCGGGTTGAGGGTTTGCCGGGGGTGTCGTTGGCGTGGGGG
TTGTGGTCGGAGGCGAGTGGGATGACCGGGCACCTTGACGCGGGGGATCACGGTCGGATG
AGTCGTGGTGGTGCGGGTGGTTTGTCGACGGGTGAGGGTGTGGCGTTGTTGGATGCGGCG
TTGGGGTTGCCGCAGTCGTTGTTGGTGCCGATTCGTCTTGATGGTCGGCAGTTGCAGGCG
CGGGCGGATGTGGGGGATGTGCATCCGTTGTTGCGGGGGTTGGTGCGTTCTCGGTCGCGT
CGGGCGGCGAGTGCCGTGGGTATTGGTGTGGGTGGTTTGGGTGGTCGGTTGGTTGGTTTG
GTGGAGGGTGAGCGGCGTCGGGTGGTTTTGGATTTGGTGCGGTCTCATGCGGCGACGGTG
TTGGGGCATGGGGATGTGGCGGGTGTGGGTGCGGGGCGGGCTTTTCGTGAGTTGGGGTTT
GATTCGTTGACGGCGGTTGAGTTGCGGAATCGGTTGAATACGGCGACGGGGGTGCGGTTG
CCGGCGACGTTGGTGTTTGACTATCCGACCCCGACCGAGCTGGCGGACTATTTGCTGGTT
CAGATGGTTGGTGAGTCGGGTGCGGCCGACTCCGTCCAGGTGCCGATATCGGTTTCGTCG
GAGGAGCCGTTGGCTGTGGTGGGTATGGCGTGCCGGTTCCCTGGTGGGGTGGGTTCGCCG
GATGAGTTGTGGGATTTTGTGTTGGCTGGTGGGGATGGTATTTCGGGTTTGCCGGTGGAT
CGGGGTTGGGATGTGGCGGGGTTGTTCGATCCGGATCCGGAGCGTGAGGGGACTTCGTAT
ACGCGTGAGGGTGGTTTCCTTCATGATGCGGCGGAGTTCGATCCTGGTTTCTTCGGGATC
TCGCCGCGTGAGGCGTTGGCGATGGACCCGCAGCAGCGGCTTCTCCTGGAAGCGTCGTGG
GAGGCGGTTGAGAACGCGGGTATCGATCCGTTGAGTTTGAAGGGGACCAGTACCGGAGTC
TTCGCCGGAGTCACCTACCACGACCATGCGGCACGTCTCCGAACCGTCCCGGACGGCCTG
GAAGGGCTGCTGGGCATCGGAGCATCCGCGAGCATTGTCTCCGGCCGAGTGGCCTACCTG
CTCGGTCTTGAGGGTCCGGCGCTGACGGTGGATACGGCGTGTTCGTCGTCGCTGGTGGCG
TTGCATTTGGCGGGTCAGGCCCTGCGGCAGGGCGAGTGCTCGATGGCGCTCGCCGGCGGT
GTGACCGTCATGTCCACTCCGGGGACGTTTGTCGACTTCAGTCGTCAGCGGGGTCTTGCT
GCGGACGGTCGGTGCAAGGCGTTCGATGTCTCCGCCGATGGGTTCGGGCCGGCCGAGGGC
GTGGGCATGTTGGTCCTGGAGCGGCTCTCGGACGCGCAGCGCCTGGGCCACCCCGTCCTC
GCTGTCATCCGGGGTAGCGCCGTCAACCAGGACGGTGCGAGCAATGGTCTGACCGCTCCG
AATGGTCCGTCGCAGCAGCGGGTGATCCGCCAGGCCCTGGCGGCTGCGGATCTGTCGCCC
GCCGATGTGGATGTGGTGGAGGCGCACGGCACCGGCACGGCGTTGGGTGACCCGATCGAG
GCGCAGGCCCTGCTGGCGACCTACGGTCAGGATCGTCCCGAGGACCGGCCGCTGAGGCTG
GGCTCGATCAAGTCGAACATCGGACACACCCAGGCCGCGGCCGGTGTCGCCGGTGTGATC
AAGATGGTGCTCGCCATGCAGCACGGCGTCCTCCCGGCGACGCTGCATGTCAACGAACCG
ACCCCGCATGTGGATTGGGCGAGCGGTGCGGTTGAGCTGTTGACCGAGGCCACCGCCTGG
CCCGAGACGGGCAAACCACGTCGGGCTGCGGTGTCGTCGTTCGGTATCAGCGGCACCAAC
GCCCACACGATCATCGAACAGGCCCCAGCCGTCGATCGTGTATCCGATGTGCCTGACGCC
GATTCGGCCTCGGGCGTGACGGTGCCCTGGGTGGTGTCGGCGCGAGGTGTAGACGGCCTT
CGCAGCCAAGCGGCTCGTCTGCGGGAGTGGGCGTTGAAGCACCCTGAGCACAGCTTGGTT
GATGTTGGTCATTCGTTGGTGGTGTCGCGGTCGGCTTTTGAGGATCGGGTGGTTGTTCTC
GGTTCGGACCGGGACGCGCTGTTGGACGGTCTGGCGGCGGCTGCTCAGGGGGGACCCTGG
CCTGGTGTCGTGCAGGGTTCGTCTGTCGGGTCCGGTGGTGGTGTGGCGTTCCTGTTCACT
GGGCAGGGCGCGCAGCGGCTGGGCATGGGTCGTGAACTGGCGGAGAGGTTCCCGGTGTTC
GCGTCCGCGCTGGACGAGGTCTGCGTTCAGCTCGACGCGCATCTGGAGCGTCCGTTGCGT
GAGGTGCTGTTCGCCGAACCTGACACCGAGGCGGCGGCGCTGCTGGACGAGACCGCGTTC
ACGCAGGCAGCCCTGTTCGCCGTGGAGGTCGCGCTGTATCGGCTGGTGGAGTCGTGGTCC
CTGACCCCGGACTATCTCCTGGGCCACTCGATCGGTGGTCTGGCTGCCGCGTATGTGGCG
GGTGTGCTGTCGTTGGAGGATGCGGCCGAGGTTGTGGTGGCTCGGGGTCGGTTGATGCAG
GCCCTGCCCAAGGGCGGAGCCATGGTCTCCCTCCAGGCCGCTGAGGACGAGGTTGTGGAG
TCGCTGGGCGGTCTGGTGTCGATCGCCGCGGTGAATGGTCCGCAGGCGGTCGTCATCTCC
GGAGACGAGGACGCCGTCACAGCGGTGGCGGACGAATGGCGGTCCCGGGGACGGAAGGTG
AAGCGCCTCACGGTCAGCCACGCCTTCCACTCGGCCCTGATGGAGCCAATGCTCGCCACC
TTCGAGCAGGTCCTGTCTGGGGTGACGCTGAACCCGCCGCGGATCCCGGTCATCTCCGAC
TCCACCGGTCTGCCTCTCACGGCGGAGCAGGCCACCTCTCCCGCGTACTGGACCGCCCAC
GTCCGTAACCCGGTCCTGTTCCACCAGGCCATCACCCACCTCACCGGCCAAGGCGTGAAC
AGCTTCCTGGAACTGGGCCCCGACGGCGTACTCAGCGCCATGACCCGCACGAGCCTGGCC
GAAGACAGCGACACCACGGTCGTCCCCCTGCTGCGATCCGGCCGCCAGGAGCCGGAAGCC
GCGCTCACCGCGCTGGCCGAGCTGTATGTCAACGGCGTGGCCGTCGACTGGACCGTACTC
CTCGACGGAGCCCGCCCGGTCGCCCTGCCGACCTACGCCTTCCAGCACCAGCGTTTCTGG
CTGGAGACCGGTACTGAGATTCCCGCGGAGGCCGCGACCGAACCCGGGGACTCCGTCTTC
TGGCGAGCGGTCGAGCAGGGCGATGCCGGAGAGCTGGCGAGCGCGTTCGCCGCGGTAGGC
GTGGACGCGTCCGCTGTCGAGTGGGAGTCGGTGCTGCCCGCGCTGTCTTCCTGGCGGCAG
GCGCAGCGCGTCCGATCTGTCGCGGATTCCTGGCGCTACCGCGTCACCTGGAAGCCGCGC
GCCGGCAGGCAGTCCAGCACCCTGACGGGAACCTGGCTGGTCGTGGCCCCTGCCGAAGAC
CTTGAGCTGGTCGACCAGTCCGTGGCAGCGCTCGAAGCCCACGGAGCGAGCGTCATCGTG
CTCCGTCCCACCGAGGGAAGTGACTGCGGCGATCGCCATATGTGGGCCGAGTCGTTGCGG
CGCGTTGTGCCGTCCGATGAGGTGGATTCCCTCGCCGGGGTTGTGTCTCTGGTGGGGGAT
GTGGCGGGGACGTTGGGGTTGGTGCAGGGGTTGGGTGGTGTGGGTGTGGTGGCTCCGTTG
TGGTGTGTGACGCGGGGTGCTGTGGGTGTGGGTGGTGGGGATGTGGTGGTGTCTCCGGTG
CAGGGTTTGGTGTGGGGGTTGGGTCGGGTGGTGGGTTTGGAGCATCCGGAGCGGTGGGGT
GGTGTGGTTGATCTGCCGGTGTCGGTGGATGGTCGGGGTTGGGAGCGTTTCTGTTCCGTC
CTGGCGGGTGGTGGTGGTGAGGATCAGGTGGCGGTGCGGTCGTCGGGTGTGTTCGTACGA
CGTCTGGTTCCGGCTCCCGCTCCCGCCCCGGCCCCGGCTGCGGTCTCGGTTGGGGAGGGT
GGGTGGTCGCCGGGTGGGGGGACGGTCCTTGTCACGGGTGGTACGGGGGTGATGGGGGCT
CGGGCCGCGCGTTGGTTGGCGGCTCGGGGCGCCGAGCGCCTGTTGTTGGTGAGCCGTGCG
GGGGAGACCGCTCCGGGTGTGTCGGAGTTGGTGGCGGAGCTGACCGCGATGGGCAGCCGG
GCCGAGGTCGTCGCTTGTGATGTCGCCGACCGTGACGCACTGGCCGCGCTCCTCACCGCC
GTACCGGAGGAGTATCCACTGACCGCGGTCGTCCACACCGCACACCACCATGACGACGAG
CCCCTGGCATCCATGAGCGCGGAGCGCTACCTGCCTGTACTCGACGCCAAGTGGGTCGGA
GCATGGAACCTGCACGAGCTGACGAAAGACCTGCCGCTGTCGGCGTTCGTCCTCTTCTCC
TCAGGCGCGGGTGTCTGGGGTGGCGGCGGTCAGGGCGCGTACGCGGCGGCCAACGCCGGT
CTGGACGCGCTGGCCGAGTACCGCCAGGGGCTGGGACTCCCGGCGACCGCCATCGCTTGG
GGCCCGTGGCAGTACCAGCAGGACTCCTCGGCGGTCACGGACCAGTCCGGCGCGCTGACG
GATATGGACCGGCGCGGTCTGCATCCGATGGCGCCCGAACCGGCGATCGACGCGCTGGGC
GTGGCCCTGACACGTGGTGAGACAGCGTTGGTGGTGGCCGATGTGGACTGGGAGCGGTTC
TACCCGGCCTTCGCCGTGGCCCGCCCCCGCCCGCTGCTGCACGACATCCCGGCCGTCGCC
GCACTGCTCGCGCAGGATCGCGACAGCGACGGCGACGTACAGGCCCGCTCCGAGCTGGCC
GAACGACTCGCGGGTACGTCGGAGAGCGAGCGGGACCGGATCGTCCTGACCATGGTCCGT
ACGCATGTGGCCGCCGTACTGGGACACACCGGTGTCGACGGAGTTCCGGCGGGGCGCGCC
TTCCGGGATCTCGGTTTTGACTCGCTGACCGCTGTGGAACTGCGGAACCGGCTGAGCAAG
GCCACCGGGGTGGCGCTGCCCGCCACCCTCGTCTTCGACCATCCGACGCCGGAGAAAGTC
GCGGCCCTGGTCGTCGCCGACGTACTGGAGCAGCGCGGCACCGCGCTGCCGGGTCAGACC
GTGGTTGCGGCGTCGCCCGATGAGCCGCTGGCCGTGGTGGGTATGGCCTGCCGATTCCCC
GGTGGGGTCGCTTCTCCGGAAGAGCTGTGGCAGCTCGTCATCAGCGGTGGAGACGCGATC
TCTGGCTTCCCGGCCGACCGCGACTGGGACCTCGCCGCCCTCTACCACCCGGATCCCGAC
CACGTCGGGACCTCGTACACCCGTGAGGGCGGATTCCTCTACGACGCCGGCGAGTTCGAT
CCCGGCTTCTTCGGGATCTCGCCGCGCGAGGCCCTGGCGATGGACCCGCAGCAGAGGCTC
CTCCTGGAAACCTCCTGGGAAGCGGTCGAGAACGCGGGGATCGACCCGTTGTCGCTGCGC
GGCCGTAAGGTCGGTGTCTTCACCGGGATGAGCTACCACGACTACGCGGCCCGGCTGCGG
TCCGTACCGGAAGGACTTGAGGGCTATCTCGGAACCGGTAACGCCGGCAGTGTGATGTCC
GGCCGGGTGGCCTACGTTCTTGGGACTGAGGGTCCGGCGGTGACGGTGGACACGGCGTGT
TCGTCGTCGCTGGTCGCGCTGCACTGGGCGGCGCAGGCCCTGCGCCAGGGCGAGTGCTCG
ATGGCGCTGGCCGGCGGCGTCACCGTCATGGCGACGCCGGGGACGTTTGTGGACTTCAGC
CGTCAGCGTGGTCTCGCGCCGGATGGTCGGTGCAAGGCGTTCGCGGCCGGCGCCGACGGC
ACGGGCTGGTCTGAGGGCGTTGGCATGGTGTTGGTGGAGCGGTTGTCGGACGCGGAGCGC
CTGGGACATCCCATCCTCGCGGTAATCCGCTCCAGCGCGGTGAATCAGGACGGTGCGAGT
AATGGGTTGACGGCGCCGAATGGTCCGTCGCAGCAGCGGGTGATCCGTCAGGCCCTGTCG
ACGGCCGGGCTGACGACCGCCGATGTGGACGCGGTCGAGGCGCATGGCACGGGGACGAAT
CTGGGTGACCCGATCGAGGCGCAGGCCCTGCTGGCGACGTACGGTCAGGATCGTCCCGAG
GAGCGGCCGTTGTTCCTGGGTTCGTTGAAGTCGAACATCGGGCACACGCAGGCTGCGGCC
GGTGTGGCGGGTCTGATCAAGATGGTGATGGCGCTCCAGCACGGTGTTCTTCCGGCGACG
TTGCATGTGGATGAGCCGACGCCGCATGTCGACTGGGCGAGCGGCGCGGTCGAGCTGCTG
ACCGAGGCCACCCCGTGGCCCGAGACGGGCCGTCCGCGCCGGGCCGCGGTGTCGTCCTTC
GGCATCAGCGGCACCAACGCCCACACCATCCTCGAACAAGCGCCCGTCACCGAGCCGACC
CCGGTCGGCGGCCCGCAACAGAGCGATGACACCCCGGTCGGCGTGCTGCCCTGGGTGCTC
TCCGCGCGCGGTGAGACGGCCCTGCGTGGGCAGTCGTCCCGGCTCGCCGACTGGGTGACG
GCACGTCCCGAGGACACTGCCGTGGAGGTGGCCCGCTCGCTGATGGCGTCCCGCTCGGCC
TTCGAGGACCGATTGGTGGTCCTGGGCGCCGACCGTGAGGAACTACTCGCGGGGGTGCGC
GCTGTCGCACGCGGCGAGGCGTGCTCCGGGGTGATCCGGACGCCGTCGGGAGTGTCCGTG
CCGGAAGGCAGAGCGTTCCTGTTTACGGGACAGGGTGCGCAGCGGCTGAGTATGGGTCGT
GAACTGGCGCAGCGTTTCCCGGTGTTCGCGTCTGCGCTGGATGAGGTCTGTGTTCAGCTC
GACGCGCATCTGGAGCGTCCGTTGCGTGAGGTGCTGTTCGCCGAGCCTGACACTGAGGCT
GCGGCGCTGCTGGACGAGACCGTGTTCACGCAGGCAGCGTTGTTTGCCGTTGAGGTTGCG
CTGTATCGGTTGGTGGAGTCGTGGTCGCTGACGCCGGACTATCTCCTGGGCCACTCCGTC
GGTGGTCTGGCCGCGGCACATGTGTCGGGTGTGTTGTCGCTGGAGGACGCGGCCGAGGTT
GTCGCGGCTCGGGGTCGGTTGATGCAGGCCCTGCCCAAGGGCGGAGCCATGGTCTCCCTC
CAGGCGTCGGAAGACGAGGTCCTGGAATCGCTTCAGGCCCTGGAGACGGCGGACCGGGTG
TCGATCGCCGCGGTGAACGGCCCGGACACGGTGGTGATCTCCGGTGACGACGAGGCGGTG
ACTGAGGTCGCCGGGTACTGGCTGGTGCAGGACCGGAAGGTGAAGCGGCTGAAGGTCAGC
CATGCCTTCCACTCGGTGCTGATGGAGCCGATGCTCGCCGAGTTCGAAGAGGTCGTGTCG
CGGGTGACGCTGAACGCCCCGCGGATCCCGGTGGTCTCCGACTCCACGGGTGAACTGCTG
ACTGCCGAGCAGGCCACGTCTCCCGCGTACTGGGTTGGGCATGTCCGTAAGCCCGTCCGA
TTCCACCAGGCGGTGACCTACCTCGCCGAGCAGGGTGTTAGTGCCTTCCTGGAGTTGGGC
CCTGATGGTGTGCTCAGCGCCATGGTGCGGAACAGCCTGGTCGATGGCGAGGTGATTGCC
ACGCCGTTGCTGCGGTCCGGGCGTGCGGAGCCTGAGACGGCGTTGACGGCGCTGGCCGAG
CTGTTTGTCGCGGGTGTGGCGGTGGAGTGGTCTGCGGTGCTTGGTGGCGGGGAGAGTGGG
CGGCGGGTCGAGCTGCCGACGTACGCCTTCCAACGTGAGAGGTACTGGCTGGAGTCCGGG
GCTGCGGCTGCGGCTGAGCCGGCGGTTGGTGGGGTTATCGCCCACGGTATGGATGCTGGT
TTTTGGGGTGCGGTGGAGCGGGGGGATGTGGAGGGTTTGGCTGGGGTGTTGGGGTCTGGG
GTGTCGGTGGATGTGTGGGGTGAGGTGTTGCCGGAGTTGTCGTCGTGGTGGTTGGGGCGG
CGGGCTCGGTCGGTGGTGGAGGGGTGGCGGTATCGGGTGGAGTGGCGTCGGGTGGGTGGT
GGGTTGTTGTCGGGTGGTGGTGGGTTGTCGGGGACGTGGGTGGTGGTGGTTCCGGTGGGG
GTGGATGTGGGGTTGGTGGATGGGTGTGTGGGTGCGTTGGTGGGGTGTGGTGTGCGGGTG
GTTGTGGTGGGTGTGGATGTGGGTGTGTTGGGTGATGTGGAGGGGTTGGGTTCGTTGGTG
GTGGGTGGTTTGCCGGAGGGTGTGGGTGTGGGTGATGTGTCGGGTGTGGTGTCGTTGTTG
GGGTTGGTGGAGGGGTGGTTTGAGGGGTTGGGTGGTGTGTCGTTGGGTGTGGTGGGGACG
TTGGGGTTGGTGCGGGCGTTGGGTGGTGTGGGTGTGGTGGCTCCGTTGTGGTGTGTGACG
CGGGGTGCTGTGGGTGTGGGTGGTGGGGATGTGGTGGTGTCTCCGGTGCAGGGTTTGGTG
TGGGGGTTGGGTCGGGTGGTGGGTTTGGAGCATCCGGAGCGGTGGGGTGGTGTGGTTGAT
CTGCCGGTGTCGGTGGATGGTCGGGGTTGGGAGCGTTTCTGTTCGGTGTTGGCGGGTGGT
GGTGAGGATCAGGTGGCGGTGCGGTCGTCGGGTGTGTTCGTACGACGTCTGGTTCCGGCC
CCGGCTGCGGTCTCGGGTGGGGGTTGGGTTGGTGGGTTGTCGGGTGGGTCGGTGGTGGTG
ACGGGTGGTACGGGTGTGTTGGGTGGTCGTGTGGCGCGTTGGTTGGCCGGGTGTGGTGTG
GGTCGTTTGGTGTTGGTGAGTCGTTCGGGTGCTGCGGGTGTGGGTGTTGATGGGTTGGTT
GGGGAGTTGGAGGGGTTGGGTGTGGTGGTGGATGTGGTGGCGTGTGATGTTGCGGATCGT
GAGGCGATGGCGGGGGTTTTGGGTGGGGTGTCGGGGGAGTTTCCGTTGCGGGCGGTGGTG
CATGCGGCGGGTGCGAGTGGGATGGGTGCGTTGGAGGGGTTGGGTGTGGAGGAGTTTGCG
GGTGTGGTGGGGGCGAAGGTGGGTGGGGCTGTGGTTTTGGATGAGTTGGTGGGTGGGGTG
CCGTTGGTGTTGTTTTCGTCGGGTGCTGGTGTGTGGGGTGGTGGTGGTCAGGGTGCGTAT
TCGGCTGCGAATGCGTTTTTGGATGGGTTGGCGGAGTATCGGCGGGGTCGTGGGTTGCCG
GCTGTGTCGATCGCGTGGGGCCCGTGGGCCGACGGCGGAATGGCTCATGGACCGGAAGGA
TCCCAGGACCAGTTGGTCAGCCGAGGCTTCGTTCCGCTCGATCCCGATATCGCCATCGCG
GCGATGGAGGAGGCCATCGAGAAGGACGAGACCACCATCACCGTCGCCGACATCGACTGG
GCGAAGTTCTACCCCGCGTTCGCCCTGGCCCGCCCCCGGCCGCTGCTGCACGAAATACCG
GAGGTGGCCGCGCTCCTCGCCGAGGATGAGGCCGGCGTCCCCGAGAAGGGAGCCGTATCG
GCTCTCGCCGAGCGTCTGAACAGCCTGACCGATGGCGAACAGCGCCAGGCGGTGCTGGAT
ATGGTCCGCACGGAAGTAGCCGCCGTGCTCAACCATGCGCATGCCGAGAACATCGTCGAG
ACTCGGACATTCCGTGAACTCGGCTTTGACTCACTCACCGCCGTTGAACTGCGTAACCGA
CTCAACAGCGCTACAGGGTTGCGGCTTCCGGCAACGCTGATATTCGATTACCCCACCTGC
GAGGCGATCTCCGATCATCTGTGCAAGGAACTCCTGGGTAGTTCATTCGGAGCGATGACG
ACATCGGCCGTTCAGAGCGATTTCTGGTCGGCACTGCAACAAGTCGACTACCAGAAGCTC
CAGGACGCCGGAGTGGTGGCCATGGTCATGGGGCTGCTGGATGGTGAACCGGCCGAGAAG
ACCGTGGAAGAGGAGCCGGAGCCCCGACCCGAGATCGATGAGATGGACGCGGTCGAGCTG
CTCAATCTGGCTCTCCGCAACAAGATGCAACGCAACTCCGCAGCGGATTCTCAGGGAGAA
GAGGGGTAA
[10] KS34..410
[10] AT567..881
[10] methylmalonyl-CoA755..759
[10] DH932..1098
[10] ER1442..1757
[10] KR1766..1945
[10] ACP2049..2119
[11] KS2142..2517
[11] AT2677..2995
[11] malonyl-CoA2867..2871
[11] kr3307..3486
[11] ACP3595..3665
[12] KS3688..4064
[12] AT4226..4548
[12] malonyl-CoA4421..4425
[12] KR4876..5052
[12] ACP5158..5228
[10] KS100..1230
[10] AT1699..2643
[10] methylmalonyl-CoA2263..2277
[10] DH2794..3294
[10] ER4324..5271
[10] KR5296..5835
[10] ACP6145..6357
[11] KS6424..7551
[11] AT8029..8985
[11] malonyl-CoA8599..8613
[11] kr9919..10458
[11] ACP10783..10995
[12] KS11062..12192
[12] AT12676..13644
[12] malonyl-CoA13261..13275
[12] KR14626..15156
[12] ACP15472..15684

close this sectionFeature

BLASTP
Database:UniProtKB:2011_09
show BLAST table
InterPro
Database:interpro:38.0
IPR001227 Acyl transferase domain (Domain)
 [564-690]  G3DSA:3.40.366.10 [755-872]  G3DSA:3.40.366.10 [2672-2802]  G3DSA:3.40.366.10 [2867-2984]  G3DSA:3.40.366.10 [4225-4351]  G3DSA:3.40.366.10 [4421-4537]  G3DSA:3.40.366.10
G3DSA:3.40.366.10   Ac_transferase_reg
IPR002364 Quinone oxidoreductase/zeta-crystallin, conserved site (Conserved_site)
 [1572-1593]  PS01162
PS01162   QOR_ZETA_CRYSTAL
IPR006162 Phosphopantetheine attachment site (PTM)
 [2077-2092]  PS00012 [3623-3638]  PS00012 [5186-5201]  PS00012
PS00012   PHOSPHOPANTETHEINE
IPR009081 Acyl carrier protein-like (Domain)
 [2052-2118]  5.69999999999999e-12 PF00550 [3599-3664]  1.3e-11 PF00550 [5162-5227]  1.7e-11 PF00550
PF00550   PP-binding
 [2047-2119]  1e-66 G3DSA:1.10.1200.10 [3595-3667]  1e-66 G3DSA:1.10.1200.10 [5155-5231]  1e-66 G3DSA:1.10.1200.10
G3DSA:1.10.1200.10   ACP_like
 [2049-2119]  PS50075 [3595-3665]  PS50075 [5158-5228]  PS50075
PS50075   ACP_DOMAIN
 [2042-2158]  8.80000265836278e-29 SSF47336 [3588-3704]  6.90001478563507e-27 SSF47336 [5149-5235]  9.39998942703831e-22 SSF47336
SSF47336   ACP_like
IPR011032 GroES-like (Domain)
 [1462-1590]  7.00000734129907e-27 SSF50129
SSF50129   GroES_like
IPR013149 Alcohol dehydrogenase, C-terminal (Domain)
 [1583-1697]  1e-11 PF00107
PF00107   ADH_zinc_N
IPR013154 Alcohol dehydrogenase GroES-like (Domain)
 [1465-1520]  1.7e-05 PF08240
PF08240   ADH_N
IPR013968 Polyketide synthase, KR (Domain)
 [1766-1944]  1.40000000000001e-53 PF08659 [3307-3484]  6.00000000000001e-62 PF08659 [4876-5052]  3.2e-51 PF08659
PF08659   KR
IPR014030 Beta-ketoacyl synthase, N-terminal (Domain)
 [34-284]  1.39999999999997e-97 PF00109 [2142-2392]  5.80000000000004e-96 PF00109 [3688-3938]  1.29999999999998e-98 PF00109
PF00109   ketoacyl-synt
IPR014031 Beta-ketoacyl synthase, C-terminal (Domain)
 [292-410]  9.40000000000003e-47 PF02801 [2400-2517]  7.79999999999999e-50 PF02801 [3946-4064]  3.60000000000002e-48 PF02801
PF02801   Ketoacyl-synt_C
IPR014043 Acyl transferase (Domain)
 [567-881]  6.40000000000004e-107 PF00698 [2677-2995]  1e-63 PF00698 [4226-4548]  2.99999999999998e-58 PF00698
PF00698   Acyl_transf_1
IPR015083 Polyketide synthase, docking (Domain)
 [1-26]  3.4e-07 PF08990
PF08990   Docking
IPR016035 Acyl transferase/acyl hydrolase/lysophospholipase (Domain)
 [565-864]  2.19999900980707e-73 SSF52151 [2674-2989]  1.50000965748778e-68 SSF52151 [4224-4538]  2.99998750445706e-69 SSF52151
SSF52151   Acyl_Trfase/lysoPlipase
IPR016036 Malonyl-CoA ACP transacylase, ACP-binding (Domain)
 [692-754]  2.70000183580794e-16 SSF55048 [2804-2866]  1.20000117458134e-16 SSF55048 [4353-4420]  1.29999924468179e-17 SSF55048
SSF55048   Malonyl_transacylase_ACP-bd
IPR016038 Thiolase-like, subgroup (Domain)
 [37-296]  G3DSA:3.40.47.10 [298-463]  G3DSA:3.40.47.10 [2145-2404]  G3DSA:3.40.47.10 [2405-2570]  G3DSA:3.40.47.10 [3691-3950]  G3DSA:3.40.47.10 [3952-4115]  G3DSA:3.40.47.10
G3DSA:3.40.47.10   Thiolase-like_subgr
IPR016039 Thiolase-like (Domain)
 [26-462]  1.79999754022378e-102 SSF53901 [2134-2516]  6.00001679190159e-105 SSF53901 [3680-4062]  1.90000694315261e-104 SSF53901
SSF53901   Thiolase-like
IPR016040 NAD(P)-binding domain (Domain)
 [1535-1721]  3.2e-41 G3DSA:3.40.50.720 [1766-1951]  1.10000000000001e-93 G3DSA:3.40.50.720 [3306-3490]  2.39999999999997e-97 G3DSA:3.40.50.720 [4873-5094]  1.10000000000001e-93 G3DSA:3.40.50.720
G3DSA:3.40.50.720   NAD(P)-bd
IPR018201 Beta-ketoacyl synthase, active site (Active_site)
 [197-213]  PS00606 [2305-2321]  PS00606 [3851-3867]  PS00606
PS00606   B_KETOACYL_SYNTHASE
IPR020801 Polyketide synthase, acyl transferase domain (Domain)
 [569-863]  4.09994197132645e-129 SM00827 [2678-2975]  2.59998233910302e-118 SM00827 [4227-4528]  9.40003071030835e-113 SM00827
SM00827   PKS_AT
IPR020806 Polyketide synthase, phosphopantetheine-binding domain (Domain)
 [2050-2122]  2.99998750445706e-35 SM00823 [3596-3668]  3.1999989904635e-32 SM00823 [5159-5231]  7.49999605851445e-31 SM00823
SM00823   PKS_PP
IPR020807 Polyketide synthase, dehydratase domain (Domain)
 [932-1098]  3.99998544139406e-82 SM00826
SM00826   PKS_DH
IPR020841 Polyketide synthase, beta-ketoacyl synthase domain (Domain)
 [36-462]  SM00825 [2144-2570]  SM00825 [3690-4116]  SM00825
SM00825   PKS_KS
IPR020842 Polyketide synthase/Fatty acid synthase, KR (Domain)
 [1766-1945]  1.40000506907309e-42 SM00822 [3307-3486]  6.39998633403535e-49 SM00822 [4876-5052]  1.70000295590053e-35 SM00822
SM00822   PKS_KR
IPR020843 Polyketide synthase, enoylreductase (Domain)
 [1442-1757]  SM00829
SM00829   PKS_ER
SignalP No significant hit
TMHMM No significant hit
Page top