Human Metabolome Database: Showing Protein Histone-lysine N-methyltransferase SETD1A (HMDBP01734)

Identification Biological properties Gene properties Protein properties External links References XML Show 2 metabolites

Identification

HMDB Protein ID

HMDBP01734

Secondary Accession Numbers

7083

Name

Histone-lysine N-methyltransferase SETD1A

Synonyms

Lysine N-methyltransferase 2F
SET domain-containing protein 1A
Set1/Ash2 histone methyltransferase complex subunit SET1
hSET1A

Gene Name

SETD1A

Protein Type

Unknown

Biological Properties

General Function

Involved in nucleotide binding

Specific Function

Histone methyltransferase that specifically methylates 'Lys-4' of histone H3, when part of the SET1 histone methyltransferase (HMT) complex, but not if the neighboring 'Lys-9' residue is already methylated. H3 'Lys-4' methylation represents a specific tag for epigenetic transcriptional activation. The non-overalpping localization with SETD1B suggests that SETD1A and SETD1B make non-redundant contributions to the epigenetic control of chromatin structure and gene expression.

Pathways

Lysine degradation

Reactions

S-Adenosylmethionine + L-lysine-[histone] → S-Adenosylhomocysteine + N(6)-methyl-L-lysine-[histone]	details
Protein lysine + S-Adenosylmethionine → Protein N6-methyl-L-lysine + S-Adenosylhomocysteine	details
S-Adenosylmethionine + Protein N6-methyl-L-lysine → S-Adenosylhomocysteine + Protein N6,N6-dimethyl-L-lysine	details
S-Adenosylmethionine + Protein N6,N6-dimethyl-L-lysine → S-Adenosylhomocysteine + Protein N6,N6,N6-trimethyl-L-lysine	details

GO Classification

Biological Process
regulation of transcription, DNA-dependent
transcription, DNA-dependent
Cellular Component
chromosome
nuclear speck
Set1C/COMPASS complex
Function
binding
nucleotide binding
nucleic acid binding
Molecular Function
RNA binding
histone methyltransferase activity (H3-K4 specific)
nucleotide binding

Cellular Location

Nucleus speckle
Chromosome

Gene Properties

Chromosome Location

Locus

16p11.2

SNPs

SETD1A

Gene Sequence

>5124 bp
ATGGATCAGGAAGGTGGGGGAGATGGGCAGAAGGCCCCGAGCTTCCAGTGGCGGAACTAC
AAGCTCATCGTGGATCCTGCCTTGGACCCTGCCCTGCGCAGGCCTTCTCAGAAGGTGTAC
CGCTATGATGGAGTCCACTTCAGTGTCAACGACTCAAAGTATATACCAGTCGAAGACCTC
CAAGACCCCCGTTGCCATGTCAGGTCCAAAAACAGAGACTTTTCCCTCCCAGTCCCTAAG
TTTAAGCTGGACGAGTTCTATATTGGACAGATTCCACTGAAGGAAGTGACTTTTGCAAGG
CTGAATGACAACGTGCGGGAGACCTTCCTGAAGGATATGTGCCGTAAGTACGGTGAGGTG
GAAGAGGTAGAGATCCTCCTTCACCCCCGTACGCGCAAGCACCTGGGCCTGGCCCGTGTG
CTCTTCACCAGCACTCGGGGCGCCAAGGAAACGGTCAAAAACCTCCACCTTACCTCCGTC
ATGGGCAACATCATCCATGCCCAGCTTGACATCAAAGGACAACAACGAATGAAATACTAT
GAACTAATTGTCAATGGCTCCTACACCCCTCAGACTGTGCCCACTGGGGGCAAGGCCCTG
AGTGAGAAGTTCCAAGGCTCGGGTGCAGCCACTGAGACGGCCGAATCCCGCCGCCGCTCT
TCCTCTGACACAGCTGCCTACCCAGCAGGCACCACTGCGGTGGGCACTCCTGGCAACGGC
ACCCCCTGCTCCCAGGACACAAGCTTCTCCAGCAGCCGACAAGATACCCCATCTTCCTTT
GGCCAGTTCACACCTCAGTCCTCCCAAGGAACCCCCTACACGTCTCGGGGCAGCACCCCC
TACTCTCAGGACTCTGCCTACTCCAGCAGCACCACTTCAACCTCCTTCAAGCCCCGGCGG
TCAGAGAACAGCTACCAAGATGCCTTTTCCCGCCGCCACTTCTCTGCATCTTCAGCCTCC
ACAACCGCCTCCACGGCCATCGCCGCCACCACTGCAGCCACTGCCTCATCCTCCGCCTCT
TCCTCCTCATTGTCCTCGTCCTCCTCGTCATCCTCTTCCTCCTCGTCCTCTCAGTTTCGT
AGTTCTGATGCAAACTACCCAGCGTATTATGAAAGCTGGAATCGCTACCAGCGCCATACT
TCCTACCCACCACGCCGGGCCACACGGGAGGAACCCCCTGGAGCCCCTTTTGCTGAAAAT
ACAGCTGAGCGCTTCCCACCTTCTTACACCTCCTACCTGCCCCCCGAGCCCAGCCGGCCC
ACCGACCAGGACTACCGGCCTCCTGCCTCAGAGGCTCCACCCCCGGAGCCTCCAGAACCT
GGTGGAGGCGGGGGTGGAGGAGGGCCCAGCCCTGAGAGAGAAGAAGTTCGGACTTCCCCC
CGCCCAGCCTCCCCTGCCCGCTCTGGCTCCCCAGCCCCGGAGACCACCAATGAGAGTGTG
CCCTTCGCCCAGCACAGCAGCCTGGATTCCCGCATCGAGATGCTGCTGAAGGAGCAGCGC
TCCAAGTTTTCCTTCTTGGCCTCTGACACAGAGGAGGAGGAAGAGAACAGCAGCATGGTC
CTTGGGGCCAGAGATACAGGGAGTGAGGTGCCTTCTGGGTCAGGGCATGGGCCCTGCACA
CCCCCTCCGGCCCCAGCTAATTTTGAGGATGTGGCACCTACAGGGAGCGGGGAGCCAGGG
GCTACCCGGGAGTCTCCCAAGGCAAATGGACAGAACCAGGCTTCTCCATGCTCTTCTGGA
GACGACATGGAGATCTCCGACGACGACCGGGGTGGCTCACCCCCTCCGGCCCCGACGCCC
CCTCAGCAGCCTCCGCCACCTCCCCCTCCCCCGCCGCCTCCTCCTCCCTACCTGGCGTCC
CTTCCTCTTGGTTATCCTCCCCACCAACCTGCCTACCTCCTCCCACCCAGACCTGATGGG
CCGCCGCCCCCTGAGTACCCCCCACCTCCTCCACCACCCCCGCACATCTATGACTTTGTG
AACTCCTTGGAGCTCATGGACCGACTTGGGGCTCAGTGGGGAGGGATGCCCATGTCCTTC
CAGATGCAGACCCAGATGTTAACTCGGCTCCATCAGCTGCGGCAGGGCAAGGGATTGATT
GCCGCCTCAGCTGGCCCCCCCGGTGGGGCCTTTGGGGAGGCCTTCCTCCCGTTTCCACCC
CCGCAGGAGGCAGCCTACGGCTTGCCGTATGCTCTATATGCACAGGGGCAGGAGGGCAGA
GGGGCATACTCACGGGAGGCCTACCACCTGCCCATGCCAATGGCAGCCGAGCCCCTGCCC
TCCTCCTCAGTCTCGGGAGAGGAGGCCCGGCTGCCACCCAGGGAAGAAGCAGAGCTGGCA
GAGGGCAAGACCCTCCCGACAGCAGGCACCGTGGGCCGTGTGCTCGCCATGCTGGTCCAG
GAGATGAAGAGCATCATGCAGCGAGACCTCAACCGCAAGATGGTGGAGAACGTGGCCTTC
GGAGCCTTTGACCAGTGGTGGGAGAGCAAGGAGGAGAAGGCCAAGCCATTCCAGAACGCG
GCCAAGCAGCAAGCCAAGGAGGAGGATAAAGAGAAGACGAAGCTGAAGGAGCCTGGCCTG
CTGTCCCTCGTGGACTGGGCCAAGAGCGGGGGCACTACGGGCATCGAGGCTTTCGCCTTT
GGGTCAGGGCTGAGAGGGGCCCTGCGGCTGCCTTCATTCAAGGTAAAGCGGAAAGAGCCA
TCGGAAATTTCCGAGGCCAGTGAGGAAAAGAGGCCTCGTCCCTCCACTCCTGCTGAGGAA
GATGAAGACGACCCTGAACAAGAGAAGGAGGCTGGAGAGCCAGGACGTCCGGGGACCAAG
CCCCCGAAGCGGGACGAAGAGCGAGGCAAGACCCAGGGCAAGCACCGCAAGTCCTTTGCT
CTGGACAGCGAAGGGGAGGAGGCATCCCAGGAGTCCTCCTCGGAGAAGGATGAGGAGGAT
GACGAGGAAGATGAGGAAGATGAAGATCGAGAGGAAGCTGTGGATACCACAAAGAAGGAG
ACAGAGGTGTCGGATGGCGAGGACGAGGAAAGCGATTCGTCTTCCAAATGTTCTCTGTAT
GCTGACTCAGATGGCGAAAATGACAGCACATCAGACTCCGAGAGCAGCAGCTCTTCCAGC
TCCTCATCCTCCTCCTCCTCCTCGTCCTCATCCTCCTCGTCCTCTTCATCCTCTGAGTCC
TCCTCTGAAGATGAAGAGGAAGAGGAGCGGCCAGCAGCCCTTCCCTCAGCCTCCCCGCCC
CCCAGAGAAGTCCCAGTGCCCACGCCAGCACCTGTGGAGGTGCCAGTGCCGGAAAGGGTT
GCAGGCTCCCCAGTCACACCCCTGCCCGAACAGGAGGCGTCTCCAGCAAGGCCTGCAGGC
CCCACGGAGGAGTCACCCCCCAGTGCGCCTCTGCGTCCCCCAGAACCACCTGCTGGGCCC
CCGGCCCCTGCCCCACGCCCCGATGAGCGTCCCTCTTCTCCCATCCCCCTCCTGCCCCCA
CCCAAGAAACGCCGGAAAACTGTCTCCTTCTCTGCCATCGAGGTGGTGCCAGCCCCGGAG
CCCCCTCCAGCCACACCGCCGCAGGCCAAGTTTCCCGGCCCAGCCTCCCGCAAGGCTCCC
CGGGGCGTGGAGCGGACCATCCGCAACCTGCCCCTGGACCACGCATCTCTGGTCAAGAGT
TGGCCCGAGGAGGTGTCCCGAGGAGGCCGGAGCCGGGCTGGAGGCCGAGGCCGCCTCACC
GAGGAAGAGGAGGCTGAGCCAGGGACAGAGGTGGACCTGGCGGTCCTGGCCGACCTGGCC
CTGACCCCTGCCCGGCGCGGGCTGCCTGCCCTGCCTGCTGTTGAAGACTCAGAGGCCACA
GAGACATCGGACGAGGCCGAGCGCCCTAGGCCCCTGCTCAGCCACATCCTCCTGGAGCAC
AACTATGCCCTGGCCGTCAAGCCCACGCCCCCTGCGCCAGCCCTGCGGCCCCCGGAGCCA
GTGCCCGCACCCGCCGCCCTCTTCAGTTCCCCAGCTGATGAGGTCCTGGAGGCCCCCGAG
GTGGTGGTGGCTGAGGCGGAGGAGCCCAAGCCGCAGCAACTGCAGCAGCAGCGGGAGGAG
GGCGAAGAGGAGGGGGAGGAAGAGGGGGAGGAAGAGGAGGAGGAGTCCTCTGACAGCAGC
AGCAGCAGCGATGGGGAGGGCGCCCTCCGGAGGCGCAGCCTCCGCTCCCACGCCCGGCGC
CGCCGCCCTCCGCCCCCACCCCCGCCGCCACCGCCCCGCGCCTACGAGCCACGCAGTGAG
TTTGAACAGATGACCATCCTGTATGACATTTGGAACTCGGGCCTGGACTCAGAGGACATG
AGTTACCTGCGGCTTACGTACGAGCGGCTGCTGCAGCAGACAAGCGGGGCTGACTGGCTC
AACGACACTCACTGGGTCCATCACACAATCACCAACCTGACCACCCCAAAACGCAAGCGG
CGGCCCCAGGATGGGCCCCGGGAGCACCAGACAGGCTCAGCCCGCAGCGAAGGCTACTAC
CCCATCAGCAAGAAGGAGAAGGACAAGTACCTGGACGTGTGCCCAGTCTCGGCCCGGCAG
CTGGAGGGCGTGGACACTCAGGGGACGAACCGCGTGCTGTCCGAGCGCCGGTCCGAGCAG
CGGCGGCTGCTGAGCGCCATCGGTACCTCCGCCATCATGGACAGTGACCTGCTGAAACTC
AACCAGCTCAAGTTCCGGAAGAAGAAGCTCCGATTTGGCCGGAGCCGGATCCACGAGTGG
GGTCTGTTTGCCATGGAACCCATTGCTGCTGACGAGATGGTCATCGAATACGTGGGTCAG
AACATCCGTCAGATGGTGGCCGACATGCGGGAGAAGCGCTACGTGCAGGAGGGCATTGGC
AGCAGCTACCTGTTCCGGGTGGACCACGACACCATCATCGATGCCACCAAGTGTGGCAAC
CTGGCCAGATTCATCAACCACTGCTGCACGCCTAACTGCTACGCCAAGGTCATCACCATC
GAGTCCCAGAAGAAGATCGTGATCTACTCCAAGCAGCCCATTGGCGTGGACGAGGAGATC
ACCTACGACTACAAGTTCCCACTGGAAGACAACAAGATCCCGTGTCTGTGTGGCACAGAG
AGCTGCCGGGGCTCCCTAAACTGA

Protein Properties

Number of Residues

1707

Molecular Weight

186032.16

Theoretical pI

5.141

Pfam Domain Function

SET (PF00856 )
RRM_1 (PF00076 )
N-SET (PF11764 )

Signals

Not Available

Transmembrane Regions

Not Available

Protein Sequence

>Histone-lysine N-methyltransferase SETD1A
MDQEGGGDGQKAPSFQWRNYKLIVDPALDPALRRPSQKVYRYDGVHFSVNDSKYIPVEDL
QDPRCHVRSKNRDFSLPVPKFKLDEFYIGQIPLKEVTFARLNDNVRETFLKDMCRKYGEV
EEVEILLHPRTRKHLGLARVLFTSTRGAKETVKNLHLTSVMGNIIHAQLDIKGQQRMKYY
ELIVNGSYTPQTVPTGGKALSEKFQGSGAATETAESRRRSSSDTAAYPAGTTAVGTPGNG
TPCSQDTSFSSSRQDTPSSFGQFTPQSSQGTPYTSRGSTPYSQDSAYSSSTTSTSFKPRR
SENSYQDAFSRRHFSASSASTTASTAIAATTAATASSSASSSSLSSSSSSSSSSSSSQFR
SSDANYPAYYESWNRYQRHTSYPPRRATREEPPGAPFAENTAERFPPSYTSYLPPEPSRP
TDQDYRPPASEAPPPEPPEPGGGGGGGGPSPEREEVRTSPRPASPARSGSPAPETTNESV
PFAQHSSLDSRIEMLLKEQRSKFSFLASDTEEEEENSSMVLGARDTGSEVPSGSGHGPCT
PPPAPANFEDVAPTGSGEPGATRESPKANGQNQASPCSSGDDMEISDDDRGGSPPPAPTP
PQQPPPPPPPPPPPPPYLASLPLGYPPHQPAYLLPPRPDGPPPPEYPPPPPPPPHIYDFV
NSLELMDRLGAQWGGMPMSFQMQTQMLTRLHQLRQGKGLIAASAGPPGGAFGEAFLPFPP
PQEAAYGLPYALYAQGQEGRGAYSREAYHLPMPMAAEPLPSSSVSGEEARLPPREEAELA
EGKTLPTAGTVGRVLAMLVQEMKSIMQRDLNRKMVENVAFGAFDQWWESKEEKAKPFQNA
AKQQAKEEDKEKTKLKEPGLLSLVDWAKSGGTTGIEAFAFGSGLRGALRLPSFKVKRKEP
SEISEASEEKRPRPSTPAEEDEDDPEQEKEAGEPGRPGTKPPKRDEERGKTQGKHRKSFA
LDSEGEEASQESSSEKDEEDDEEDEEDEDREEAVDTTKKETEVSDGEDEESDSSSKCSLY
ADSDGENDSTSDSESSSSSSSSSSSSSSSSSSSSSSSSESSSEDEEEEERPAALPSASPP
PREVPVPTPAPVEVPVPERVAGSPVTPLPEQEASPARPAGPTEESPPSAPLRPPEPPAGP
PAPAPRPDERPSSPIPLLPPPKKRRKTVSFSAIEVVPAPEPPPATPPQAKFPGPASRKAP
RGVERTIRNLPLDHASLVKSWPEEVSRGGRSRAGGRGRLTEEEEAEPGTEVDLAVLADLA
LTPARRGLPALPAVEDSEATETSDEAERPRPLLSHILLEHNYALAVKPTPPAPALRPPEP
VPAPAALFSSPADEVLEAPEVVVAEAEEPKPQQLQQQREEGEEEGEEEGEEEEEESSDSS
SSSDGEGALRRRSLRSHARRRRPPPPPPPPPPRAYEPRSEFEQMTILYDIWNSGLDSEDM
SYLRLTYERLLQQTSGADWLNDTHWVHHTITNLTTPKRKRRPQDGPREHQTGSARSEGYY
PISKKEKDKYLDVCPVSARQLEGVDTQGTNRVLSERRSEQRRLLSAIGTSAIMDSDLLKL
NQLKFRKKKLRFGRSRIHEWGLFAMEPIAADEMVIEYVGQNIRQMVADMREKRYVQEGIG
SSYLFRVDHDTIIDATKCGNLARFINHCCTPNCYAKVITIESQKKIVIYSKQPIGVDEEI
TYDYKFPLEDNKIPCLCGTESCRGSLN

External Links

GenBank ID Protein

55741677

UniProtKB/Swiss-Prot ID

O15047

UniProtKB/Swiss-Prot Entry Name

SET1A_HUMAN

PDB IDs

GenBank Gene ID

GeneCard ID

GenAtlas ID

HGNC ID

References

General References

Gerhard DS, Wagner L, Feingold EA, Shenmen CM, Grouse LH, Schuler G, Klein SL, Old S, Rasooly R, Good P, Guyer M, Peck AM, Derge JG, Lipman D, Collins FS, Jang W, Sherry S, Feolo M, Misquitta L, Lee E, Rotmistrovsky K, Greenhut SF, Schaefer CF, Buetow K, Bonner TI, Haussler D, Kent J, Kiekhaus M, Furey T, Brent M, Prange C, Schreiber K, Shapiro N, Bhat NK, Hopkins RF, Hsie F, Driscoll T, Soares MB, Casavant TL, Scheetz TE, Brown-stein MJ, Usdin TB, Toshiyuki S, Carninci P, Piao Y, Dudekula DB, Ko MS, Kawakami K, Suzuki Y, Sugano S, Gruber CE, Smith MR, Simmons B, Moore T, Waterman R, Johnson SL, Ruan Y, Wei CL, Mathavan S, Gunaratne PH, Wu J, Garcia AM, Hulyk SW, Fuh E, Yuan Y, Sneed A, Kowis C, Hodgson A, Muzny DM, McPherson J, Gibbs RA, Fahey J, Helton E, Ketteman M, Madan A, Rodrigues S, Sanchez A, Whiting M, Madari A, Young AC, Wetherby KD, Granite SJ, Kwong PN, Brinkley CP, Pearson RL, Bouffard GG, Blakesly RW, Green ED, Dickson MC, Rodriguez AC, Grimwood J, Schmutz J, Myers RM, Butterfield YS, Griffith M, Griffith OL, Krzywinski MI, Liao N, Morin R, Palmquist D, Petrescu AS, Skalska U, Smailus DE, Stott JM, Schnerch A, Schein JE, Jones SJ, Holt RA, Baross A, Marra MA, Clifton S, Makowski KA, Bosak S, Malek J: The status, quality, and expansion of the NIH full-length cDNA project: the Mammalian Gene Collection (MGC). Genome Res. 2004 Oct;14(10B):2121-7. [PubMed:15489334 ]
Mayya V, Lundgren DH, Hwang SI, Rezaul K, Wu L, Eng JK, Rodionov V, Han DK: Quantitative phosphoproteomic analysis of T cell receptor signaling reveals system-wide modulation of protein-protein interactions. Sci Signal. 2009 Aug 18;2(84):ra46. doi: 10.1126/scisignal.2000007. [PubMed:19690332 ]
Olsen JV, Blagoev B, Gnad F, Macek B, Kumar C, Mortensen P, Mann M: Global, in vivo, and site-specific phosphorylation dynamics in signaling networks. Cell. 2006 Nov 3;127(3):635-48. [PubMed:17081983 ]
Gauci S, Helbig AO, Slijper M, Krijgsveld J, Heck AJ, Mohammed S: Lys-N and trypsin cover complementary parts of the phosphoproteome in a refined SCX-based approach. Anal Chem. 2009 Jun 1;81(11):4493-501. doi: 10.1021/ac9004309. [PubMed:19413330 ]
Martin J, Han C, Gordon LA, Terry A, Prabhakar S, She X, Xie G, Hellsten U, Chan YM, Altherr M, Couronne O, Aerts A, Bajorek E, Black S, Blumer H, Branscomb E, Brown NC, Bruno WJ, Buckingham JM, Callen DF, Campbell CS, Campbell ML, Campbell EW, Caoile C, Challacombe JF, Chasteen LA, Chertkov O, Chi HC, Christensen M, Clark LM, Cohn JD, Denys M, Detter JC, Dickson M, Dimitrijevic-Bussod M, Escobar J, Fawcett JJ, Flowers D, Fotopulos D, Glavina T, Gomez M, Gonzales E, Goodstein D, Goodwin LA, Grady DL, Grigoriev I, Groza M, Hammon N, Hawkins T, Haydu L, Hildebrand CE, Huang W, Israni S, Jett J, Jewett PB, Kadner K, Kimball H, Kobayashi A, Krawczyk MC, Leyba T, Longmire JL, Lopez F, Lou Y, Lowry S, Ludeman T, Manohar CF, Mark GA, McMurray KL, Meincke LJ, Morgan J, Moyzis RK, Mundt MO, Munk AC, Nandkeshwar RD, Pitluck S, Pollard M, Predki P, Parson-Quintana B, Ramirez L, Rash S, Retterer J, Ricke DO, Robinson DL, Rodriguez A, Salamov A, Saunders EH, Scott D, Shough T, Stallings RL, Stalvey M, Sutherland RD, Tapia R, Tesmer JG, Thayer N, Thompson LS, Tice H, Torney DC, Tran-Gyamfi M, Tsai M, Ulanovsky LE, Ustaszewska A, Vo N, White PS, Williams AL, Wills PL, Wu JR, Wu K, Yang J, Dejong P, Bruce D, Doggett NA, Deaven L, Schmutz J, Grimwood J, Richardson P, Rokhsar DS, Eichler EE, Gilna P, Lucas SM, Myers RM, Rubin EM, Pennacchio LA: The sequence and analysis of duplication-rich human chromosome 16. Nature. 2004 Dec 23;432(7020):988-94. [PubMed:15616553 ]
Nagase T, Ishikawa K, Nakajima D, Ohira M, Seki N, Miyajima N, Tanaka A, Kotani H, Nomura N, Ohara O: Prediction of the coding sequences of unidentified human genes. VII. The complete sequences of 100 new cDNA clones from brain which can code for large proteins in vitro. DNA Res. 1997 Apr 28;4(2):141-50. [PubMed:9205841 ]
Wysocka J, Myers MP, Laherty CD, Eisenman RN, Herr W: Human Sin3 deacetylase and trithorax-related Set1/Ash2 histone H3-K4 methyltransferase are tethered together selectively by the cell-proliferation factor HCF-1. Genes Dev. 2003 Apr 1;17(7):896-911. [PubMed:12670868 ]
Lee JH, Skalnik DG: CpG-binding protein (CXXC finger protein 1) is a component of the mammalian Set1 histone H3-Lys4 methyltransferase complex, the analogue of the yeast Set1/COMPASS complex. J Biol Chem. 2005 Dec 16;280(50):41725-31. Epub 2005 Oct 26. [PubMed:16253997 ]
Lee JH, Tate CM, You JS, Skalnik DG: Identification and characterization of the human Set1B histone H3-Lys4 methyltransferase complex. J Biol Chem. 2007 May 4;282(18):13419-28. Epub 2007 Mar 13. [PubMed:17355966 ]