SUPERFAMILY ist eine Datenbank mit strukturellen und funktionellen Anmerkungen für alle Proteine und Genome. Die SUPERFAMILY-Erläuterungen basieren auf einer Sammlung von verborgenen Markov-Modellen, welche die strukturellen Proteindomänen, an der SCOP Superfamily ausgerichtet, repräsentieren. Eine Superfamilie fasst Domänen zusammen, die eine evolutionäre Verwandtschaft aufweisen. Die Erläuterungen entstanden durch das Scannen der Proteinsequenzen von über 2414 komplett sequenzierten Genomen gegen das verborgene Markov Modell. Für jedes Protein kann man: a) Sequenzen für die SCOP Klassifikation zusammenstellen; b) die Domänen Organisation, den Sequenzabgleich und Protein-Sequenz-Details anzeigen lassen. Für jedes Genom kann man: a) einen Superfamilien-Abgleich, phylogenetische Bäume, Domänen-Organisations-Listen und Networks prüfen; b) über- und unterrepräsentierte Superfamilien mit Hilfe des Genomes prüfen Für jede Superfamilie kann man: a) eine SCOP Klassifikation, funktionelle Erläuterungen, Gen-Ontologie-Erläuterungen, InterPro Auszüge und Genome Zuordnungen durchsehen; b)die Taxonomische Verteilung einer Superfamilie über einen Stammbaum erkunden Alle Erläuterungen, Modelle und die Datenbank sind für jeden frei zum Download verfügbar. SUPERFAMILY ist ein Mitglied der InterPro Vereinigung von Protein erläuternden Datenbanken und wurde in das „Ensamble eukaryotic genome project“ und „The Arabidopsis Information Resource“ aufgenommen. Bis heute sind die SUPERFAMILY-Veröffentlichungen über 1000 Mal zitiert worden. SUPERFAMILY wurde in strukturellen, funktionellen, evolutionellen und phylogenetischen Forschungsprojekten genutzt. ... [Information des Anbieters, übersetzt]
UCNEbase bietet Informationen über die Entwicklung und genomische Organisation von ultra-konservierten nicht-kodierenden Elementen (UCNEs) in mehreren Wirbeltierarten. Es umfasst derzeit 4.351 solcher Elemente aus 18 verschiedenen Arten. Rund die Hälfte dieser Elemente liegen in intergenetischen Regionen (2.139) und der Rest innerhalb von nicht-codierenden Teile von Genen: Introns (1.713) und UTRs (499). Die Mehrheit der UCNEs scheinen transkriptionelle Regulatoren der Schlüsselentwicklungsgene zu sein. ... [Information des Anbieters, übersetzt]
YetFaSCo steht für Yeast Transcription Factor Specificity Compendum. Es ist eine Sammlung von allen verfügbaren TF-Spezifitäten für die Hefe Saccharomyces cerevisiae in Position Frequency Matrix (PFM)- oder Position Weight Matrix (PWM)-Formaten. Mit diesem kann man Sequenzen mit der Absicht, die Lage potenzieller Bindungsstellen herauszufinden, scannen, vorher errechnete genomweite Bindungsstellen näher betrachten, herausfinden, welche TFs ein ähnliches Motiv aufweisen wie das bereits gefundene, und eine Sammlung von Motiven herunterladen. ... [Information des Anbieters, übersetzt]