SUPERFAMILY ist eine Datenbank mit strukturellen und funktionellen Anmerkungen für alle Proteine und Genome. Die SUPERFAMILY-Erläuterungen basieren auf einer Sammlung von verborgenen Markov-Modellen, welche die strukturellen Proteindomänen, an der SCOP Superfamily ausgerichtet, repräsentieren. Eine Superfamilie fasst Domänen zusammen, die eine evolutionäre Verwandtschaft aufweisen. Die Erläuterungen entstanden durch das Scannen der Proteinsequenzen von über 2414 komplett sequenzierten Genomen gegen das verborgene Markov Modell. Für jedes Protein kann man: a) Sequenzen für die SCOP Klassifikation zusammenstellen; b) die Domänen Organisation, den Sequenzabgleich und Protein-Sequenz-Details anzeigen lassen. Für jedes Genom kann man: a) einen Superfamilien-Abgleich, phylogenetische Bäume, Domänen-Organisations-Listen und Networks prüfen; b) über- und unterrepräsentierte Superfamilien mit Hilfe des Genomes prüfen Für jede Superfamilie kann man: a) eine SCOP Klassifikation, funktionelle Erläuterungen, Gen-Ontologie-Erläuterungen, InterPro Auszüge und Genome Zuordnungen durchsehen; b)die Taxonomische Verteilung einer Superfamilie über einen Stammbaum erkunden Alle Erläuterungen, Modelle und die Datenbank sind für jeden frei zum Download verfügbar. SUPERFAMILY ist ein Mitglied der InterPro Vereinigung von Protein erläuternden Datenbanken und wurde in das „Ensamble eukaryotic genome project“ und „The Arabidopsis Information Resource“ aufgenommen. Bis heute sind die SUPERFAMILY-Veröffentlichungen über 1000 Mal zitiert worden. SUPERFAMILY wurde in strukturellen, funktionellen, evolutionellen und phylogenetischen Forschungsprojekten genutzt. ... [Information des Anbieters, übersetzt]
TCDB ist eine betreute Datenbank mit Fakten aus mehr als 10.000 veröffentlichten Referenzen. Die Datenbank enthält über 3.000 Protein-Sequenzen; sie wendet ein umfassendes, durch IUBMB akkreditiertes Klassifikationssystem für Membranproteine an, bekannt als "Transporter Classification (TC) system". Das TC-System ist analog dem System der Enzyme Commission (EC) für die Klassifikation von Enzymen, aber es berücksichtigt zusätzlich phylogenetische Informationen. TCDB wird durch die Saier Lab Bioinformatics Group betrieben. ... [Information des Anbieters, übersetzt]
TIGRFAMs ist eine Datensammlung zu Protein-Familien mit Daten zu Hidden Markov Models (HMMs), zu Multiple Sequence Alignments, sowie mit Kommentaren und Querbezügen zu Literaturquellen und thematisch verwandten Datenbanken und Modellen. [Information des Anbieters, übersetzt und verändert]
TopFIND (Termini oriented protein Function Inferred Database) ist eine integrierte wissensbasierte Datenbank, die auf Proteintermini, deren Formation durch Proteasen und die dadurch entstehende funktionellen Auswirkungen fokussiert ist. Sie enthält Informationen über Prozessierung und den Prozessierungsstatus eines Proteins, deren funktionelle Auswirkungen und die hiervon abgeleiteten Forschungsdaten, Beiträge von wissenschaftlichen Gesellschaften und biologischen Datenbanken. ... [Information des Anbieters, übersetzt]
SWISS-2DPAGE is an annotated two-dimensional polyacrylamide gel electrophoresis (2-D PAGE) and SDS-PAGE database established in 1993 and maintained collaboratively by the Biomedical Proteomics Reasearch Group (BPRG) of the Geneva University and the Proteome Informatics Group of the Swiss Institute of Bioinformatics (SIB). The SWISS-2DPAGE database assembles data on proteins identified on various 2-D PAGE and SDS-PAGE maps. Each SWISS-2DPAGE entry contains textual data on one protein, including mapping procedures, physiological and pathological information, experimental data (isoelectric point, molecular weight, amino acid composition, peptide masses) and bibliographical references. In addition to this textual data, SWISS-2DPAGE provides several 2-D PAGE and SDS-PAGE images showing the experimentally determined location of the protein, as well as a theoretical region computed from the sequence protein, indicating where the protein might be found in the gel. Cross-references are provided to Medline and other federated databases. ... [Information of the supplier]
Die UniPROBE-Datenbank (Universal PBM Resource for Oligonucleotide Binding Evaluation) beherbergt Daten, die durch universelle Proteinbindungs-Microarray(PBM)-Technologie zu den in-vitro DANN-Bindungsspezifitäten von Proteinen generiert wurden. Diese erstmalige Herausgabe der UniPROBE-Datenbank bietet eine zentrale Ressource für die Zugänglichkeit von vergleichenden Daten zu den Präferenzen von Proteinen aller möglicher Sequenzvariationen (‚Worte“) von Länge k („k-mere“), wie auch „Position weight matrix“ (PWM) und graphische Sequenz-Logo-Repräsentationen der k-mer-Daten. Alles in allem enthält die Datenbank aktuell DNA-Bindungsdaten von 406 nicht-redundanten Proteinen aus einer diversen Sammlung von Organismen, einschließlich dem Prokaryoten Vibrio harveyi, dem eukaryotischen Malaria-Parasiten Plasmodium falciparum, dem parasitischen Apicomplexan Cryptosporidium parvum, der Hefe Saccharomyces cerevisiae, dem Wurm Caenorhabditis elegans, Maus und Mensch. Die Datenbank-Web-Tools (auf der rechten Seite) schließen eine text-basierende Suche, eine Funktion für den Zugang zu Motif-Ähnlichkeiten zwischen durch den Nutzer eingetragenen Daten und Datenbank-PWMs, und eine Funktion für die Lokalisierung von mutmaßlichen Bindungsstellen in den vom Nutzer eingegebenen Nukleotidsequenzen. ... [Information des Anbieters, übersetzt]
Die Virus-Datenbank des University College London wurde als ein System für die Organisation von Open-reading-frame-Sequenzen der Tier-Viren entwickelt. Alle bekannten und vorhergesagten Proteinsequenzen von Genomen bestimmter Virusfamilien wurden aus GenBank extrahiert und gefiltert um 100% Redundanz zu entfernen. Auf der Basis von Sequenz-Ähnlichkeiten wurden die Sequenzen in Homologe Protein-Familien (HPFs) eingeteilt. Die Familien wurden mit Bemerkungen, einschließlich der Funktion und funktionalen Klassifizierung, ähnlicher Proteinstrukturen, Taxonomie, Länge der Proteine, Grenzen von konservierten Regionen, virusspezifischen Gennamen und Links zu EMBL-Einträgen und SWISSPROT angereichert. Es ist zudem möglich die prä-aligned konservierten Sequenzregionen oder komplette Proteinsequenzen als FASTA-Format-Dateien darstellen zu lassen. Suchen können unter Benutzung von Familiennummer, Virusname, Proteinfunktion, GenBank-Identifikationsnumer oder beliebigem Keyword durchgeführt werden. ... [Information des Anbieters, übersetzt]