Die Website "ProGlycProt" (Prokaryotische Glykoproteine) ist ein manuell gepflegter, umfassender Speicherort für experimentell charakterisierte bakterielle und archaeelle Glykoproteine, welcher mittels einer gründlichen Literatursuche generiert wird. Dies ist der Anfang der Bemühungen prägnante, relevante Informationen in einer vergleichenden Methode zu liefern, welche sich von der rasch anwachsenden Literatur über prokaryotische Glykoproteine, ihre glykosylierenden Enzyme, an Glykosylation gekoppelte Gene und deren genomischen Kontext ableiten lassen. ProGlycProt ist eine umfangreiche Online-Sammlung experimentell verifizierter Glykosites und Glykoproteinen von Prokaryoten. Zum Vorteil der Nutzer ist die Datenbank unter dem Menüpunkt ProGlycProtdb in zwei Sektionen unterteilt, ProCGP und ProUGP. ProCGP ist der Hauptabschnitt, welcher aus charakterisierten prokaryotischen Glykoproteinen besteht, definiert als Eintragungen mit mindestens einem experimentell bestätigten "glykosylierten Rest". ProUGP dahingegen ist die ergänzende Sektion, welche uncharakterisierte prokaryotische Glykoproteine präsentiert, definiert als Eintragungen mit experimentell identifizierter Glykosylation aber undefinierten Glykosites. ProGlycProt wurde mit dem Ziel entwickelt als Hilfsmittel zu fungieren aber auch das aufkommende wissenschaftliche Interesse am Verständnis von Mechanismen, Auswirkungen und Neuheiten der Protein-Glykosylation in Prokaryoten zu steigern, was viele krankheitserregende und auch ökonomisch wichtige bakterielle Arten einschließt. ... [Information des Anbieters, übersetzt]
Die Virus-Datenbank des University College London wurde als ein System für die Organisation von Open-reading-frame-Sequenzen der Tier-Viren entwickelt. Alle bekannten und vorhergesagten Proteinsequenzen von Genomen bestimmter Virusfamilien wurden aus GenBank extrahiert und gefiltert um 100% Redundanz zu entfernen. Auf der Basis von Sequenz-Ähnlichkeiten wurden die Sequenzen in Homologe Protein-Familien (HPFs) eingeteilt. Die Familien wurden mit Bemerkungen, einschließlich der Funktion und funktionalen Klassifizierung, ähnlicher Proteinstrukturen, Taxonomie, Länge der Proteine, Grenzen von konservierten Regionen, virusspezifischen Gennamen und Links zu EMBL-Einträgen und SWISSPROT angereichert. Es ist zudem möglich die prä-aligned konservierten Sequenzregionen oder komplette Proteinsequenzen als FASTA-Format-Dateien darstellen zu lassen. Suchen können unter Benutzung von Familiennummer, Virusname, Proteinfunktion, GenBank-Identifikationsnumer oder beliebigem Keyword durchgeführt werden. ... [Information des Anbieters, übersetzt]