Identifizierung neuer Proteinfamilien in metagenomischen Datensätzen
- Ein großer Teil der in öffentlichen Datenbanken verfügbaren Proteinsequenzen stammt aus sogenannten Metagenomen. Metagenome werden typischerweise aus mikrobieller DNA in Umweltproben unter Umgehung der Anzucht individueller Spezies gewonnen. Funktionen können für metagenomische Proteine mit Homologie zu bekannten Proteinen vorausgesagt werden. Viele dieser Proteine haben jedoch keine Homologie zu Proteinen mit bekannter Funktion, was ihre experimentelle Charakterisierung erfordert. In dieser Doktorarbeit wurden mehr als 6 Millionen Proteine aus dem Global Ocean Sampling Metagenom kategorisiert, um eine experimentelle Funktionsaufklärung zu ermöglichen. Die Proteine wurden basierend auf bekannten HMM-Profilen und durch de novo Clusteranalyse in Familien aufgeteilt. Anschließend wurde jeweils ein Vertreter aus jeder Familie definiert. Vertreter von vier lipolytischen Proteinfamilien wurden experimentell charakterisiert, wobei ein Protein die erwartete lipolytische Aktivität zeigte.
- A large part of the protein sequences available in public databases comes from so-called metagenomes. Metagenomas are typically derived from microbial DNA in environmental samples, bypass the culture of individual species. A function can be predicted for metagenomic proteins from homology to known proteins. However, many of these proteins have no homology to proteins with known function. Therefore a possibility of their experimental characterization is requires. In this dissertation, more than 6 million proteins from the Global Ocean Sampling Metagenome have been categorized to provide an experimental characterization of their function. The proteins were divided into families based on known HMM profiles and de novo cluster analysis. Subsequently, one representative from each family was defined. Representatives of four lipolytic protein families were characterized experimentally, with one protein showing the expected lipolytic activity.
Author: | Anna KusnezowaGND |
---|---|
URN: | urn:nbn:de:hbz:294-56749 |
Title Additional (English): | Identification of novel protein families in metagenomic datatests |
Referee: | Lars I. LeichertORCiDGND, Axel MosigORCiDGND |
Document Type: | Doctoral Thesis |
Language: | German |
Date of Publication (online): | 2018/04/23 |
Date of first Publication: | 2018/04/23 |
Publishing Institution: | Ruhr-Universität Bochum, Universitätsbibliothek |
Granting Institution: | Ruhr-Universität Bochum, Fakultät für Biologie und Biotechnologie |
Date of final exam: | 2018/01/11 |
Creating Corporation: | Fakultät für Biologie und Biotechnologie |
GND-Keyword: | Metagenom; Proteinfamilie; Biotechnologie; Lipasen; Bioinformatik |
Institutes/Facilities: | Institut für Biochemie und Pathobiochemie, Abteilung Biochemie der Mikroorganismen |
Dewey Decimal Classification: | Naturwissenschaften und Mathematik / Biowissenschaften, Biologie, Biochemie |
faculties: | Fakultät für Biologie und Biotechnologie |
Licence (German): | Keine Creative Commons Lizenz - es gelten der Veröffentlichungsvertrag und das deutsche Urheberrecht |