Identifizierung neuer Proteinfamilien in metagenomischen Datensätzen

  • Ein großer Teil der in öffentlichen Datenbanken verfügbaren Proteinsequenzen stammt aus sogenannten Metagenomen. Metagenome werden typischerweise aus mikrobieller DNA in Umweltproben unter Umgehung der Anzucht individueller Spezies gewonnen. Funktionen können für metagenomische Proteine mit Homologie zu bekannten Proteinen vorausgesagt werden. Viele dieser Proteine haben jedoch keine Homologie zu Proteinen mit bekannter Funktion, was ihre experimentelle Charakterisierung erfordert. In dieser Doktorarbeit wurden mehr als 6 Millionen Proteine aus dem Global Ocean Sampling Metagenom kategorisiert, um eine experimentelle Funktionsaufklärung zu ermöglichen. Die Proteine wurden basierend auf bekannten HMM-Profilen und durch de novo Clusteranalyse in Familien aufgeteilt. Anschließend wurde jeweils ein Vertreter aus jeder Familie definiert. Vertreter von vier lipolytischen Proteinfamilien wurden experimentell charakterisiert, wobei ein Protein die erwartete lipolytische Aktivität zeigte.
  • A large part of the protein sequences available in public databases comes from so-called metagenomes. Metagenomas are typically derived from microbial DNA in environmental samples, bypass the culture of individual species. A function can be predicted for metagenomic proteins from homology to known proteins. However, many of these proteins have no homology to proteins with known function. Therefore a possibility of their experimental characterization is requires. In this dissertation, more than 6 million proteins from the Global Ocean Sampling Metagenome have been categorized to provide an experimental characterization of their function. The proteins were divided into families based on known HMM profiles and de novo cluster analysis. Subsequently, one representative from each family was defined. Representatives of four lipolytic protein families were characterized experimentally, with one protein showing the expected lipolytic activity.

Download full text files

Export metadata

Additional Services

Share in Twitter Search Google Scholar
Metadaten
Author:Anna KusnezowaGND
URN:urn:nbn:de:hbz:294-56749
Title Additional (English):Identification of novel protein families in metagenomic datatests
Referee:Lars I. LeichertORCiDGND, Axel MosigORCiDGND
Document Type:Doctoral Thesis
Language:German
Date of Publication (online):2018/04/23
Date of first Publication:2018/04/23
Publishing Institution:Ruhr-Universität Bochum, Universitätsbibliothek
Granting Institution:Ruhr-Universität Bochum, Fakultät für Biologie und Biotechnologie
Date of final exam:2018/01/11
Creating Corporation:Fakultät für Biologie und Biotechnologie
GND-Keyword:Metagenom; Proteinfamilie; Biotechnologie; Lipasen; Bioinformatik
Institutes/Facilities:Institut für Biochemie und Pathobiochemie, Abteilung Biochemie der Mikroorganismen
Dewey Decimal Classification:Naturwissenschaften und Mathematik / Biowissenschaften, Biologie, Biochemie
faculties:Fakultät für Biologie und Biotechnologie
Licence (German):License LogoKeine Creative Commons Lizenz - es gelten der Veröffentlichungsvertrag und das deutsche Urheberrecht