An important prerequisite for the biological function of a protein is the thermodynamic stability of its three-dimensional structure, the so-called native state. By adjusting the amino acid sequence the stability can be optimized by two different strategies. While positive design increases the stability with respect to unfolding by decreasing the free energy of the native state, negative design increases the free energy of misfolded structures in order to optimize the stability against misfolding. One stability can be optimized only at the expense of the other, thus optimal stability demands a trade-off between the two strategies. In the first part of this work, negative design in naturally occurring proteins was investigated using a simple energy model based on contact interactions of amino acids. The calculation of the free energy of the misfolded ensemble is difficult due to the large number of misfolded structures. A widely used model to describe the free energy of the misfolded ensemble is the Random Energy Model (REM), which assumes contacts to be uncorrelated and to occur with equal frequency. This is, however, an inaccurate description, as the probability of contact decreases with increasing distance in the sequence and the formation of a contact in a misfolded structure is correlated with other contacts. The first part of the thesis investigates how contact frequency and contact correlation affect negative design. Here, the free energy of the misfolded ensemble is approximated by a cumulant expansion, where contact frequency and contact correlation are explicitly included. In addition, it is investigated how the description of optimal hydrophobicity profiles, which have maximal stability in the native state, can be enhanced by the inclusion of contact correlations. The detailed description of the misfolded ensemble can help to improve the design of sequences or allows a more accurate modeling of protein evolution. Since protein sequences change during evolution, correlated substitutions of amino acids at different sites in the protein --- in the literature often referred to as correlated mutations --- give insight into the native structure and function of a protein. However, there was no theoretical description to quantify the effects of the physical constraints of structure and folding stability on correlated mutations in protein sequences. In the second part, a model is studied which quantitatively predicts the correlated mutations from constraints on the folding stability. The model is based on maximizing the sequence entropy, which is approximated by a cluster expansion up to second order. The model is tested using data from computer simulations and a statistical analysis of proteins from the Protein Data Bank. In particular, the determination of the model parameters allows an interpretation of the correlations in terms of both design strategies that characterize sequence evolution. The model can help to distinguish native from non-native contacts based on correlated mutations, thus improving the prediction of contacts and hence the prediction of protein structures. In addition, the model could be helpful to distinguish between correlated mutations that result from the folding stability or other selective pressures.
Typ des Eintrags: |
Dissertation
|
Erschienen: |
2012 |
Autor(en): |
Minning, Jonas |
Art des Eintrags: |
Erstveröffentlichung |
Titel: |
Correlations in thermodynamics and evolution of proteins |
Sprache: |
Englisch |
Referenten: |
Porto, Dr. Markus ; Drossel, Prof. Dr. Barbara |
Publikationsjahr: |
5 Juni 2012 |
Datum der mündlichen Prüfung: |
4 Juni 2012 |
URL / URN: |
urn:nbn:de:tuda-tuprints-29966 |
Kurzbeschreibung (Abstract): |
An important prerequisite for the biological function of a protein is the thermodynamic stability of its three-dimensional structure, the so-called native state. By adjusting the amino acid sequence the stability can be optimized by two different strategies. While positive design increases the stability with respect to unfolding by decreasing the free energy of the native state, negative design increases the free energy of misfolded structures in order to optimize the stability against misfolding. One stability can be optimized only at the expense of the other, thus optimal stability demands a trade-off between the two strategies. In the first part of this work, negative design in naturally occurring proteins was investigated using a simple energy model based on contact interactions of amino acids. The calculation of the free energy of the misfolded ensemble is difficult due to the large number of misfolded structures. A widely used model to describe the free energy of the misfolded ensemble is the Random Energy Model (REM), which assumes contacts to be uncorrelated and to occur with equal frequency. This is, however, an inaccurate description, as the probability of contact decreases with increasing distance in the sequence and the formation of a contact in a misfolded structure is correlated with other contacts. The first part of the thesis investigates how contact frequency and contact correlation affect negative design. Here, the free energy of the misfolded ensemble is approximated by a cumulant expansion, where contact frequency and contact correlation are explicitly included. In addition, it is investigated how the description of optimal hydrophobicity profiles, which have maximal stability in the native state, can be enhanced by the inclusion of contact correlations. The detailed description of the misfolded ensemble can help to improve the design of sequences or allows a more accurate modeling of protein evolution. Since protein sequences change during evolution, correlated substitutions of amino acids at different sites in the protein --- in the literature often referred to as correlated mutations --- give insight into the native structure and function of a protein. However, there was no theoretical description to quantify the effects of the physical constraints of structure and folding stability on correlated mutations in protein sequences. In the second part, a model is studied which quantitatively predicts the correlated mutations from constraints on the folding stability. The model is based on maximizing the sequence entropy, which is approximated by a cluster expansion up to second order. The model is tested using data from computer simulations and a statistical analysis of proteins from the Protein Data Bank. In particular, the determination of the model parameters allows an interpretation of the correlations in terms of both design strategies that characterize sequence evolution. The model can help to distinguish native from non-native contacts based on correlated mutations, thus improving the prediction of contacts and hence the prediction of protein structures. In addition, the model could be helpful to distinguish between correlated mutations that result from the folding stability or other selective pressures. |
Alternatives oder übersetztes Abstract: |
Alternatives Abstract | Sprache |
---|
Eine wichtige Voraussetzung für die biologische Funktion eines Proteins ist die thermodynamische Stabilität dessen dreidimensionaler Struktur, der sogenannte native Zustand. Durch Anpassung der Aminosäurensequenz lässt sich die Stabilität durch zwei verschiedene Prinzipien optimieren. Während positives Design die Stabilität gegen Entfaltung erhöht, indem es die freie Energie des nativen Zustandes erniedrigt, versucht negatives Design die freie Energie missgefalteter Strukturen zu erhöhen, um so die Stabilität gegen Missfaltung zu optimieren. Eine Stabilität kann nur auf Kosten der anderen optimiert werden, so dass ein Kompromiss zwischen beiden Prinzipien gefunden werden muss. Im ersten Teil der Arbeit wurde anhand eines einfaches Energiemodells, das auf Kontaktwechselwirkungen von Aminosäuren beruht, negatives Design in natürlich vorkommenden Proteinen untersucht. Die Beschreibung der freie Energie des missgefalteten Ensembles ist auf Grund der großen Anzahl von missgefalteten Strukturen schwierig. Ein weit verbreitetes Modell zur Berechnung der freien Energie des missgefalteten Ensembles ist das Random Energy Model (REM), das die möglichen Kontakte zwischen Residuen als unkorreliert und mit gleicher Häufigkeit vorkommend annimmt. Dies ist jedoch nur eine ungenaue Beschreibung, vielmehr vermindert sich die Kontaktwahrscheinlichkeit mit wachsenden Abstand in der Sequenz und das Formen eines Kontakts in einer missgefalteten Struktur ist mit anderen Kontakten korreliert. Im ersten Teil der Arbeit wird untersucht, wie Kontakthäufigkeit und Kontaktkorrelationen negatives Design beeinflussen. Dabei wurde die freie Energie des missgefalteten Ensembles in einer Kumulantenentwicklung approximiert, in die explizit Kontakthäufigkeiten und Kontaktkorrelationen einbezogen werden. Zudem wird untersucht, inwiefern sich die Beschreibung optimaler Hydrophobitätsprofile, die maximale Stabilität der nativen Struktur erreichen, durch die Einbeziehung von Kontaktkorrelationen verbessern lässt. Die genauere Beschreibung des missgefalteten Ensembles kann zu einer Verbesserung von Design von Sequenzen oder einer genaueren Modellierung von Proteinevolution beitragen. Da Proteinsequenzen sich in Laufe der Evolution verändern, liefern korrelierte Substitution von Aminosäuren an verschiedenen Plätzen im Protein -- in der Literatur oft mit korrelierten Mutationen bezeichnet -- Einsicht in die native Struktur und Funktionen eines Proteins. Jedoch gab es keine bislang noch keine theoretische Beschreibung, die die Auswirkungen der physikalischen Beschränkungen durch Struktur und Faltungsstabilität auf Korrelationen in Proteinsequenzen quantifizieren. In zweiten Teil der Arbeit wird ein Modell untersucht, das korrelierte Mutationen aus Bedingungen an die Faltungsstabilität quantitativ vorhersagt. Die Grundlage des Modells ist die Maximierung der Sequenzentropie, die durch eine Cluster-Enwicklung bis zur zweiten Ordnung approximiert wird. Das Modell wird anhand von Daten aus Computersimulationen und einer statistischen Analyse von Proteinen aus der Protein Data Bank getestet. Insbesondere erlaubt die Bestimmung der Modellparameter eine Interpretation der Korrelationen in Bezug auf die beiden Designstrategien, die die Sequenzevolution prägen. Das Modell kann Hinweise darauf liefern, wie man native von nicht-nativen Kontakten unterscheidet, und so zur Verbesserung der Vorhersage von Kontakten und damit von Proteinstrukturen beitragen. Zudem könnte das Modell dabei behilflich sein, zwischen korrelierten Mutationen zu unterscheiden, die aus der Faltungsstabilität oder von anderen Selektionsdrücken herrühren. | Deutsch |
|
Freie Schlagworte: |
protein folding, stability against misfolding, negative design, misfolded free energy, cumulant expansion, contact frequency, contact correlations, correlated mutations, maximum entropy, cluster expansion of entropy, protein sequence evolution, structurally constraint evolution |
Schlagworte: |
Einzelne Schlagworte | Sprache |
---|
protein folding, stability against misfolding, negative design, misfolded free energy, cumulant expansion, contact frequency, contact correlations, correlated mutations, maximum entropy, cluster expansion of entropy, protein sequence evolution, structurally constraint evolution | Englisch | Proteinfaltung, Stabilität gegen Missfaltung, negatives Design, missgefaltete freie Energie, Kumulantenentwicklung, Kontakthäufigkeit, Kontaktkorrelationen, korrelierte Mutationen, maximale Entropie, Klusterentwicklung der Entropie, Proteinsequenzevolution, strukturell beschränkte Evolution | Deutsch |
|
Sachgruppe der Dewey Dezimalklassifikatin (DDC): |
500 Naturwissenschaften und Mathematik > 530 Physik |
Fachbereich(e)/-gebiet(e): |
05 Fachbereich Physik > Institut für Festkörperphysik (2021 umbenannt in Institut für Physik Kondensierter Materie (IPKM)) > Biophysik 05 Fachbereich Physik > Institut für Festkörperphysik (2021 umbenannt in Institut für Physik Kondensierter Materie (IPKM)) 05 Fachbereich Physik |
Hinterlegungsdatum: |
11 Jun 2012 15:24 |
Letzte Änderung: |
05 Mär 2013 10:01 |
PPN: |
|
Referenten: |
Porto, Dr. Markus ; Drossel, Prof. Dr. Barbara |
Datum der mündlichen Prüfung / Verteidigung / mdl. Prüfung: |
4 Juni 2012 |
Schlagworte: |
Einzelne Schlagworte | Sprache |
---|
protein folding, stability against misfolding, negative design, misfolded free energy, cumulant expansion, contact frequency, contact correlations, correlated mutations, maximum entropy, cluster expansion of entropy, protein sequence evolution, structurally constraint evolution | Englisch | Proteinfaltung, Stabilität gegen Missfaltung, negatives Design, missgefaltete freie Energie, Kumulantenentwicklung, Kontakthäufigkeit, Kontaktkorrelationen, korrelierte Mutationen, maximale Entropie, Klusterentwicklung der Entropie, Proteinsequenzevolution, strukturell beschränkte Evolution | Deutsch |
|
Export: |
|
Suche nach Titel in: |
TUfind oder in Google |
|
Redaktionelle Details anzeigen |