Groher, Ann-Christin (2021)
Optimierung und Analyse von synthetischen Tetrazyklin-Tandem-Riboswitchen durch machine learning.
Technische Universität Darmstadt
doi: 10.26083/tuprints-00017891
Dissertation, Erstveröffentlichung, Verlagsversion
Kurzbeschreibung (Abstract)
Die RNA erfüllt in der Zelle eine Vielzahl an verschiedenen Aufgaben, die zum Teil eng mit der Genregulation verknüpft sind. Bekannte Beispiele sind unter anderem Riboswitche, die sowohl natürlich vorkommen als auch synthetisch hergestellt werden können. Riboswitche können im 5´untranslatierten Bereich (UTR) von Genen die Translation beeinflussen und so als effektive Werkzeuge zur Kontrolle der Genexpression wirken. Jedoch ist die Effizienz synthetisch hergestellter Riboswitche zur Genregulation meist begrenzt und bedarf eines langen Optimierungsprozesses. Eine Perspektive bieten automatisierte Verfahren, welche auch in der Synthetischen Biologie einen immer höheren Stellenwert bekommen. Diese Arbeit beschäftigt sich mit der Entwicklung eines machine learning-Programms zur Optimierung synthetischer Riboswitche, welche in den Zellen der Bäckerhefe ihre Anwendung finden, sowie der Analyse der generierten Daten im Hinblick auf ihre biophysikalischen Parameter und Sequenzmotive. Das Tetrazyklin (TC)-Dimer LG3, welches aus zwei TC-Aptameren besteht, die sich nur in ihrem Endstamm P1 unterscheiden, diente hier als Vorlage des Optimierungsprozesses. Durch die Veränderung der Sequenz des P1-Stammes, lässt sich die Basalexpression und der Schaltfaktor dieses Riboswitches beeinflussen. Das machine learning-Programm wurde mit Daten trainiert, die sich aus der Sequenz berechnen lassen: Länge des P1-Stamms, dessen GC-Gehalt, die minimale freie Energie (MFE oder ΔG), die Entropie (Shannon) von P1 sowie der Wasserstoffbrückenbindung der beteiligte Basenpaare (H-Bindung), die Schmelztemperatur von P1 (Tm P1) sowie die Schmelztemperatur des kompletten Aptamers (Tm). Es wurden insgesamt drei machine learning-Runden durchgeführt, wobei in der 3. Runde erstmals eine signifikante Verbesserung des mittleren Schaltfaktors der Riboswitche beobachtet werden konnte. Nach der 3. Runde wurde das Programm um ein deep learning-Programm erweitert und so zusätzlich ein Trainieren auf Sequenzdaten des Stammes ermöglicht. Mit der Kombination der beiden Programme wurde ein außergewöhnlich guter Riboswitch gefunden (R4-G8), der einen Schaltfaktor von 40-fach und die Stammsequenz 5´AGGTGACC3´ aufweist. Nachfolgende Analysen der Daten ergaben, dass ein bestimmter Bereich biophysikalischer Parameter und bestimmte Sequenzmotive innerhalb des P1-Stamms das Vorkommen gut schaltender Riboswitche begünstigt und sich R4-G8 mit seinen biophysikalischen Parametern und seiner Sequenz sehr wahrscheinlich an seinem individuellen Optimum befindet, da jede weitere Veränderung der Sequenz zu einer Verschlechterung des Schaltfaktors führte. Im letzten Abschnitt dieser Arbeit wurden drei verschiedene TC-Aptamere mit P1-Stämmen aus den vorrangegangenen machine learning-Runden mit einem Tobramycin-Aptamer zu einem funktionalen NOR-Gate fusioniert. Dabei wurde ein TC-Tobramycin-Hybrid erzeugt, bei welchem das Tobramycin-Aptamer auf den P2-Stamm des TC-Aptamers gesetzt wurde. Beide Aptamere können sowohl unabhängig voneinander als auch gemeinsam ihren Liganden binden und die Translation inhibieren.
Typ des Eintrags: | Dissertation | ||||
---|---|---|---|---|---|
Erschienen: | 2021 | ||||
Autor(en): | Groher, Ann-Christin | ||||
Art des Eintrags: | Erstveröffentlichung | ||||
Titel: | Optimierung und Analyse von synthetischen Tetrazyklin-Tandem-Riboswitchen durch machine learning | ||||
Sprache: | Deutsch | ||||
Referenten: | Süß, Prof. Dr. Beatrix ; Kabisch, Prof. Dr. Johannes | ||||
Publikationsjahr: | 2021 | ||||
Ort: | Darmstadt | ||||
Kollation: | IV, 142 Seiten | ||||
Datum der mündlichen Prüfung: | 31 März 2021 | ||||
DOI: | 10.26083/tuprints-00017891 | ||||
URL / URN: | https://tuprints.ulb.tu-darmstadt.de/17891 | ||||
Kurzbeschreibung (Abstract): | Die RNA erfüllt in der Zelle eine Vielzahl an verschiedenen Aufgaben, die zum Teil eng mit der Genregulation verknüpft sind. Bekannte Beispiele sind unter anderem Riboswitche, die sowohl natürlich vorkommen als auch synthetisch hergestellt werden können. Riboswitche können im 5´untranslatierten Bereich (UTR) von Genen die Translation beeinflussen und so als effektive Werkzeuge zur Kontrolle der Genexpression wirken. Jedoch ist die Effizienz synthetisch hergestellter Riboswitche zur Genregulation meist begrenzt und bedarf eines langen Optimierungsprozesses. Eine Perspektive bieten automatisierte Verfahren, welche auch in der Synthetischen Biologie einen immer höheren Stellenwert bekommen. Diese Arbeit beschäftigt sich mit der Entwicklung eines machine learning-Programms zur Optimierung synthetischer Riboswitche, welche in den Zellen der Bäckerhefe ihre Anwendung finden, sowie der Analyse der generierten Daten im Hinblick auf ihre biophysikalischen Parameter und Sequenzmotive. Das Tetrazyklin (TC)-Dimer LG3, welches aus zwei TC-Aptameren besteht, die sich nur in ihrem Endstamm P1 unterscheiden, diente hier als Vorlage des Optimierungsprozesses. Durch die Veränderung der Sequenz des P1-Stammes, lässt sich die Basalexpression und der Schaltfaktor dieses Riboswitches beeinflussen. Das machine learning-Programm wurde mit Daten trainiert, die sich aus der Sequenz berechnen lassen: Länge des P1-Stamms, dessen GC-Gehalt, die minimale freie Energie (MFE oder ΔG), die Entropie (Shannon) von P1 sowie der Wasserstoffbrückenbindung der beteiligte Basenpaare (H-Bindung), die Schmelztemperatur von P1 (Tm P1) sowie die Schmelztemperatur des kompletten Aptamers (Tm). Es wurden insgesamt drei machine learning-Runden durchgeführt, wobei in der 3. Runde erstmals eine signifikante Verbesserung des mittleren Schaltfaktors der Riboswitche beobachtet werden konnte. Nach der 3. Runde wurde das Programm um ein deep learning-Programm erweitert und so zusätzlich ein Trainieren auf Sequenzdaten des Stammes ermöglicht. Mit der Kombination der beiden Programme wurde ein außergewöhnlich guter Riboswitch gefunden (R4-G8), der einen Schaltfaktor von 40-fach und die Stammsequenz 5´AGGTGACC3´ aufweist. Nachfolgende Analysen der Daten ergaben, dass ein bestimmter Bereich biophysikalischer Parameter und bestimmte Sequenzmotive innerhalb des P1-Stamms das Vorkommen gut schaltender Riboswitche begünstigt und sich R4-G8 mit seinen biophysikalischen Parametern und seiner Sequenz sehr wahrscheinlich an seinem individuellen Optimum befindet, da jede weitere Veränderung der Sequenz zu einer Verschlechterung des Schaltfaktors führte. Im letzten Abschnitt dieser Arbeit wurden drei verschiedene TC-Aptamere mit P1-Stämmen aus den vorrangegangenen machine learning-Runden mit einem Tobramycin-Aptamer zu einem funktionalen NOR-Gate fusioniert. Dabei wurde ein TC-Tobramycin-Hybrid erzeugt, bei welchem das Tobramycin-Aptamer auf den P2-Stamm des TC-Aptamers gesetzt wurde. Beide Aptamere können sowohl unabhängig voneinander als auch gemeinsam ihren Liganden binden und die Translation inhibieren. |
||||
Alternatives oder übersetztes Abstract: |
|
||||
Status: | Verlagsversion | ||||
URN: | urn:nbn:de:tuda-tuprints-178913 | ||||
Sachgruppe der Dewey Dezimalklassifikatin (DDC): | 500 Naturwissenschaften und Mathematik > 570 Biowissenschaften, Biologie | ||||
Fachbereich(e)/-gebiet(e): | 10 Fachbereich Biologie 10 Fachbereich Biologie > Synthetic RNA biology LOEWE LOEWE > LOEWE-Schwerpunkte LOEWE > LOEWE-Schwerpunkte > CompuGene – Computer-gestützte Verfahren zur Generierung komplexer genetischer Schaltkreise |
||||
Hinterlegungsdatum: | 04 Mai 2021 09:06 | ||||
Letzte Änderung: | 25 Jul 2023 08:33 | ||||
PPN: | |||||
Referenten: | Süß, Prof. Dr. Beatrix ; Kabisch, Prof. Dr. Johannes | ||||
Datum der mündlichen Prüfung / Verteidigung / mdl. Prüfung: | 31 März 2021 | ||||
Export: | |||||
Suche nach Titel in: | TUfind oder in Google |
Frage zum Eintrag |
Optionen (nur für Redakteure)
Redaktionelle Details anzeigen |