This is an old revision of the document!
Table of Contents
Rendo
~~META: status = in progress &relation firstimage = :project:rendo:img_6194.jpg ~~
Vědecká hypotéza a cíle práce
Vědecká hypotéza
Restrikční analýza (RFLP) patří k nejstarším metodám využívaným k odlišení různých alel, SNV či indelů. Pomocí softwaru, který by analyzoval nejenom několik různých sekvencí, ale také další variabilitu z referenčních verzí genomů a spolehlivých relevatních sekvenačních dat z GenBank by bylo možné automatizovaně navrhovat vhodné restrikční endonukleázy k analýze konkrétních alel, SNV a indelů.
Cíle práce
- Naprogramovat software umožňující navrhnutí vhodných restrikčních endonukleáz k analýze uživatelem zadaného úseku dle referenční verze genomu a dalších dostupných sekvencí k doplnění variability v zadaném úseku.
- Vybrat vhodné testovací úseky genomu modelových organismů (Arabidopsis thaliana).
- Ověřit funkčnost navrhnutých enzymů softwarem pro konkrétní analýzu variability.
Metodika
Tvorba softwaru
Aplikace pro návrh vhodných restrikčních endonukleáz byla programována pomocí programovacího jazyku Python a VS Code IDE, poskytujícího mnoho vhodných knihoven pro zajištění fukčnosti a možnosti stahování dat z online databází. Aplikace byla strukturována na 3 dílčí aplikace umožňující základní a pokročilou analýzu. Aplikace také obsahuje 259 restikčních endonukleáz, které jsou využívány ke všem analýzám. Tento počet byl určen na základě průzkumu komerčně nabízených enzymů firmami specializujími se na jejich výrobu jako Thermo Fisher Scientific a New England Biosciences. Mnoho restrikčních endonukleáz je prodáváno pod více komerčními názvy, proto bylo zajištěno, aby pro jednu rozpoznávací sekvenci a pozici řezu byla k dispozici pouze jedna restrikční endonukleáza pod nejznámějším názvem.
Výběr testovacích genů a návrh primerů
Dle referenční verze genomu Arabidopsis thaliana TAIR10 byly identifikovány vysoce konzervované oblasti genomu. Jako testovací geny byly vybrány geny ovlivňující dobu kvetení (FLC, FRI) a také geny z rodiny cytokinin dehydrogenáz/oxidáz (CKX1 - CKX7).
Primery byly navrhnuty pomocí softwaru BLAST a dále byly analyzovány softwarem Primer3. Primery byly dále vybrány i s ohledem na podobné anelační teploty během PCR ke zmešení počtu prováděných PCR reakcí, všechny až na jednu vyjímku mají optimální anelační teplotu v rozmezí 50 - 53°C.
Materiál
Jednotlivé rostliny Arabidopsis thaliana byly získány na polních lokalitách v Karlových Varech, Praze, Kladně a Křivoklátě v roce 2025. Z každé lokality bylo získáno 5 rostlin ze dvou míst v rámci okresu.
Izolace DNA
Genomická DNA byla izolována za pomoci izolačního kitu Plant Genomic DNA Fast Kit (Mebep Biosicence, China) dle protokolu přiloženého ke kitu za využití mírných modifikací doporučených výrobcem:
- Do zkumavky typu Eppendorf 1,5 ml bylo umístěno 100 mg rozmělněné tkáně.
- Do zkumavky bylo přidáno 400 μl AP1 Bufferu a 4 μl RNase A a následně byl obsah vortexován.
- Zkumavka byla umístěna do inkubátoru na 10 minut při teplotě 65°C a během inkubace byl obsah 3 krát promíchán.
- Po inkubaci bylo do zkumavky přidáno 130 μl AP2 Bufferu, obsah zkumavky byl promíchán, poté byla zkumavky na 5 minut nechána na ledu a poté byla zkumavka centrifugována 5 minut při 13 000 rpm.
- Supernatant ze zkumavky byl přenesen do nové zkumavky typu Eppendorf 1,5 ml. Supernatant byl opět centrifugován 5 minut při 13 000 rpm a přenesen opět do nové zkumavky pro zajištění vyšší čistoty DNA.
- Do zkumavky byl přidán isopropanol pokojové teploty v objemu 70% získaného supernatantu, zkumavka byla 30 krát obracením promíchána.
- Zkumavka byla centrifugována 2 minuty při 12 000 rpm a následně byl odstraněn supernatant.
- Do zkumavky byl přidán 1 ml 70% ethanolu a zkumavka byla několikrát promíchána a následně centrifugována 1 minutu při 12 000 rpm. Supernatant byl odstraněn a DNA byla nechána odvětrat.
- Do zkumavky s DNA izolátem byl přidán Buffer DD a DNA byla uložena do -20°C pro dlouhodobé skladování.
Testování amplifikace vybraných úseků
Pro vybrané primery pro amplifikaci vybraných úseků k restrikční analýze bylo třeba ověřit amplifikační schopnost těchto primerů. Proto vždy jeden vzorek z jedné lokality byl testován všemi primery. Ty které amplifikovali byly dále testovány u všech jedinců ze všech lokalit. Produkty PCR reakcí byly ověřovány na gelu pomocí agarózové elektroforézy, ověření amplifikace správného úseku bylo provedeno porovnáním produktů PCR s 100bp DNA Ladderem (GDSBio, China).
PCR
První kolo testování amplifikační schopnosti 12 párů primerů bylo provedeno pro 8 rostlin, vždy jedna z každé lokality. Všechny reakce byly provedeny v reakčním objemu 25 μl. Byla pro to použita DreamTaq polymeráza (Thermo Fisher Scientific, USA). PCR reakce byly prováděny pomocí termocykleru Thermo Hybaid PXE 0.2 (Thermo Electron Corporation, USA)
Druhá vlna testování amplifikační schopnost primerů zahrnovala dle konkrétního problému při žádné amplifikaci, či při vzniku nespecifických PCR produktů využití jiné DNA polymerázy. Využívána k tomu byla Pfu DNA Polymerase (GDSBio, China) a také Taq Plus DNA Polymerase (GDSBio, China) obsahující kombinaci vysoce specifické DNA polymerázy a také Pfu DNA polymerázy. Podmínky při kterých byly tyto PCR reakce prováděny jsou zobrazeny v Tab..
Fáze | Teplota (°C) | Délka (s) | Počet opakování |
---|---|---|---|
Predenaturace | 95 | 300 | 1 |
Denaturace | 95 | 30 | 30 |
Anelace | 50, 51, 52, 53, 58 | 30, 45 | 30 |
Elongace | 72 | 60 | 30 |
Postelongace | 72 | 600 | 1 |
Poslední vlna testování amplifikace dosud neoptimalizovaných podmínek pro jednotlivé primery zahrnovala gradientní testování anelačních teplot vždy po 2 stupních pro konkrétní primer a dále také prodloužení anelační fáze. Amplifikující primery při optimalizovaných podmínkách byly využity pro všechny rostliny a jejich amplifikace byla ověřena na gelu.
PCR amplifikace poté byla provedena pro všechny amplifikující primery a pro všechny vzorky. Tyto vzorky nebyly již kontrolovány na gelu, byly dále využity pro štěpení restrikčními endonukleázami pro samotné testování vytvořeného RENDO softwaru.
Gelová alektroforéza
První kolo testování aplifikační schopností vybraných PCR primerů bylo vždy testováno u jedné rostliny z jedné lokality. Délka výsledných PCR produktů se výrazněji odlišovala, proto byly testovány na 1,4% agarózovém gelu. Pro přípravu agarózového gelu byla používána PCR Agaróza (Top-Bio, Czech Republic) a 1x TAE pufr. Samotná gelová elektroforéza byla provedena pomocí SGE-014-02 Econosubmarine Electrophoresis Gell Kit (CBS Scientific, USA). Gely byly obarveny barvivem DSView Nucleic Acid Stain 20,000X (GDSBio, China). Zobrazení výsledku elektroforézy bylo prováděno pomocí transiluminátoru LB0100 (Invitrogen by Thermo Fisher Scientific, USA). Gely byly fotografovány v tmavé komoře pomocí fotoaparátu Canon 6D MarkII.
Druhé kolo testování primerů proběhlo pro všechny primery, které amplifikovali pro všechny rostliny. Využito bylo stejné přístrojové a chemické vybavení jako v prvním kole testování, lišilo se pouze procentuální zastoupení agarózy využité pro přípravu gelu, dle potřebné přesnosti rozlišení.
Restrikční analýza
Štěpení
Amplifikující vybrané úseky byly využity pro analýzu restrikčními endonukleázami. Dle referenční verze genomu a dostupných dat z databáze GenBank byly vybrány místa vykazující potvrzenou variabilitu i v České republice. Tyto místa a amplifikovaný úsek genomu byl pomocí softwaru RENDOVarPro analyzován a navržené enzymy tímto softwarem byly využity k štěpení produktů PCR reakcí.
Gelová elektroforéza
Výsledky štěpení PCR produktů navrhnutými endonukleázami byly analyzovány pomocí gelové elektroforézy. Zjištěná variabilita byla ověřena porovnáním vzniklých fragmentů s 100bp DNA Ladderem (GDSBio, China) umožňující ověření softwarem předpovězených výsledků restrikční analýzy.
Výsledky
Tvorba softwaru
RENDOSim
Uživatelské rozhraní této dílčí aplikace je zobrazeno na obrázku níže. Uživatel může nahrát sekvenci ve formátu fasta ze svého zařízení. Dále si z nabídky může vybrat jednu z restrikčních endonukláz. V nabídce jsou rozděleny na endonukleázy tvořící tupé nebo lepivé konce a seřazeny jsou abecedně pro rychlé vyhledání konkrétní restrikční endonukleázy.
Po nahrání vlákna a zvolení endonukleázy započne analýza sekvence stlačením tlačítka „Cut“ a lineárně je vlákno prohledáno na rozpoznávací sekvenci zvolené restrikční endonukleázy. V případě nalezení sekvence je vlákno rozřezáno dle pozice řezu pro vybranou endonukleázu a výsledky jsou zobrazeny uživateli. Pokud nedojde k nalezení rozpoznávací sekvence je uživateli zobrazeno pouze původní vlákno. Před dalším vyhledáváním je doporučeno si uživatelské rozhraní zresetovat pomocí tlačítka „Clear“, ale není to nutné je možné pouze změnit vybranou restrikční endonukleázu, či změnit nahraný fasta soubor a analyzovat jiný soubor stejnou endonukleázou.
RENDOVar
Dílčí aplikace RENDOVar a její uživatelské rozhraní je zobrazeno na obrázku níže. Tato aplikace je určená pro rozlišení známých variant jednotlivých genomických úseků, klonů či geneticky modifikovaných organismů. Zde není zohledňována variabilita, kromě té kterou softwaru ve formátu fasta souborů poskytnete. Po nahrání libovolného počtu fasta souborů tlačítkem „Analyze“ započnete analýzu. V okně s výsledky se zobrazí všechny restikční endonukleázy nabízející rozlišení jednotlivých variant. Seřazeny jsou dle vzniklého poměrového počtu fragmentů od nejlépe rozlišitelných možností po ty hůře rozlišitelné.
RENDOVarPro
Nejdůležitější dílčí aplikací je aplikace RENDOVarPro. Zohledňující variabilitu z konkrétní referenční verze genomu a také variabilitu z dalších dostupných sekvenačních dat z GenBank. Uživatel zadá úsek který by pomocí PCR amplifikoval, název organismu, referenční verzi genomu, pozici indelu či SNV kterou chce analyzovat. Důležité je analyzované pozice zadávat s ohledem na referenční verzi genomu dle, které se pracuje pro stáhnutí správných a relevantních souborů. Pro přesnější analýzu je třeba zadat také číslo chromozomu. Dále musí uživatel zadat svůj email, tento email není nijak uchováván, slouží pouze jako parametr požadavku pro NCBI Entrez API, která dle emailu zajišťuje kontrolu dodržení počtu požadavků.
Po vyplnění těchto údajů začne analýza nejprve stažením z NCBI databáze pomocí Entrez API referenční sekvence, dále jsou z EVA databáze staženy data o variabilitě zadaného úseku. Z těchto dat je poté vytvořen vcf soubor a také referenční sekvence zahrnující variabilitu z referenční verze genomu. Současně s tvorbou vcf souboru probíhá stažení relevantních dat z GenBank, alignment a vytvoření druhého vcf souboru. Tyto dva vcf soubory jsou následně spojeny a vytvořen je finální obsahující veškeré dostupné data o variabilitě v tomto úseku. Poté probíhá návrh vhodných restrikčních endonukleáz k analýze SNV. Uživatelské rozhraní RENDOVarPro aplikace je zobrazeno na obrázku níže. Samotná analýza probíhá různě dlouhou dobu. Způsobeno je to nutností limitovat počet požadavků v určitém časovém úseku pro využívané databáze. Pro úseky o délce do 600bp probíhá analýza do dvou minut. Pokud pro zjištění konkrétní variability neexistuje vhodný enzym je v poli pro výsledky zobrazeno hlášení „No enzymes found“.
RENDOVarPro je však ještě stále vylepšována, nejdůležitějším úkolem je vytvoření vizualizace výsledků na gelu při štěpení konkrétním enzymem pro všechny varianty.