Анализ на генната експресия - Биология

анализ

The Анализ на генната експресия се отнася до разследване на прилагането на генетична информация (генна експресия) с помощта на молекулярно биологични и биохимични методи. Той може да се използва както за отделни транскрипти, така и за целия транскриптом и позволява да се правят качествени и количествени изявления за активността на гените. Докато в първия случай трябва да бъде известна само информацията за последователността на транскрипта, който трябва да се изследва, цялата информация за последователността на транскриптома е необходима за анализа на транскриптома.

В молекулярната биология активността и експресията на хиляди гени могат да се измерват едновременно с помощта на анализ на генната експресия, който дава възможност за преглед на клетъчните функции. Профилите на генна експресия могат да се използват, например, за идентифициране на клетки, които са в активната фаза на делене, или за показване на отговора на клетките към специфично лечение. Много такива експерименти изследват целия геном, т.е. всеки ген от определена клетка.

Техниката на ДНК микрочипове [1] измерва относителната активност на предварително идентифицирани целеви гени. Методи, базирани на последователност, като сериен анализ на генната експресия (SAGE, SuperSAGE) също се използват за анализ на генната експресия. SuperSAGE е особено точен, тъй като този метод не се ограничава до предварително дефинирани гени, но може да измери всеки активен ген. С въвеждането на методите за секвениране от следващо поколение, експресионният анализ, базиран на последователност, се радва на нарастваща популярност като цифрова алтернатива на микрочиповете. Независимо от това, микрочиповете са били използвани по-често, както е показано от използването на този метод в 17 000 статии PubMed до 2006 г.

  • Експресиран ли е ген изобщо при изследваните обстоятелства?
  • В кои клетки се извършва експресия (например in situ хибридизация)?

  • Колко голяма е разликата в израза в сравнение с определена референция?
    • здрав срещу болни клетки
    • Див тип срещу Мутантни клетки
    • нестимулиран vs. стимулирани клетки

В зависимост от метода се анализират продуктите от различните нива на генна експресия:

Методи

  • С in-situ хибридизация, специфичната за последователността РНК на определен ген/генен набор се открива в тъканта и се определя локалният модел на генна експресия.
  • При метода Northern blot РНК първо се изолира и електрофоретично се отделя според размера си в гел. След прехвърлянето му в мембрана (попиване), търсената РНК последователност се открива чрез маркирани сонди (радиоизотопи, флуоресцентни багрила), направени от комплементарна РНК или ДНК чрез допълнително свързване. По правило едновременно се изследват само малък брой последователности.
  • В ДНК микрочипове или макрочипове количеството на иРНК на голям брой гени от клетки на култура/тъкан може да бъде определено едновременно. За тази цел иРНК се изолира и транскрибира в кДНК. С този метод откриването става чрез допълнителна хибридизация на маркираната cDNA (радиоизотопи, флуоресцентни багрила) със сондите от ДНК масива.
  • Със серийния анализ на генната експресия (SAGE) и по-специално SuperSAGE, експресията на теоретично всички гени на клетка може да бъде определена много прецизно чрез генериране на късо парче последователност (т.нар. "Таг" = етикет) от всеки препис и колкото се може повече от тези тагове са секвенирани. Предимството пред микрочиповете е много по-прецизното количествено определяне на транскриптите, както и възможността (особено със SuperSAGE) да се идентифицират нови транскрипти (например некодиращи рибонуклеинови киселини като микроРНК или антисенс РНК) и да се изследват организми с неизвестни досега геноми.
  • Количествената PCR в реално време е вариант на полимеразната верижна реакция (PCR). Багрила или специални сонди, добавени към реакционната смес, следят концентрацията на продукта по време на PCR. Промяната в концентрацията във времето позволява да се направят изводи за първоначалната концентрация на въпросната нуклеинова киселина.
  • С метода Western blot, протеините се разделят по отношение на различни свойства като размер, електрически заряд или изоелектрична точка и след това се откриват с антитела. Обикновено само контролируем брой генни продукти се изследват едновременно.
  • Диференциалният анализ на 2D гелове позволява експресията на до 10 000 протеини едновременно. За тази цел протеиновите екстракти се получават от клетъчни култури/тъкани, разделят се двуизмерно според изоелектричната точка и молекулната маса и се откриват и определят количествено чрез маркиране или различни (флуоресцентни) техники на оцветяване. Определените интензитети на различни проби се сравняват помежду си и по този начин поведението на експресия се следи при различни условия.
  • В протеиновите масиви, аналогично на ДНК масивите, се изследва количеството на определени протеини. За откриване се използват многобройните взаимодействия между протеини и други молекули: Б. Ензим-субстрат, взаимодействие антитяло-антиген или рецептор-пратеник.
  • През последните години масовият спектрометричен анализ на протеиновите смеси става все по-важен. Използвайки "спектралното изобилие", се отчитат пептидите на протеинови парчета, подобно на ДНК фрагментите на съществуващи РНК в SAGE и по този начин тяхната честота се определя количествено. Други методи използват интензитета на сигнала на определени пептиди в мас спектъра като мярка за честотата.

Много методи използват флуоресцентни багрила, които са свързани към сондите (РНК сонди, антитела и др.) И са видими чрез флуоресцентна спектроскопия или флуоресцентна микроскопия. Последното предлага предимството на висока пространствена разделителна способност. В допълнение се използват радиоактивно маркирани сонди или такива, които превръщат хромогените в оцветители чрез свързани ензими.

Сравнение с протеомиката

Човешкият геном съдържа около 25 000 гена, които работят заедно, за да създадат около 1 000 000 различни протеини. Това разнообразие възниква главно чрез пост-транслационни модификации, така че един единствен ген може да служи като шаблон за много различни версии на протеин. Около 2000 протеина [5] (0,2% от общия брой) могат да бъдат идентифицирани в един експеримент с масова спектрометрия. Познаването на отделните протеини, които една клетка произвежда (протеомика) е по-подходящо от това колко много иРНК се произвежда от всеки ген. Анализът на генната експресия обаче дава възможно най-добрия преглед, който може да бъде получен в един експеримент.

Използвайте за разработване и тестване на хипотези

ограничения

Проверка на методите с висока производителност

Както ДНК микрочиповете, така и qPCR използват предпочитаното свързване на комплементарни последователности на нуклеинови киселини ("сдвояване на основи") и двата метода се използват, често последователно, за създаване на профили на генна експресия. Докато ДНК микрочиповете имат висока пропускателна способност, те нямат висока количествена точност на qPCR. Въпреки това, в същото време, колкото е необходимо за определяне на експресията на няколко десетки гени с qPCR, целият геном може да бъде изследван с помощта на ДНК микрочипове. Поради тази причина често има смисъл първо да се извърши полуколичествен анализ на ДНК микрочипове, за да се идентифицират кандидат-гени, които след това могат да бъдат валидирани и по-точно количествено определени с помощта на qPCR. Допълнителни експерименти, като Уестърн блотинг на протеините на диференциално експресирани гени, могат да помогнат да се подкрепят резултатите от анализа на генната експресия, тъй като концентрациите на иРНК не корелират непременно с количеството експресиран протеин.

Статистически анализ

Анотация на гените

С помощта на статистически методи могат да бъдат надеждно идентифицирани гени, чиито продукти се променят при експериментални условия. За смислена интерпретация на профилите на експресия е от съществено значение да се знае кой протеин е кодиран от кой ген и каква функция има. Този процес се нарича анотиране на гени. Някои пояснения са по-надеждни от други, а понякога и напълно липсват. Базите данни за генни анотации непрекъснато се променят и различните бази данни използват различни имена за един и същ протеин, което отразява промяна в разбирането за неговата функция. Използването на стандартизирана генна номенклатура избягва проблема с различното именуване, но точното присвояване на преписи на гени [13] [14] остава важно предизвикателство.

Класификация на регулираните гени

Следващата стъпка след идентифициране на група от диференциално регулирани гени е да се търсят модели в тази група. Протеините, за които тези гени кодират, имат ли подобни функции? Сходни ли са химически? Разположени ли са в подобни клетъчни отделения? Анализът на генната онтология предоставя общ начин за определяне на тези взаимоотношения. Генната онтология започва с много широка горна категория, напр. „Метаболитен процес“ и след това ги подразделя на по-малки подкатегории като „Въглехидратен метаболизъм“, които от своя страна могат да бъдат разделени на по-специфични подгрупи като „Фосфорилиране на инозитол и производни“. В допълнение към своята биологична функция, химични свойства и клетъчно местоположение, гените имат и други свойства. Например, гените могат да бъдат класифицирани в групи въз основа на връзката им с други гени, връзката им с болестите или взаимодействието им с лекарства или токсини. Базата данни с молекулярни подписи (База данни за молекулярния подпис) [15] и Сравнителната база данни за токсикогеномика (Сравнителна база данни за токсикогеномика) [16] предлагат възможност за категоризиране на гените по най-различни начини.

Разпознаване на образец между регулирани гени

Когато регулираните гени се сортират според това, което са и какво правят, могат да възникнат важни взаимоотношения между различните гени [18]. Например, можете да получите индикация, че определен ген кодира протеин, който създава ензим, който от своя страна активира протеин, който регулира втори ген от нашия списък. Този втори ген може да бъде транскрипционен фактор, който от своя страна регулира друг от нашите кандидат-гени. Наблюдавайки тези кръстосани връзки, можем да предположим, че това са повече от случайни асоциации и че всички тези гени са в нашия списък, защото са част от основния биологичен процес. От друга страна, гените, които са независими и напълно произволно подбрани, разбира се биха могли да създадат впечатлението, че са част от общ процес, въпреки че това не е така.

Причинно-следствени връзки

Използване на модели за разпознаване на регулирани гени

Заключения

Анализът на генната експресия предоставя нова информация за това как се държат гените при различни условия. Като цяло техниките с микрочипове създават надеждни профили на изразяване [24]. Въз основа на тези данни могат да се изготвят нови биологични хипотези или да се проверят съществуващи хипотези. Въпреки това, обхватът и сложността на тези експерименти често водят до множество различни интерпретации. В много случаи анализът на данни на профили на изрази изисква значително повече време и усилия от оригиналния експеримент за генериране на данните. Много учени използват няколко статистически метода и предварителен анализ на данните и се консултират с биостатици или други експерти в областта на технологията на микрочиповете, преди да публикуват резултатите от анализите на генната експресия. Добрата експериментална организация, достатъчен брой биологични повторения и многократни експерименти играят ключова роля при извършването на успешни анализи на генната експресия.