Що таке зірка для вирівнювання ДНК?

Зрощені

Зрощені

Сплайсинг РНК є процес у молекулярній біології, коли новостворений транскрипт інформаційної РНК-попередника (пре-мРНК) перетворюється на зрілу інформаційну РНК (мРНК). Він працює шляхом видалення всіх інтронів (некодуючих ділянок РНК) і зрощування екзонів (кодуючих ділянок).

https://en.wikipedia.org › wiki › РНК_сплайсинг

Вирівнювання транскриптів до посилання (STAR) є швидкий РНК-послідовність

РНК-послідовність

Вступ до секвенування РНК

RNA-Seq дозволяє дослідникам виявляти як відомі, так і нові особливості в одному аналізі, що дозволяє ідентифікувати ізоформи транскриптів, злиття генів, однонуклеотидні варіанти та інші ознаки без обмеження попередніх знань.

https://www.illumina.com › секвенування › РНК-секвенування

картограф читання з підтримкою виявлення з’єднань і злиття. STAR вирівнює зчитування, знаходячи збіги максимального префікса, який можна відображати (MMP) між зчитуваннями (або парами зчитувань) і геномом, використовуючи індекс суфіксного масиву.

Показано, що STAR має висока точність і перевершує інші вирівнювачі більш ніж у 50 разів за швидкістю картографування, але це інтенсивно пам’ять. Алгоритм досягає цього високоефективного відображення, виконуючи двоетапний процес: початковий пошук. Кластеризація, зшивання та скоринг.

Символи під кожним стовпцем пояснюються в довідці щодо вирівнювання послідовності таким чином: * (зірочка) позначає позиції, які мають єдиний, повністю збережений залишок. A : (двокрапка) вказує на збереження між групами дуже подібних властивостей – оцінка > 0,5 у матриці Gonnet PAM 250.

STAR використовує підхід прямого підрахунку на відміну від Kallisto, який використовує оцінку і через такий спосіб підрахунку STAR завжди буде точнішим за Kallisto. 2. Може кількісно визначити рівні експресії генів на основі підрахунку читань. 3.

STAR може вирівнювати несуміжні послідовності безпосередньо з геномом. Алгоритм STAR складається з двох основних кроків: етап пошуку вихідного коду та крок кластеризації/зшивання/оцінки. STAR потребує більше пам’яті (Для геному людини потрібно 30 Гб оперативної пам'яті у порівнянні з ~5 Гб, необхідних для hisat2), але це швидко.

Вирівнювання зрощених транскриптів до еталонного зразка (STAR) — це швидкий картограф зчитування RNA-seq із підтримкою виявлення сплайсингу та злиття. ЗІРКА вирівнює зчитування, знаходячи збіги максимального відображуваного префікса (MMP) між зчитуваннями (або парами зчитувань) і геномом, використовуючи індекс суфіксального масиву.

12 ниток . Висока швидкість відображення STAR компенсується використанням оперативної пам’яті: STAR вимагає ~27 ГБ оперативної пам’яті для узгодження з геномом людини.