Що таке зірка для вирівнювання ДНК?
Вирівнювання транскриптів до посилання (STAR) є швидкий
RNA-Seq дозволяє дослідникам виявляти як відомі, так і нові особливості в одному аналізі, що дозволяє ідентифікувати ізоформи транскриптів, злиття генів, однонуклеотидні варіанти та інші ознаки без обмеження попередніх знань.
картограф читання з підтримкою виявлення з’єднань і злиття. STAR вирівнює зчитування, знаходячи збіги максимального префікса, який можна відображати (MMP) між зчитуваннями (або парами зчитувань) і геномом, використовуючи індекс суфіксного масиву.
Показано, що STAR має висока точність і перевершує інші вирівнювачі більш ніж у 50 разів за швидкістю картографування, але це інтенсивно пам’ять. Алгоритм досягає цього високоефективного відображення, виконуючи двоетапний процес: початковий пошук. Кластеризація, зшивання та скоринг.
Символи під кожним стовпцем пояснюються в довідці щодо вирівнювання послідовності таким чином: * (зірочка) позначає позиції, які мають єдиний, повністю збережений залишок. A : (двокрапка) вказує на збереження між групами дуже подібних властивостей – оцінка > 0,5 у матриці Gonnet PAM 250.
STAR використовує підхід прямого підрахунку на відміну від Kallisto, який використовує оцінку і через такий спосіб підрахунку STAR завжди буде точнішим за Kallisto. 2. Може кількісно визначити рівні експресії генів на основі підрахунку читань. 3.
STAR може вирівнювати несуміжні послідовності безпосередньо з геномом. Алгоритм STAR складається з двох основних кроків: етап пошуку вихідного коду та крок кластеризації/зшивання/оцінки. STAR потребує більше пам’яті (Для геному людини потрібно 30 Гб оперативної пам'яті у порівнянні з ~5 Гб, необхідних для hisat2), але це швидко.
Вирівнювання зрощених транскриптів до еталонного зразка (STAR) — це швидкий картограф зчитування RNA-seq із підтримкою виявлення сплайсингу та злиття. ЗІРКА вирівнює зчитування, знаходячи збіги максимального відображуваного префікса (MMP) між зчитуваннями (або парами зчитувань) і геномом, використовуючи індекс суфіксального масиву.
12 ниток . Висока швидкість відображення STAR компенсується використанням оперативної пам’яті: STAR вимагає ~27 ГБ оперативної пам’яті для узгодження з геномом людини.