В чем разница между FASTA и FASTQ

Оглавление:

В чем разница между FASTA и FASTQ
В чем разница между FASTA и FASTQ

Видео: В чем разница между FASTA и FASTQ

Видео: В чем разница между FASTA и FASTQ
Видео: Разница между форматами файлов FASTA и FASTQ. Как сделать файл в формате fasta. 2024, Июль
Anonim

Ключевое различие между FASTA и FASTQ заключается в том, что FASTA - это текстовый формат, в котором хранятся только последовательности нуклеотидов или белков, а FASTQ - это текстовый формат, в котором хранятся как последовательности, так и связанные значения качества последовательностей.

Биоинформатика - это область, в которой используется различное программное обеспечение для анализа и понимания биологических данных, особенно когда набор данных сложный и большой. Эта область объединяет биологию, химию, физику, информатику, информационную инженерию, математику и статистику для анализа и интерпретации биологических данных. FASTA и FASTQ - это два формата представления последовательностей в области биоинформатики для выравнивания и анализа последовательностей. Фактически, FASTQ - это формат файла последовательности, расширяющий формат FASTA возможностью сохранения качества последовательности.

Что такое ФАСТА?

FASTA - это программа для выравнивания последовательностей ДНК и белков. Программное обеспечение FASTA использует формат FASTA. Это текстовый формат, который представляет либо последовательности нуклеотидов, либо последовательности аминокислот (белков). Здесь однобуквенные коды представляют обе эти последовательности. FASTA - важный инструмент в области биоинформатики и биохимии. Этот формат позволяет именам последовательностей и комментариям предшествовать последовательностям.

FASTA против FASTQ в табличной форме
FASTA против FASTQ в табличной форме

Рисунок 01: Последовательность FASTA

Этот формат возник из программного обеспечения FASTA и был представлен Дэвидом Дж. Липманном и Уильямом Р. Пирсоном в 1985 году. Инструмент FASTA претерпел множество модификаций с течением времени, и последняя версия состоит из программ для белков: белков, ДНК: ДНК, белок: транслируемая ДНК (со сдвигом рамки считывания) и поиск упорядоченных или неупорядоченных пептидов. FASTA считывает заданную последовательность нуклеотидов или аминокислот и ищет соответствующую базу данных последовательностей, используя локальное выравнивание последовательностей, чтобы найти совпадения с аналогичными последовательностями базы данных.

Что такое FASTQ?

FASTQ - это программное обеспечение для выравнивания, используемое в области биоинформатики, которое хранит как биологическую последовательность (обычно последовательность нуклеотидов), так и соответствующие показатели качества. Первоначально FASTQ был разработан Wellcome Trust Sanger Institute для объединения последовательности в формате FASTA и соответствующих данных о качестве. С развитием биоинформатики FASTQ стал стандартом де-факто для хранения выходных данных многих инструментов секвенирования с высокой пропускной способностью.

В формате FASTQ для каждой последовательности используются четыре разные строки. Строка 1 начинается с символа @ и сопровождается идентификатором последовательности (аналогично строке заголовка FASTA). Строка 2 состоит из необработанных букв последовательности. В строке 3 последовательность начинается с символа «+» и может сопровождаться тем же идентификатором последовательности. Строка 4 кодирует значения качества для последовательности в строке 2 и должна состоять из того же количества символов, что и буквы в последовательности.

В чем сходство между FASTA и FASTQ?

  • FASTA и FASTQ - это инструменты выравнивания.
  • Это два формата представления последовательности.
  • Оба относятся к области биоинформатики.
  • И FAST, и FASTQ являются важными инструментами для хранения и секвенирования.
  • FASTQ - расширение формата FASTA с возможностью сохранения качества последовательности.

В чем разница между FASTA и FASTQ?

FASTA - это текстовый формат, в котором хранятся только последовательности нуклеотидов или белков, а FASTQ - это текстовый формат, в котором хранятся как последовательности, так и связанные значения качества последовательностей. Таким образом, в этом ключевое отличие FASTA от FASTQ. Кроме того, FASTA сохраняет фрагменты последовательности после отображения, а FASTQ сохраняет фрагменты последовательности перед отображением. Кроме того, еще одно отличие FASTA от FASTQ состоит в том, что FASTA состоит из одной строки описания, а FASTAQ - из четырех.

Приведенная ниже инфографика представляет различия между FASTA и FASTQ в табличной форме для параллельного сравнения.

Резюме – FASTA против FASTQ

Биоинформатика использует различные форматы последовательностей, такие как FASTA и FASTQ и т. д. FASTA сохраняет фрагменты последовательности после картирования, в то время как FASTQ хранит фрагменты последовательности перед картированием. FASTA - это программа для выравнивания последовательностей ДНК и белков. Он состоит из программ для поиска белок:белок, ДНК:ДНК, белок:транслируемая ДНК (со сдвигом рамки считывания) и упорядоченного или неупорядоченного поиска пептидов. FASTQ - это программное обеспечение для выравнивания, используемое в области биоинформатики и хранящее как биологическую последовательность (обычно нуклеотидную последовательность), так и соответствующие показатели качества. FASTA состоит из одной строки описания, а FASTQ состоит из четырех строк. Итак, это резюмирует разницу между FASTA и FASTQ.

Рекомендуемые: