Новые и более высокие пропускные способности геномных технологий, в том числе NGS, позволили исследователям создавать беспрецедентный объем данных.
Международный консорциум – например, энциклопедия ДНК элементов (кодирование), программа 37, программа 38, Атлас раковых генов, 1000 Генная и постгенная путевая проектная карта, каждая будет создавать тысячи наборов геномных данных.
Даже сравнительно небольшая группа исследователей, теперь имеют возможность получить большие объемы данных генома в течение короткого периода времени. Появляется новое поколение геномных браузеров и соответствующих баз данных способное эффективно управлять и распространять этот объем данных. Традиционные веб браузеры используют централизованную модель генома, согласно которой данные и связь находятся на стороне сервера. Информационные потоки идут от провайдера в геном серверного браузера, что обеспечивает необходимое изображение и передает его конечному пользователю.
Когда размер данных возрастает до критической точки, существенными трудностями стают затраты сервера и подключение к интернету и это в конечном счете нарушает беспрепятственный геномный просмотр.
Децентрализация данных, связи или сочетание их может облегчить такую нагрузку на сервер. Например, JBrowse использует асинхронный Java Script и XML (AJAX) для распределения работы между сервером и клиентом, и несет значительно меньшие потери сервера, а также заменяет традиционные статистические нагрузки изображений с беспрепятственным анимированием геномной навигации и выборов методов. Annoj40 (аннотация с Java Script) предоставляется аналогичной беспрепятственной Web 2.0 навигацией, однако со стороны клиента она выполняет оказание услуги «холст» MTML элементов, которые поддерживают только некоторые веб браузер. Некоторые другие приложения используют технологии, в поддержку Google Maps API, которые передают время отклика на сторону сервера и создают эффект разрушения равномерности когда навигация локализирована внутри генома.
Другие подходы использования UCSC геномного браузера ухудшают усовершенствования привычных функциональных подходов по отношению к развивающимся Big Bed и Big Wig с их возможностями располагать очень большой объем данных (сотни мегабайтов до гигабайтов информации).
Такие большие объемы данных форматируются и хранятся локально на компьютере клиента. Вместо того, чтобы хранить весь набор данных в базе браузера, браузер получает лишь приблизительную часть данных необходимую для расположения хромосом в гене. Помимо повышения эффективности локально хранимых данных также имеется явное преимущество, связанное с мерой необходимости для защиты личных данных, таких как отдельные человеческие сферы деятельности.
Токийский университет генома браузера UTGB, специально предназначен для просмотра локально хранимых данных индивидуальным образом.
Есть также несколько автономных инструментов в частности два Java – основные пакеты, Aff ymetrix Комплексный геномный браузер (IGB, сообщает ig-bee) и Интерактивное геномное изображение (IGV), разработанное в институте Брода.
К дополнению к экспериментальным данным, связанных с геномной последовательностью, другие типы данных, такие как клиническая информация, связанная с образцами, зачастую имеет решающее значение в интерпретации данных геномов. Некоторые недавно разработанные геномные браузеры, предназначенные для обеспечения платформы для интеграции больших объемов данных геномов, в особенности раковой геномной информации. Они включены в YCSC, Раковый геномный браузер,IGV и молекулярный анализ рака, разработанный в Портале амер. Национального Института рака. Основным нововведением этих новых инструментов является одновременное отображение данных генов и клинической информации.
Эти браузеры отображают расположение целого генома, изображая экспериментальное измерение для отдельных образцов и наборов образцов в виде горячих карт.
Клинические признаки показуют целую геномную информацию в отдельной тепловой карте.
Следовательно, появляется возможность взаимодействовать с браузером, располагать в определенном порядке, фильтровать агрегаты и отображения данных в соответствии с клиническими признаками, аннотировать биологическим путем или редактировать пользователем коллекцию генов.
Статистический анализ может быть применен к определенным наборам данных и графикам в браузере.
УСК геномный браузер рака использует изображения тепловых карт, на которых х-оси координат и геномные оси у необходимы для стека больших геномов, где каждая строка предоставляет данные образца. Этот дисплей позволяет легко определять закономерности всей выборки. Например, пользователь может точно определить , где область хромосомы по местоположению PTEN, удаляя их периодически, по имеющимся в наличии образцам опухолей головного мозга. Ниже тепловые карты генома можно просмотреть суммарно и те данные, где очевидно есть характерные изменения количества видимых копий.
Клинические тепловые карты позволяют исследователям визуально изучить взаимосвязь между геномным измерением и отдельными клиническими признаками, имеющимися в распоряжении пользователей на основе их уровня доступа к данным. Перестройка вертикальной (клинической пробы) необходима как в клинических так и в геномных тепловых картах, и может быть выполнена одновременной сортировкой на основе численно закодированных клинических функций или совокупности признаков.
Например, когда глиобластомные данные отсортированы на опухоли сравнения, то существует очевидная разница между генами, содержащими эти два типа образца и «нормальными образцами», отображающими какое-либо крупное нарушение, которое характеризуется большим количеством копий опухолей.
Ограничение визуализации последовательности данных в основе координат взаимодействие между двумя местоположениями генома. Кроме того, глобластные тенденции в геномах лучше оценивать в контексте возможностей, которых нет на геномной карте.
Одним из последних примеров является УСКА Геномный браузер рака, в котором геномные данные отображаются в контексте биологического направления.
Организовуются размещение данных в наборе генов в соответствии с индивидуальными направлениями в отличии от местоположения хромосом, пользователи могут получать более надежную и биологически значимую информацию о геномных данных через гены, которые могут действовать согласованно.
Андерс и его коллеги обеспечили другой подход, в котором геномные данные организованы по кривой Гильберта, что обеспечивает глобальный обзор. В будущем, существует огромный потенциал в освоении новых способов лучшего ориентирования геномных пейзажей.
Проблемы
Некоторые ключевые проблемы в области генного анализа данных, появились в последние годы, в том числе и вопросы: объемы данных, тип данных и представления данных. Несколько новых геномных браузеров, которые были, упомянуты выше, решают некоторые из этих вопросов, однако согласованности пока недостигнуто. Кроме того, важно то, что новые геномные браузеры построены с помощью успешных инструментов, включая легкий доступ кросс платформенных данных и отображения настройки и возможности выполнять мгновенные вычисления и визуализацию.
Геномные Браузеры начинают взаимодействовать с конфиденциальной информацией, так как общество осознает проблемы защиты данных. Личная информация, закодированная в геномном ДНК, клинические параметры, а также другая информация личного характера требует тщательной защиты.
Геномным обозревателем могут воспользоваться многие системы безопасности, разработанные для электронной информации с целью обеспечения доступа только для авторизованных исследователей.
Кроме того, эти средства способны максимизировать служебные программы, обеспечивая конфиденциальность данных, представляя в их анонимной форме, например, в виде совокупности или суммарности, не допуская при этом извлечения личной информации от таких агрегатов.
Сравнения геномов
Последнее наличие большого числа полностью секвенированных геномов их ассамблея стимулировала активные исследования в области сравнительной геномики. Это включает разработку алгоритмов и средств для парного и множественного выравнивания очень длинных геномных промежутков и полных геномов. Среди целей этой работы были выявлены такие функциональные элементы, 1)такие как экзоны или усиливающие агенты 2)исследование крупномасштабных перестроек и эволюции индивидуальных геномов и их ссылок в ходе ассемблирования и завершения. Визуализация согласованных данных является критически важной для каждой из этих целей, но является сложной задачей из-за графических трудностей выявления взаимосвязи интересующих хромосом в разных геномах на многократно повторяющихся шкалах. В этом разделе мы рассмотрим различные методы, которые будут разработаны для того, чтобы помочь исследователям в направлении последовательностей между двумя и более геномами.
Дата: 2019-07-30, просмотров: 222.