search icoico arrow

ГЕНОМ и БИНОМ

ГЕНОМ и БИНОМ

Еще не так давно принято было говорить о научных открытиях, сделанных "на кончике пера". Сегодня серьезные исследования практически невозможны без мощнейших компьютерных систем. При этом сами компьютерные технологии во многом меняют лицо науки. Яркий пример - раскрытие генетического кода человека, которое состоялось буквально на днях...

Прорыв

Можно ли назвать сенсационным событие, которое должно было неминуемо произойти? Правда, оно опередило прогнозы, но лишь на полгода - год: ничтожный срок в истории человечества. А ведь речь идет о событии действительно исторического масштаба. На прошлой неделе ведущий специалист американской биотехнологической компании Celera Genomics Крейг Вентер заявил, что в распоряжении его научного коллектива имеется почти полная информация о последовательности нуклеатидов - элементов, образующих генетический код человеческого существа - геном. Высокий научный авторитет Celera и сдержанные поздравления со стороны руководителя соперничающего направления - официального интернационального проекта "Геном Человека" - гарантия серьезности претензий на долгожданный результат. Правда, для получения окончательной версии последовательности из трех миллиардов звеньев генетической цепочки понадобится, как говорят ученые, еще несколько недель, но уже ясно - прорыв состоялся.

О возможных последствиях открытия, которое по своей значимости для человечества вряд ли уступит покорению атомной энергии, сейчас говорят и еще будут говорить много. Нам в связи с этим интересна прежде всего роль компьютерных технологий. Однако небольшой обзор перспектив все-таки полезен. Итак, ближайшим следствием расшифровки генома должны стать новые возможности здравоохранения: вероятно, удастся установить фрагменты генного кода, отвечающие за предрасположенность к тем или иным заболеваниям, ускорить создание новых высокоэффективных лекарств и обеспечить их более "прицельное" применение, исключающее неприятные побочные эффекты. Более отдаленные (и более спорные с точки зрения этики) возможности: учет особенностей индивидуального генного кода при выборе "оптимального" места человека в обществе и, наконец, - коррекция генной цепочки для изменения свойств человеческого тела и психики. Масштабы последствий (как положительных, так и отрицательных) для всего человечества трудно предвидеть и невозможно переоценить. Но это - предмет отдельных обсуждений. Мы же вернемся к истории расшифровки генома и роли в ней информационных технологий.

Золушкин труд


Задача определения правильного порядка следования трех миллиардов звеньев в генной цепочке - "вычислительная", что называется, по определению. Однако наивно полагать, что она сводится лишь к перебору вариантов. В основании пирамиды, на вершине которой появляется "очищенная" информация о структуре участков генома - каждодневный сбор и анализ сотен тысяч образцов ДНК во множестве лабораторий. Уже эту первичную операцию подготовки исходного материала выполняют роботы, передающие полученные из крови и спермы образцы аппаратам "секвенсорам", которые определяют их количественные характеристики. После оцифровки информация фильтруется, сравнивается с известными фрагментами последовательностей с помощью стандартных поисковых алгоритмов, а затем помещается в базу данных. Дальше следует громадная работа по складыванию гигантского "паззла" - головоломки, в которой каждый уникальный фрагмент должен найти свое место.

Об объемах переработки информации говорит, в частности, тот факт, что ежесуточно количество образцов ДНК достигает 800 тысяч, а это дает около 15 гигабайт в день. Для надлежащей обработки столь огромных массивов информации приходится разрабатывать оригинальное ПО. Разумеется, решение подобных задач под силу лишь мощным научным коллективам, в распоряжении которых находится уникальное оборудование. Это понимали в правительстве США, когда 10 лет назад по его инициативе был "запущен" один из самых масштабных исследовательских проектов в истории человечества - Humen Genom Projekt.

Проект "Геном"

Проект, рассчитанный на 15 лет, имеет целью определение полного генетического кода. Его возглавил Национальный институт генома человека (США). Участие в проекте принимают ряд исследовательских центров в ведущих университетах США, а также научные коллективы шести стран. Вот, например, как выглядит по описанию PC World аппаратно-программный комплекс, используемый в Центре биомедицинских исследований Уайтхеда Массачусетского технологического института. Он включает "123 секвенсора; 17 четырехпроцессорных SMP-серверов; дисковые массивы Compaq Storage Works емкостью 5 терабайт; базы данных Sybase; множество разработанных в самом институте приложений". Каждую ночь собранные данные автоматически вносятся в хранилища центра и архивируются. Затем они пересылаются по Интернету в GenBank - общедоступную базу данных, обслуживаемую Национальным центром биотехнологической информации, а оттуда - в общедоступные базы в Европе и Японии.

Вообще работы в этом направлении ведутся широким фронтом и не сводятся лишь к получению стуктуры генома. Так, группой компаний при участии Motorola были созданы специализированные чипы, использование которых позволило примерно на порядок сократить время, в среднем затрачиваемое на расшифровку одной "буквы" кода ДНК. В такой же пропорции уменьшилась и стоимость расчетов. И все же собственно расшифровка генома остается центральной задачей.

В рамках Humen Genom Projekt в декабре была впервые определена структура ДНК полной хромосомы человека. Руководители проекта утверждали, что первый рабочий вариант полной структуры генома может быть получен этой весной. Возможно, это действительно случится. Но сейчас их уже опередили...

Рывок Celera

Частная компания Celera Genomic включилась в гонку недавно, однако, темп ее продвижения оказался очень высоким. Составляющие успеха - оригинальная методика (которую сам Крейг Вентер называет "агрессивной" и "несколько рискованной"), использование мощного компьютерного центра (по заявлениям самой компании - второго по масштабу в мире), а также уникальная информационная инфраструктура, опирающаяся на электронную коммерцию.

Метод, позволивший Celera значительно ускорить темп продвижения, называют "принудительным формированием". Он основывается на разбиении генома на небольшие перекрывающиеся фрагменты ДНК с их последующей "сборкой" (в рамках Humen Genom Projekt применяется более трудоемкая схема формирования модели всего генома каждый раз за счет использования крупного исходного фрагмента). У такого подхода было немало критиков, однако, "кто не рискует, тот не пьет шампанского"...

В компьютерном центре, который компания оборудует при участии Compaq Computer, по данным PC World установлено "200 серверовCompaq Alpha Server ES40, оснащенных процессорами Alpha/500МГц, 11 серверов GS140 и система хранения Storage Works емкостью 50 терабайт. Celera взяла в аренду 300 секвенсоров у компании PE Biosystems. Все это оборудование подключено к коммутируемой магистрали, которая обладает пропускной способностью 500 Гбайт/с".

Полученную информацию компания еженедельно помещает в базы данных своих подписчиков, которые физически размещаются на серверах Celera и доступны через Интернет. По сути, таким образом речь идет о продаже информации о генных структурах. Сейчас Celera подала заявки на патенты более чем на 6.5 тысячи генов. Чтобы смысл этого стал яснее, приведем следующий факт: несколько лет назад компания Amgen заплатила за эксклюзивное право использования информации о гене, отвечающем за развитие ожирения, 20 миллионов долларов.

Бизнес-модель Celera была оценена рынком весьма высоко: только за полгода, начиная с мая 1999-го, ее акции поднялись в цене более, чем на порядок. Рост инвестиций стимулирует исследования, однако, не все согласны с тем, что собственность на информацию и связанные с ней ограничения пойдут в конечном счете на пользу науке...

Всеобщее достояние?


"Ограничения на доступ к информации о человеческих генах должны быть сняты", - таков основной смысл совместного заявления президента США и премьер-министра Великобритании, сделанного ими в марте. Основной мотив этой позиции: широкий обмен результатами исследований в области генетического кода позволит избежать фатальных ошибок при разработке новых лечебных технологий и расширит фронт исследований. Пока неясно, какие конкретные меры, стимулирующие новоявленных собственников информации к большей открытости, будут приняты. Очевидно и то, что у инвесторов должен сохраниться стимул к вложению денег в исследования. Недаром демарш Клинтона и Блэра едва не послужил причиной биржевого кризиса. Однако призыв уже возымел и позитивное действие. Например, согласно заявлению Вентера, Celera откроет доступ к полученной структуре генома через Интернет. При этом она нашла оригинальный способ зарабатывания денег, не предусматривающий продажу информации как таковой. Желающие получить доступ к результатам исследований должны будут приобрести у фирмы специальное ПО для работы с данными. И если например для академических учреждений его цена выглядит достаточно скромной, то фармацевтическим гигантам придется платить шестизначные суммы...

Что дальше

Нет, речь пойдет не о ближайшем будущем задачи раскрытия генетического кода или отдаленном "послезавтра" генной инженерии. В этой статье мы хотели бы обратить внимание читателей на другое: история раскрытия генома показывает, что компьютерные технологии существенно меняют механизм научного поиска, распространения и использования его результатов. Вот лишь три важных момента.

Во-первых, в рамках крупного научного проекта создается по сути цельная технология, включающая собственно научные методы, программно-технический комплекс, максимально автоматизирующий и ускоряющий сбор и обработку данных, а также - информационная инфраструктура, позволяющая донести научные результаты до потребителя. Условием успеха, как показал опыт Celera, становится качество всех трех составляющих.

Во-вторых, использование возможностей Интернета позволяет в принципе сделать максимально широким и оперативным доступ к промежуточным результатам исследований. Это в принципе позволяет создать глобальный конвейер исследований и открывает дорогу для невиданного раньше всемирного разделения труда в науке.

Наконец, в-третьих, научные результаты могут стать (и уже становятся) товаром во всемирном пространстве электронной коммерции. Сообщество государств может и должно регулировать правила игры на этом рынке, учитывая как заинтересованность общества в открытости информации, так и интересы частных инвесторов, стремящихся заработать на ней деньги.

Последние комментарии

    Комментариев не найдено, вы можете оставить первый комментарий!

Оставить комментарий

Ваше имя:

Почта:

Комментарий:

© 2000-2013 Academy.kiev.ua. Все права на любые материалы, опубликованные на сайте, защищены в соответствии с украинским и международным законодательством об авторском праве и смежных правах.