Благодаря новым алгоритмам и достижениям ИТ машины теперь могут изучать все более сложные модели. Они приходят для создания высококачественных синтетических данных, таких как фотореалистичные изображения и даже резюме воображаемых людей.
Ora исследование, опубликованное в международном журнале PLoS Genetics показывает расширенное использование машинного обучения на биометрических данных. Из существующих биобанков система генерирует целые блоки генома человека, которые не принадлежат реальным людям, но имеют характеристики реального генома.
В обход проблемы конфиденциальности
«Существующие геномные базы данных - бесценный ресурс для биомедицинские исследования," Он говорит Бурак Ельмен, первый автор исследования и младший научный сотрудник современной популяционной генетики Тартуского университета. «Проблема в том, что они не являются общедоступными и не защищены длительными и изнурительными процедурами правоприменения из-за обоснованных этических соображений. Это создает важный научный барьер для исследователей. Геном, созданный машинами, «искусственный геном», может помочь нам преодолеть проблему в рамках безопасных этических рамок ».
:format(jpg):extract_cover()/https%3A%2F%2Fscx1.b-cdn.net%2Fcsz%2Fnews%2F800a%2F2021%2F13-machinelearn.jpg)
Многопрофильная команда выполнила больше анализов, чтобы оценить качество генома, созданного с помощью машинного обучения, по сравнению с реальным. "Удивительно, но этот геном имитирует сложности, которые мы можем наблюдать в реальных человеческих популяциях, и для большинства свойств они неотличимы от других геномов биобанка, используемого для обучения нашего алгоритма. За исключением одной детали: они не принадлежат ни одному генному донору », - сказал он. доктор Лука Пагани, один из главных авторов исследования и сотрудник Mobilitas Pluss.
Геном, созданный машиной, «искусственный геном», может помочь нам преодолеть проблему в рамках безопасных этических норм.
Бурак Ельмен

Это действительно оригинальный геном или его «плевательница»?
Исследование также предусматривает оценку близости искусственного генома к реальному геному, чтобы проверить, сохраняется ли конфиденциальность исходных образцов. «Хотя обнаружение утечек конфиденциальности в тысячах геномов может показаться поиском иголки в стоге сена, комбинация нескольких статистических показателей позволяет нам внимательно отслеживать все модели. Интересно, что подробное изучение сложных схем дисперсии, в свою очередь, приводит к другим улучшениям в оценке ГАН и это будет способствовать развитию машинного обучения ». Сказать, что это доктор. Флора Джей, координатор исследований и научный сотрудник Национального центра научных исследований Франции CNRS).
В общем, подходы машинного обучения уже предоставлены Volti, биографии и многие другие особенности горстке воображаемых людей. Теперь мы знаем больше об их биологии. Эти вымышленные люди с реалистичными геномами могут служить экспериментальным стендом вместо настоящих геномов, которые не являются общедоступными.