Отправить новость
600 просмотров Версия для печати

Как быстрее искать метаданные об экспериментах на Большом адронном коллайдере, предложила магистрант ТПУ на международной конференции

Томский политехнический университет в этом году выступил одним из организаторов Второй международной молодежной научной школы-конференции по распределенным гетерогенным вычислительным инфраструктурам — International School on Heterogeneous Computing Infrastructure. На днях школа завершила свою работу в городе Будва (Черногория). Томский политех на конференции представляли шесть молодых ученых — магистрантов университета. Диплом первой степени за лучший доклад получила магистрант кафедры программной инженерии Анастасия Кайда. Работа девушки посвящена импорту метаданных об экспериментах на Большом адронном коллайдере.

Фото: Магистранты ТПУ на конференции. 

Отметим, что организаторами школы в этом году стали Объединенный институт ядерных исследований, Курчатовский институт и Европейский центр ядерных исследований (ЦЕРН), а также Томский политех. Школа объединила молодых ученых из разных стран, работающих в области анализа больших данных (Big Data), машинного обучения, научной визуализации. Все участники школы были отобраны на конкурсной основе.

Участники школы-конференции представили 32 постерных доклада. Экспертный совет рекомендовал пять из них для выступления на пленарном заседании Международного симпозиума по ядерной электронике и компьютингу Nuclear Electronics and Computing NEC’2017, в рамках которого и проходила молодежная школа.  

Анастасия Кайда получила диплом первой степени за доклад «Разработка модуля импорта метаданных в базу знаний научного эксперимента» (Developing the metadata import module for Data Knowledge Base). Девушка учится в Институте кибернетики ТПУ по направлению «Технологии больших данных» (Big Data Solutions). В своем докладе она представила результаты работы, выполненной в рамках научной коллаборации ТПУ, Курчатовского института и ЦЕРНа.

«Источники метаданных о научных экспериментах на Большом адронном коллайдере существуют автономно. Бывают случаи, когда ученым необходимо искать нужную информацию сразу в нескольких репозиториях, но в силу отсутствия инструментов, обеспечивающих автоматическую интеграцию данных, поиск приходится производить буквально вручную.

Интеграция метаданных из гетерогенных источников — это, конечно, комплексная задача, которую сейчас решает целая группа специалистов. Например, обработка документов из CERN Document Server состоит из нескольких ступеней перед загрузкой в общее хранилище. Мне было доверено разработать ступень, приводящую метаданные из JSON-файлов, получаемых после анализа PDF-документа, к одному из стандартов Semantic Web», — поясняет Анастасия Кайда.

Добавим, на базе Томского политеха работает лаборатория обработки и анализа больших данных (Big Data Analytics and Technologies Laboratory). Ученые разрабатывают систему хранения больших объемов информации, которую опробуют в экспериментах ЦЕРНа на Большом адронном коллайдере. Такая система позволит за секунды получать информацию, на получение которой раньше могли уходить часы.

Справка:

Метаданные — это данные о данных: каталоги, справочники, реестры, базы данных, содержащие сведения о составе данных, статусе, происхождении, местонахождении, качестве, форматах и формах представления, условиях доступа и другую информацию. 

Заметили ошибку?
Выделите ее и нажмите Ctrl+Enter