Студенты ТПУ спрогнозировали сценарии отчисления из вуза

| 1291

Группа студентов Томского политехнического университета разработала модель для прогноза сценария отчисления из вуза. С помощью инструментов работы с большими данными они проанализировали оценки 4 800 студентов Томского политеха и выделили вклад каждого предмета в отчисление.

Работу над этим проектом в качестве летней практики ведут магистрантки Инженерной школы информационных технологий и робототехники ТПУ Анастасия Баскакова и Виктория Лобанова под руководством доцента отделения нефтегазового дела ТПУ Алексея Зарубина. Университет предоставил им деперсонализированные данные студентов их школы, которые учились с 2009 по 2019 год.

«Исходный объем данных был 230 000 строк — это информация о 4 800 студентов из 508 групп и их оценки по 2 794 дисциплинам. Для создания модели мы отфильтровали, очистили, привели данные в нужный вид.

Так как дисциплин много, и они отличаются в зависимости от направлений подготовки, то для более универсального прогнозирования был применен метод проекций на скрытые структуры, который дает высокую точность при построении моделей. На входе мы подаем предварительно очищенные и отфильтрованные данные, а на выходе получаем подпространство отчисленных студентов», — рассказывает Анастасия Баскакова.

Модель помогает спрогнозировать сценарий, который с высокой долей вероятности может привести студента к отчислению, и определить, как на это влияет конкретный предмет. 

«При ознакомительном рассмотрении данных мы выявили, что большая доля отчисленных приходится на первые два курса. Согласно нашей модели, значительный вклад в отчисление студентов в Инженерной школе информационных технологий и робототехники вносит дисциплина "Творческий проект" как после второго, так и после четвертого семестра. Этот предмет на старших курсах перетекает в научно-исследовательскую и в дальнейшем в дипломную работу, что показывает важность и сложность дисциплины», — приводит пример Виктория Лобанова.

По словам разработчиков модели, полученная с ее помощью информация поможет студентам, преподавателям и кураторам вовремя обратить внимание на проблемы и исправить ситуацию. 

«Томский политех идет по пути цифровизации уже более 15 лет, и в вузе накоплен огромный массив разнообразных данных. Сейчас мы храним порядка 450 Гб, и их анализ очень важен. Этим летом мы предложили студентам Инженерной школы информационных технологий и робототехники в качестве летней практики разработать собственные проекты и поработать с инструментами анализа больших данных. Для них это новая тема, и ребята отнеслись к задаче очень ответственно. В итоге за дело взялись 26 студентов. Тему каждый для себя выбрал сам. Для работы мы предоставили им пакеты данных — все они были предварительно деперсонализированы», — отмечает проректор ТПУ по цифровизации Александр Фадеев.

Студенты, выбравшие такой вариант прохождения летней практики, в течение четырех недель прорабатывали свои проекты вместе с преподавателями вуза и приглашенными экспертами.

«Например, мы пригласили в качестве эксперта проректора по науке и технологиям Сургутского госуниверситета Ростислава Яворского. Он сильный специалист в области анализа данных, — говорит Александр Фадеев. — В итоге студенты представили целый ряд очень толковых проектов. Модель для прогнозирования отчисления студентов, безусловно, к таким относится. Это не будет работа "в стол", в каком-то виде идеи студентов будут реализованы в университете».