НИУ ВШЭ — лидер среди российских вузов по количеству очных онлайн-программ и обучающихся на них студентов. В 2013 году были запущены первые онлайн-курсы на базе университета, а через 7 лет открылся набор на первую программу онлайн-магистратуры. В 2024 году запущено 28 онлайн-магистратур и 5 онлайн-бакалавриатов.
В активном развитии онлайн-высшего образования вузу помогает применение аналитики больших данных, которая, например, позволяет спрогнозировать потенциальный набор на программы магистратуры и выявить наиболее востребованные компетенции. Как это работает?
Роль больших данных в современном вузе
В 2023 году российский рынок предлагал 492 программы высшего образования в онлайн-формате от 39 «провайдеров» — государственных университетов, частных вузов и EdTech-платформ. Год от года конкуренция растет, каждому «провайдеру» приходится принимать все больше решений при формировании линейки программ, их продвижении и реализации.
Лидерами рынка станут те акторы, которые научатся использовать не только экспертные мнения своей команды для принятия решений, но и собирать, структурировать, анализировать данные на всех этапах жизненного цикла программ для оптимизации затрат и повышения качества своих образовательных продуктов.
Как мы работаем с большими данными?
В 2023 году в Высшей школе экономики появился собственный цифровой кампус — «Вышка Онлайн», где сосредоточены онлайн-программы бакалавриата, магистратуры и дополнительного образования. Нам было важно просчитать потенциальный поток студентов, чтобы узнать, какие программы были бы наиболее востребованы в онлайн-формате. Мы разработали модель машинного обучения, которая позволила нам выявить корреляции и закономерности в наборе и даже предсказать, каким он будет в сезон подачи заявлений на поступление.
В построенной модели крайне важно выделить два ключевых этапа.
Сбор, очистка и подготовка данных для модели. Для этого мы собрали основные признаки программ, которые могут быть важны при выборе для абитуриента. Например: название программы, наличие бюджетных мест, направление подготовки, стоимость стоимость обучения, ключевые результаты в части осваиваемых компетенций и другие характеристики. Также в модель были загружены данные приемных кампаний последних лет.
Генерация и проверка гипотез. Исходя из бизнес-вводных, например, идей в части запускаемых программ от разных структурных подразделений, задач по балансу линейки продуктов, по набору студентов на определенные программы, мы сформулировали гипотезы, которые затем исследовали с помощью построенной модели. Например, это помогло вычислить корреляцию между исследуемым списком признаков и набором абитуриентов.
Так, одним из результатов исследований в этом году стал инсайт, что среди всех направлений программ больший успех будут иметь продукты, связанные с психологией. На основе этого вывода было принято решение о запуске магистратур по психологии в онлайн-формате.
По итогам тестирования модели на данных прошлых наборов мы выяснили, что она способна предсказывать количество абитуриентов, поступающих на программу, с точностью до десяти человек по метрике MAE.
Помимо задачи формирования портфеля программ, мы используем анализ данных и модели машинного обучения, включая большие языковые модели, часто именуемые ныне как «ИИ», на этапе продвижения программ. Например, это помогает с анализом конверсий на лендингах, решением по распределению рекламных средств по каналам, рекомендациями бота, у которого абитуриент может узнать какие программы ему больше всего подходят. Конечно, это полезно и на этапе реализации программ — бот онбординга для студентов умеет отвечать на текстовые вопросы пользователей в свободной форме.
Результат применения таков, что уже сейчас мы можем ориентироваться на данные сразу в нескольких задачах: запуск программ и распределение маркетинговых бюджетов между ними. Кроме того, data-driven подход помогает улучшить и уже существующие программы и рекламные кампании, предоставляя данные лендингов, названий и описаний с точки зрения их привлекательности для потенциальных абитуриентов.
Перспективы применения
В научной фантастике, которая в наши дни звучит уже не так фантастично, можно найти много картин того, как большие данные и ИИ изменят образование. Сейчас в мире идет широкое экспертное обсуждение о том, как использовать большие языковые модели и другие модели машинного обучения внутри образовательного процесса, например, в качестве персональных тьюторов, для составления задач и их оценивания, для многомодального обучения, в котором есть аудио, видео, тексты. Но важно не забывать также и о «внутренних процессах», которые не видны обучающимся и сторонним наблюдателям.
Анализ данных, применение к ним моделей машинного обучения — сильнейший инструмент для команд, создающих продукты. Чтобы работать с большими данными, нужно четко понимать, для чего именно они нужны. Без конкретных бизнес-задач и гипотез — это просто набор различных фактов и паттернов.
В нашем случае мы ориентировались на увеличение эффективности принятия управленческих решений, через призму увеличения набора на программы онлайн-кампуса НИУ ВШЭ. Также мы ведем работу над тем, чтобы машинное обучение и большие данные помогали оптимизировать затраты.
Так, модель, которая с каждой приемной кампанией будет все лучше понимать спрос и корректировать предложение, позволит оптимизировать экономику продуктовой линейки, показывая нам, что именно хотят абитуриенты, на какие программы стоит сделать наибольшую ставку. При этом, данный подход к запуску продукта работает не только в образовательный сфере, но и для бизнеса в любой нише.
Конечно, в масштабах всего образовательного рынка такая цифровая трансформация проходит неравномерно, и если где-то технологии сопровождают весь образовательный опыт студента, то в некоторых государственных и частных вузах только начинается цифровизация и автоматизация процессов. И тем не менее, интеграция в цифровой мир — необходимое условие для выживания провайдеров высшего образования. Новые технологии делают многие процессы удобнее, понятнее и эффективнее, причем не только для студентов и преподавателей, но и для команд, разрабатывающих новые образовательные продукты.
Советы для продавцов маркетплейсов перед Новым годом
Как использование больших данных помогает принимать важные решения в ваших проектах?
Яков, было интересно?)
Яков, ответы на какие вопросы хотел бы узнать? :)
Как-то очень быстро закончилась статья.