Такой инструмент позволяет снизить нагрузку на аналитиков и автоматизировать рутинные задачи. Для разработки необходимо было протестировать различные нейросетевые модели классификации текста, которые сумеют справиться с задачей достаточно точно и быстро, ведь важно, чтобы обработка больших объемов сообщений происходила в режиме реального времени. Отметим, что для обучения моделей использовались обезличенные архивные данные. Согласно требованиям, система должна работать исключительно в пределах аналитического центра и незапрашивать внешнего сетевого подключения.
Программный инструмент представили старший преподаватель кафедры прикладной информатики Института информационных технологий и программирования ГУАП Виктория Боженко, студенты института Матвей Головкин, Максим Иванов, Даниил Суббота.
Председатель Комитета территориального развития Санкт-Петербурга Денис Царегородцев открыл мероприятие приветственным словом вице-губернатора Санкт-Петербурга Натальи Чечиной:
- Президент Российской Федерации Владимир Владимирович Путин подчеркнул: России необходимо обеспечивать стабильность и независимость национальной цифровой инфраструктуры, в том числе с использованием собственных базовых разработок. Желаю вам успехов в реализации намеченных планов и дальнейшей совместной плодотворной работы!
В своем выступлении Денис Царегородцев отметил:
- Санкт-Петербург всегда был и остается одним из научных и инновационных центров России. Проект «Наука и новые технологии» является одним из 10 приоритетов развития нашего города на ближайшее время. По словам Губернатора Санкт-Петербурга Александра Беглова, к ключевым задачам этого проекта относятся развитие отечественных информационных технологий и повышение уровня цифровизации. Вместе с тем Правительство Санкт-Петербурга уделяет особое внимание развитию обратной связи с жителями, это позволяет исполнительным органам государственной власти оперативно принимать необходимые меры и качественно решать актуальные проблемы петербуржцев. В свою очередь, качество аналитической работы непосредственно влияет на обоснованность принятия управленческих решений. Выражаю искреннюю благодарность университету, коллективу талантливых преподавателей и студентов Института информационных технологий и программирования, которые, не жалея своего свободного времени, отнеслись с пониманием к важности задачи, предложенной для совместного решения.
Выразила слова благодарности и ректор Санкт-Петербургского государственного университета аэрокосмического приборостроения Юлия Антохина:
- Высокая оценка достижений наших студентов особенно важна в этот юбилейный для университета год, когда мы отмечаем 85-летие ЛАИ-ЛИАП-ГУАП. Безусловно, успехи наших студентов невозможны без наставников и преподавательского состава. Их роль в этом процессе исключительно важна — именно профессионализм и личный пример педагогов вдохновляют и направляют. Это большое достижение и радость для всей команды преподавателей: они не только подготовили таких талантливых ребят, но и мотивировали их своим профессионализмом и личным примером. Важно, что проект выполнялся в рамках программы «Обучение служением». Надеемся, что этот проект станет лишь началом, и в будущем мы сможем реализовать еще много подобных инициатив. Мы готовы продемонстрировать компетенции нашего профессорско-преподавательского состава, научных школ и студентов не только в рамках этого проекта, но и в других направлениях. Мы открыты к сотрудничеству и готовы вместе двигаться вперед, — отметила ректор ГУАП.
Разработчики проекта подробно рассказали о принципе работы программного продукта.
- Для реализации системы был выбран язык программирования Python, как наиболее эффективное и сбалансированное решение. Принцип работы системы заключается в следующем: пользователь загружает заранее подготовленный файл с набором сообщений, затем происходит обработка с помощью алгоритмов нейронной сети. В результате система возвращает один из отраслевых блоков для каждого из сообщений. Исходное сообщение гражданина поступает из системы BI: ЦУР РФ. Текст сообщения преобразуется в числовой вектор, затем происходит векторный поиск. Этот этап достаточно быстро автоматизирует обработку примерно 70% сообщений, однако остаются сложные примеры — сообщения, которые векторный поиск не может определить. Поэтому оставшиеся сообщения поступают для классификации в нейронную сеть. При этом примерно 5% сообщений отправляются экспертам на ручную проверку и обработку, — пояснил участник команды Матвей Головкин.