О проекте

История и развитие проекта
Проект EduText Analyzer развивается с 2025 года. Его идея возникла в академической среде в процессе изучения лингводидактики и анализа реальных учебников по иностранным языкам.
Отправной точкой стала исследовательская задача: проверить, насколько учебные материалы действительно соответствуют заявленным методическим принципам, прежде всего принципу коммуникативной направленности обучения. Для этого потребовался инструмент, способный автоматически анализировать тексты и задания учебников, опираясь не на интуицию, а на данные.
От идеи к рабочей системе
Первый этап развития проекта был связан с созданием rule-based классификатора упражнений. На основе типичных формулировок заданий был собран корпус инструкций, что позволило автоматически классифицировать упражнения в ряде учебников начальной школы (включая Spotlight, Starlight и Rainbow English).
Следующим шагом стал переход от правил к данным. В рамках проекта была обучена модель на основе логистической регрессии, способная автоматически определять тип упражнения по его формулировке. Это позволило:
- повысить устойчивость классификации,
- масштабировать анализ на большие объёмы данных,
- заложить основу для дальнейшего применения методов машинного обучения.
Параллельно велась работа по формализации методики и подготовке результатов к публикации в научном формате.
Научные результаты и публикации
В рамках проекта были проведены исследования, посвящённые:
- рецептивной (пассивной) лексике и её повторяемости в учебниках,
- количественному анализу лексической сложности,
- оценке сложности учебных текстов с использованием индексов читаемости.
Исследования опираются на автоматизированный подсчёт частот, уровневую классификацию лексики и воспроизводимые алгоритмы анализа.
Выступления, конкурсы и научные мероприятия
Проект был представлен на ряде научных и образовательных площадок.
В 2025 году команда:
- получила первый грант в рамках конкурса Стартап Пикник от Предпринимательской студии НИУ МИЭТ,
- стала победителем Science Slam в НИУ МИЭТ,
- представляла проект на научных и технологических мероприятиях (включая события, посвящённые машинному обучению и ИИ),
- принимала участие в конкурсах грантовых программ, получив ценный опыт подготовки заявок и экспертизы проектов.
Проект развивается итеративно и ориентирован на долгосрочный рост.
Сообщество и научная коммуникация
Вокруг EduText Analyzer постепенно формируется сообщество. В рамках проекта:
- опубликованы первые статьи на Habr, получившие высокий отклик,
- запущены ML Lab Talks - онлайн-встречи, посвящённые машинному обучению и его прикладному использованию,
- ведётся образовательный и научно-популярный контент в социальных сетях,
- проект был представлен в студенческих и научных сообществах, а также в профильных медиа.
Команда проекта
EduText Analyzer - это междисциплинарная команда, объединяющая методику преподавания языков, анализ данных и разработку:
- Никита - разработчик, отвечающий за техническую инфраструктуру,
- Леша - разработчик, отвечающий за программную реализацию аналитических модулей,
- Кристина - аналитик данных, работающая с корпусами и количественными показателями,
- Дарья - NLP-инженер, разработка моделей и метрик анализа,
- Наталия Леонидовна - методист, научное и методическое сопровождение проекта,
- Полина - дизайнер, визуальная идентичность проекта,
- Анастасия - SMM-специалист, научно-популярная коммуникация,
- Лена - NLP-инженер, исследователь, координация разработки и научных направлений.
Небольшая по численности команда позволяет сохранять гибкость, тесное взаимодействие и фокус на качестве исследований.
Перспектива
EduText Analyzer рассматривается как основа для масштабируемой платформы анализа учебных материалов не только по иностранным языкам, но и по другим учебным предметам. Проект сочетает академическую строгость, современные технологии и практическую направленность.