О проекте

About Project

История и развитие проекта

Проект EduText Analyzer развивается с 2025 года. Его идея возникла в академической среде в процессе изучения лингводидактики и анализа реальных учебников по иностранным языкам.

Отправной точкой стала исследовательская задача: проверить, насколько учебные материалы действительно соответствуют заявленным методическим принципам, прежде всего принципу коммуникативной направленности обучения. Для этого потребовался инструмент, способный автоматически анализировать тексты и задания учебников, опираясь не на интуицию, а на данные.

От идеи к рабочей системе

Первый этап развития проекта был связан с созданием rule-based классификатора упражнений. На основе типичных формулировок заданий был собран корпус инструкций, что позволило автоматически классифицировать упражнения в ряде учебников начальной школы (включая Spotlight, Starlight и Rainbow English).

Следующим шагом стал переход от правил к данным. В рамках проекта была обучена модель на основе логистической регрессии, способная автоматически определять тип упражнения по его формулировке. Это позволило:

  • повысить устойчивость классификации,
  • масштабировать анализ на большие объёмы данных,
  • заложить основу для дальнейшего применения методов машинного обучения.

Параллельно велась работа по формализации методики и подготовке результатов к публикации в научном формате.

Научные результаты и публикации

В рамках проекта были проведены исследования, посвящённые:

  • рецептивной (пассивной) лексике и её повторяемости в учебниках,
  • количественному анализу лексической сложности,
  • оценке сложности учебных текстов с использованием индексов читаемости.

Исследования опираются на автоматизированный подсчёт частот, уровневую классификацию лексики и воспроизводимые алгоритмы анализа.

Выступления, конкурсы и научные мероприятия

Проект был представлен на ряде научных и образовательных площадок.

В 2025 году команда:

  • получила первый грант в рамках конкурса Стартап Пикник от Предпринимательской студии НИУ МИЭТ,
  • стала победителем Science Slam в НИУ МИЭТ,
  • представляла проект на научных и технологических мероприятиях (включая события, посвящённые машинному обучению и ИИ),
  • принимала участие в конкурсах грантовых программ, получив ценный опыт подготовки заявок и экспертизы проектов.

Проект развивается итеративно и ориентирован на долгосрочный рост.

Сообщество и научная коммуникация

Вокруг EduText Analyzer постепенно формируется сообщество. В рамках проекта:

  • опубликованы первые статьи на Habr, получившие высокий отклик,
  • запущены ML Lab Talks - онлайн-встречи, посвящённые машинному обучению и его прикладному использованию,
  • ведётся образовательный и научно-популярный контент в социальных сетях,
  • проект был представлен в студенческих и научных сообществах, а также в профильных медиа.

Команда проекта

EduText Analyzer - это междисциплинарная команда, объединяющая методику преподавания языков, анализ данных и разработку:

  • Никита - разработчик, отвечающий за техническую инфраструктуру,
  • Леша - разработчик, отвечающий за программную реализацию аналитических модулей,
  • Кристина - аналитик данных, работающая с корпусами и количественными показателями,
  • Дарья - NLP-инженер, разработка моделей и метрик анализа,
  • Наталия Леонидовна - методист, научное и методическое сопровождение проекта,
  • Полина - дизайнер, визуальная идентичность проекта,
  • Анастасия - SMM-специалист, научно-популярная коммуникация,
  • Лена - NLP-инженер, исследователь, координация разработки и научных направлений.

Небольшая по численности команда позволяет сохранять гибкость, тесное взаимодействие и фокус на качестве исследований.

Перспектива

EduText Analyzer рассматривается как основа для масштабируемой платформы анализа учебных материалов не только по иностранным языкам, но и по другим учебным предметам. Проект сочетает академическую строгость, современные технологии и практическую направленность.