Санкт-Петербург, г. Санкт-Петербург и Ленинградская область, Россия
Санкт-Петербург, Россия
УДК 004.9 Прикладные информационные (компьютерные) технологии
В статье рассмотрен подход к формированию рекомендаций по изучению иностранных языков с помощью мобильных приложений на основе анализа культурных контекстов образовательных данных пользователей. Проведен анализ специфики изучения иностранных языков в различных существующих образовательных сервисах. Особое внимание уделено анализу культурных данных на примере профессиональных культур для определения специфики дизайна профессионально направленных программных обучающих сервисов. По результатам проведенного в работе анализа были сформированы рекомендации для изучения иностранных языков для различных категорий специалистов, а также сформулированы требования к дизайну таких обучающих сервисов. Перспективой дальнейших исследований является необходимость учёта языковой картины мира, которая согласно исследованиям А.А. Леонтьева, имеет трехуровневый характер и включает, в том числе, психологический и эргономический планы. Эргономическая и психологическая составляющие позволят обеспечить требуемый уровень знания иностранного языка будущим специалистом с учётом профессиональных и культурных контекстов образовательных данных.
культурный контекст, образовательные данные, психолингвистика, мобильные приложения, уровень знаний обучающая программа
Введение.
Современное образование нацелено на максимальную индивидуализацию, стремление сделать процесс обучения комфортным и учитывающим различные факторы, влияющие на успешность процесса обучения [1-4]. Стадия дизайна (проектирования) информационных систем должна охватывать учет большого количества требований, особенно в сфере информатизации образования, в том числе требования по контенту, структуре обучающего приложения. Анализ данных позволяет выявить нетривиальные зависимости особенностей аудитории, контента, локализации и других факторов, которые позволят сделать дизайн информационной системы менее трудоемким и более эффективным.
В нашем мире присутствует бесчисленное количество различных культур и народов. Многообразие наций порождает большой спектр языков, на которых разговаривают люди. Как следствие процесса всемирной интеграции, когда аспекты различных сфер жизни отдельных стран приобретают глобальный масштаб, возникает все больше взаимодействий среди людей. Многие начинают изучать иностранные языки [5]. Вследствие этого расширяются границы их мышления, так как в обиход приходят понятия, которых нет в реальности человека и которые, соответственно, трудно перевести. Происходит оказание положительного влияния на умственные способности человека. Также существует множество профессий, для которых знание иностранного языка – это необходимость. Ведь множество материалов могут быть не переведены на родной язык человека.
С появлением информационных технологий одним из популярнейших способов для изучения иностранных языков стали мобильные приложения. В настоящий момент данные программные средства предоставляют большой выбор упражнений для обучающихся. Множество людей не имеют достаточного количества времени и материальных ресурсов для того, чтобы посещать полноценные языковые курсы. Так что мобильные приложения являются единственной возможностью обучения для данных потребителей [6]. Также программные средства, позволяющие изучать иностранные языки, могут быть дополнением к основному учебному процессу [7], ведь они позволяют больше прорабатывать различные аспекты языка. Мобильные приложения дают возможность сделать обучение более увлекательным и гибким, а пользователи могут развивать свои навыки в любое удобное для них время.
Работа с данными
Для сбора данных с Amazon были использованы два инструмента: Amazon Reviews Scraper [8] (извлечение данных об отзывах на специализированную литературу) и Amazon Product Scraper [9] (извлечение описания специализированной литературы). При парсинге отзывов на приложения из Google Play был использован пакет google_play_scraper [10].
Далее были осуществлены следующие шаги по предобработке и очистке данных:
- выбор необходимых столбцов или удаление неиспользуемых столбцов,
- перевод отзывов на английский язык,
- приведение к нижнему регистру,
- удаление пунктуации,
- токенизация,
- фильтрация по частоте/длине/соответствию регулярному выражению,
- лемматизация,
- векторизация,
- удаление стоп-слов [11].
Анализ данных
1. Анализ тональности
Анализ тональности отзывов является одним из ключевых способов оценки мнения об определенном продукте или услуге [12]. Чаще всего присутствует три категории: положительные, нейтральные и негативные тексты. Результаты анализа тональности позволяют обращать внимание на сильные и слабые аспекты товара или услуги, а также подготовить рекомендации для пользователей [13].
На основе языка Python была сформирована функция [14], позволяющая оценить эмоциональную окраску отзывов на приложения и на специализированную литературу. Выделяется три категории тональности: положительная, нейтральная, негативная. Результаты анализа были добавлены в новый столбец result. Таким образом, была получена таблица (рис.1).
Рис. 1. Пример датасета со столбцом тональности
Fig. 1. An example of a dataset with a key column
Было принято решение отделения положительных отзывов на литературу для представителей различных специальностей, с целью выявления тем, которые нравятся специалистам в подходах, предоставляемых авторами литературы. При анализе отзывов на приложения по изучению иностранных языков также были использованы выделенные как положительные отзывы пользователей. Данный подход необходим для более точного соотнесения аспектов специализированной литературы и ПО.
2. Тематическое моделирование
Тематическое моделирование является одним из важнейших методов при анализе отзывов. Данное средство используется для выявления основных тем и аспектов, которые встречаются в тексте [15]. Тематическое моделирование позволяет находить скрытые паттерны и тенденции, на основе которых можно делать выводы о предпочтениях и потребностях пользователей.
В ходе данной работы тематическое моделирование были применено относительно положительно оцененных отзывов на литературу по изучению иностранного языка для представителей разных сфера, а также отзывов на приложения по изучению иностранных языков.
Создается словарь с полученными во время векторизации триграммами. Затем определяется частота документа в корпусе, и строится тематическая модель с указанием количества тем. Далее темы визуализируются.
Сначала было проведено тематическое моделирование для положительных отзывов на специализированную литературу. Это позволило выявить по три темы для каждого из пяти культурных контекстов. На графике представлена LDA модель для медицинских специалистов (рис.2).
Рис. 2. Тематическое моделирование на основе позитивных отзывов на литературу для изучения иностранных языков для медицинских специалистов
Fig. 2. Thematic modeling based on positive reviews of literature for learning foreign languages for medical professionals
По выделенным словам, был составлен список тем, встречающихся в отзывах на специализированную литературу по изучению английского языка для медицинских специалистов:
- специальная терминология,
- базовая, полезная информация,
- практика словарного запаса.
Аналогично были выявлены основные мотивы отзывов на литературу для других специалистов. Далее для поддержания сделанных выводов относительно ключевых аспектов для различных профессий было также создано тематическое моделирование на основе описания специализированный литературы. Для каждого культурного контекста была построена LDA модель. На рис.3 представлен график, показывающий результаты анализа описания учебников по изучению английского языка для медицинских специалистов.
Рис. 3. Тематическое моделирование на описания литературы по изучению иностранных языков для медицинских специалистов
Fig. 3. Thematic modeling based on literature descriptions on learning foreign languages for medical professionals
Был выделен следующий список тем:
- изучение идиом и фраз,
- изучение определенных тем и слов,
- разговорный язык для общения с пациентами.
Для каждой из выбранных профессий было дважды составлено тематическое моделирование, это позволило выявить больше аспектов, отличающих представителей разных специальностей, при изучении иностранных языков. Для IT специалист ключевыми являются факторы:
– умение коммуницировать посредством письменной и разговорной речи,
– присутствие грамотности в речи,
– хорошее владение грамматикой и наличие большого словарный запаса.
Для медицинского специалиста важнейшими являются аспекты:
– разговорный язык для общения с пациентами,
– знание специальной терминологии и идиом,
– развитие словарного запаса. По выделенным словам был составлен список тем, встречающихся в отзывах на HiNative:
- постановка вопроса, получение ответа,
- носители языка,
сообщество и люди в нем.
Для маркетолога ключевыми являются факторы:
– хорошее владение грамматикой,
– письменная и разговорная коммуникация,
– знание различных слов и выражений.
Для бизнесмена важнейшими являются аспекты:
– знание терминологии, идиом и грамматики,
– письменная коммуникация,
– следование тенденциям и совершенствование навыков.
Для юриста ключевыми являются факторы:
– навыки чтения,
– развитие словарного запаса,
– письменная коммуникация.
Далее было составлено тематическое моделирование для положительных отзывов на приложения по изучению иностранных языков. Было выделено по три темы для каждого ПО. На рис. 4. представлена LDA модель для приложения HiNative.
Аналогично были выявлены основные мотивы отзывов на другие приложения по изучению иностранных языков:
- Duolingo:
- продолжение обучения;
- новый элемент в уроках;
- простой в использовании язык;
- Babbel:
- разговор с использованием голоса;
- программа обучения грамматике;
- понятные объяснения;
- Busuu:
- использование слов;
- изучение грамматики и прохождение тестов;
- практика языка;
Рис. 4. Тематическое моделирование на положительный отзыв на приложение HiNative
Fig. 4. Thematic modeling based on a positive review of the HiNative application
- Rosetta Stone:
- перевод слов;
- новые методы обучения;
- разговорная практика;
- Mondly:
- простой в использовании язык;
- система обучения;
- дружелюбное и понятное обучение;
- HelloTalk:
- разговор голосом;
- нахождение друзей;
- разговорная практика;
- Drops:
- словарный запас;
- интересное времяпрепровождение;
- использование слов в жизни;
- Pimsleur:
- простой в разговоре язык;
- аудирование;
- практика произношения;
- Lirica:
- музыка и песни;
- текстовая составляющая песни;
- слова и грамматика.
Заключение
По результатам проведенного в работе анализа были сформированы рекомендации для изучения иностранных языков для специалистов.
Для IT специалиста подойдут следующие ПО:
– Babbel, Rosetta Stone можно использовать для практики разговорной речи,
– с помощью HiNative появится возможность оценить грамотность благодаря общению с носителями языка,
– при использовании Babbel, Busuu, Lirica можно изучить грамматические конструкции,
– Drops позволит пополнить словарный запас.
Для медицинского специалиста будут полезны приложения:
– Duolingo, Pimsleur, Mondly позволят овладеть простым языком, который необходим при общении с пациентами,
– с помощью Babbel, HelloTalk появится возможность практики разговорного языка,
– благодаря HiNative, HelloTalk можно изучить специальную терминологию и идиомы,
– Busuu, Drops позволят пополнить словарный запас,
– также дополнительно можно обратить внимание на упражнения по чтению, представленные в Pimsleur, и упражнения по грамматике в приложениях Pimsleur, Busuu, Babbel, Drops.
Для маркетолога подойдут следующие ПО:
– при использовании Babbel, Busuu можно изучить грамматические конструкции,
– Babbel, HelloTalk, Pimsleur, Rosetta Stone можно использовать для практики разговорной речи,
– с помощью Busuu, Drops появится возможность пополнить словарный запас,
– также дополнительно можно обратить внимание на упражнения по чтению, представленные в Pimsleur, и упражнения по грамматике в приложениях Pimsleur, Drops.
Для бизнесмена будут полезны приложения:
– благодаря HiNative можно изучить специальную терминологию и идиомы,
– при использовании Babbel, Busuu можно изучить грамматические конструкции,
– Lirica позволит обратить внимания на тенденции, так как в данном ПО присутствуют музыка и тексты,
– также дополнительно можно обратить внимание на упражнения по чтению, представленные в Pimsleur, упражнения по грамматике в приложениях Pimsleur, Drops, упражнения по аудированию, находящиеся в Pimsleur, Lirica, и упражнения, направленные на развитие навыков письма в Pimsleur.
Для юриста подойдут следующие ПО:
– с помощью Lirica, HiNative появится возможность развития навыков чтения,
– Busuu, Drops позволят пополнить словарный запас,
– также дополнительно можно обратить внимание на упражнения по чтению, представленные в Pimsleur, и упражнения по грамматике в приложениях Pimsleur, Busuu, Babbel, Drops, и упражнения, направленные на развитие навыков письма в Pimsleur.
1. Lalaeng Ch., Subongkod M., Sinlapasawet M. Individual competency causal factors affecting performance of academic personnel in higher education institution. Procedia Computer Science. 2024;237:502-509. DOIhttps://doi.org/10.1016/j.procs.2024.05.133. EDN JYJMAR.
2. Jaruseviciute V., Silinskas G., Muotka J., Kiuru N. Trajectories of adolescents' adjustment behaviors across the transition to upper secondary education: The role of individual and environmental factors. Learning and Individual Differences. 2024;112:102457. DOIhttps://doi.org/10.1016/j.lindif.2024.102457.
3. Sormani E., van der Sijde P. Configuring motivational pathways to manage academics’ individual motivation for engagement: Insights from German higher education institutions. Journal of Engineering and Technology Management. 2023;69:101768. DOIhttps://doi.org/10.1016/j.jengtecman.2023.101768.
4. Сафронова И.В. Индивидуализация образовательного процесса как условие повышения качества образовательных услуг // Фундаментальные и прикладные исследования: проблемы и результаты. 2012. № 1. С. 102-107. EDN RDMPRZ.
5. Никонова Е.Н. Роль иностранного языка в эпоху глобализаций // Grand Altai Research & Education. 2017. № 2. С. 38-42. EDN YNNVRK.
6. Бобылева Г.А., Бормосова Н.Е., Афанасьева Е.Г. и др. Применение мобильных приложений в процессе обучения иностранному языку // Ученые записки университета им. П.Ф. Лесгафта. 2021. № 10(200). С. 33-37. DOIhttps://doi.org/10.34835/issn.2308-1961.2021.10.p33-37. EDN GITXVN.
7. Канцур А.Г., Бердникова Н.С. Использование мобильных приложений на уроках иностранного языка // Проблемы романо-германской филологии, педагогики и методики преподавания иностранных языков. 2019. № 15. С. 75-80. EDN YGETKI.
8. Amazon Reviews Scraper. Apify. URL: https://console.apify.com/actors/R8WeJwLuzLZ6g4Bkk/input (дата обращения: 30.11.2024).
9. Amazon Product Scraper. HasData. URL: https://app.hasdata.com/marketplace/23 (дата обращения: 30.11.2024).
10. Google-Play-Scraper // PyPI URL: https://pypi.org/project/google-play-scraper/ (дата обращения: 30.11.2024).
11. Обработка естественного языка. Ifmo. URL: https://neerc.ifmo.ru/wiki/index.php?title=Обработка_естественного_языка (дата обращения: 30.11.2024).
12. Акжолов Р.К., Верига А.В. Анализ тональности текста // Вестник науки. 2019. Т. 4, № 9(18). С. 29-31. EDN CDQZRU.
13. Трофимова Е.В., Туральчук К.А. Разработка рекомендательной системы на основе анализа тональности текста // Актуальные проблемы гуманитарных и естественных наук. 2015. №1-1. С. 93-94. EDN TILCLD.
14. TextBlob: Simplified Text Processing. URL: https://textblob.readthedocs.io/en/dev/ (дата обращения: 30.11.2024).
15. Коршунов А., Гомзин А. Тематическое моделирование текстов на естественном языке // Труды Института системного программирования РАН. 2012. №23. EDN PLUXDR.