Preview

Oriental Studies

Расширенный поиск

Категориально-семантическая нотация базовых лексем монгольского языка в количественном освещении

https://doi.org/10.22162/2619-0990-2019-46-6-1156-1175

Аннотация

В статье задаётся категориально-семантическая нотация словоформ базовых лексем монгольского языка; эти словоформы охарактеризованы по их встречаемости. В статье приводится список, содержащий базовую лексику современного монгольского языка (454 словоформы). Материалы и методы. Подсчет частотности словоформ вёлся на материале Генерального корпуса современного монгольского языка (ГКМЯ). Настоящая работа опирается на те же принципы квантитативной монголистики, что и предшествующие работы автора. Однако наиболее оригинальной особенностью данной словарной таблицы является наличие в ней особой категориально-семантической нотации. Такая нотация ориентирована на разработку семантической типологии языков мира. Она рассчитана на потенциальную типологическую сопоставимость данного базового лексикона с аналогично построенными базовыми лексиконами других языков мира. В статье приводятся базовые 454 словоформы современного монгольского языка, употребительные в ГКМЯ-1а: абсолютная частотность в ГКМЯ превышает 255, а относительная ― соответственно 220 ipm. (I.) Имя словоформы в квази-орфографической записи. Квази-орфографическая запись отличается от собственно орфографической снятием всех различий по регистру (заглавности/строчности). (II.) Обобщённая грамматема (т. е. сюда включаются не только собственно грамматемы, но и пучки омографических грамматем). (III.) Обобщённая лексема (т. е. сюда включаются не только собственно лексемы, но и пучки омографических лексем). (IV.) Семантическая помета-глосса, приписанная соответствующей словоформе или лексеме (строго говоря, она приписана одному из членов пучка омографических сегментов, совпадающему с именем словоформы). Этот столбец имеет функцию неформального мнемонического напоминания пользователю-типологу (особенно не знакомому с монгольским языком), какое лексическое значение имеет данная словоформа. (V.) Категориально-семантическая помета, приписываемая данной словоформе (точнее говоря, пучку омографических словоформ) в ГКМЯ. Этот столбец в данной таблице является ключевым. (VI.) Абсолютная частотность словоформы (точнее говоря, пучка омографических словоформ) в ГКМЯ-1а. (VII.) Ранг словоформы (точнее говоря, пучка омографических словоформ) в ГКМЯ-1а. (VIII.) Количество текстов из ГКМЯ-1а, в которых данная словоформа (точнее говоря, пучок омографических словоформ) встречается. (IX.) Ранг словоформы (точнее говоря, пучка омографических словоформ) в частотном словаре, упорядоченным по убыванию количества текстов из ГКМЯ-1а. Категориально-семантическая нотация словоформ базовых лексем монгольского языка представлена в виде таблицы, упорядоченной по прямому алфавитному порядку категориально-семантических помет.

Об авторе

Сергей Александрович Крылов
Институт востоковедения РАН
Россия
доктор филологических наук, ведущий научный сотрудник


Список литературы

1. Крылов 2004 ― Крылов С. А. Теоретическая грамматика современного монгольского языка и смежные проблемы общей лингвистики. Ч. 1. Морфемика, морфонология, элементы фонологической трансформаторики (в аспекте общей теории морфологических и морфонологических моделей) М.: Вост. лит., 2004. 479 с.

2. Крылов 2012а ― Крылов С. А. Структурно-вероятностная модель монгольского языка на базе Генерального корпуса современного монгольского языка // Дыбо А. В. (отв. ред.). Урало-алтайские исследования. № 1(6), 2012. С. 78–105.

3. Крылов 2012б ― Крылов С. А. The general corpus of the modern Mongolian language and its structural-probabilistic model // Кибрик А. Е. (гл. ред.). Компьютерная лингвистика и интеллектуальные технологии: По мат-лам ежегодн. Междунар. конф. «Диалог» (с. Бекасово, 30 мая – 3 июня 2012 г.). Вып. 11 (18). М.: Изд-во РГГУ, 2012. С. 331–341.

4. Крылов 2013 ― Крылов С. А. Опыт изучения современного монгольского языка в количественном освещении // Николаева Т. М. (отв. ред.). Вопросы языкознания, № 5, 2013. С. 46–57.

5. Крылов 2014 ― Крылов С. А. Теоретическая грамматика монгольского языка и смежные проблемы общей лингвистики: (в 6 ч.) Ч. 2. Структурно-вероятностная модель современного монгольского языка (на базе Генерального корпуса современного монгольского языка). М.: Наука, Вост. лит., 2014. 637 с.

6. Крылов, Дыбо, Шеймович 2015 — Крылов С. А., Дыбо А. В., Шеймович А. В. Some possibilities of semantic and etymological tagging of corpora for turkic languages (= Некоторые возможности семантической и этимологической разметки для корпусов тюркских языков (расстановка семантических тэгов в электронном хакасско-русском словаре)) // Сб. тр. междунар. конф. TurkLang – 2015 (Turkic Languages Processing: TurkLang 2015). Казань, 2015. С. 304–327.

7. Крылов, Дыбо, Шеймович 2016 ― Крылов С. А., Дыбо А. В., Шеймович А. В. Расстановка семантических и деривационных тэгов в электронном хакасско-русском словаре // Российская тюркология, 2016, № 2. С. 28–39.

8. Крылов 2016 ― Крылов С. А. О принципах синтаксического анализа в сводном корпусе монгольских языков // Гуманитарная наука Юга России: международное и региональное взаимодействие. Мат-лы II Междунар. науч. конф., посвященной 75-летию Калмыцкого института гуманитарных исследований РАН (г. Элиста, 14–15 сент. 2016 г.) Элиста: КИГИ РАН, 2016. С. 198–199.

9. Крылов 2017а ― Крылов С. А. Сочетаемость монгольских синтетических словоформ: количественный аспект // Вестник Калмыцкого института гуманитарных исследований РАН. 2017. № 4. С. 108–133.

10. Крылов 2017б ― Крылов С. А. Монгольские аналитические конструкции в количественном аспекте // Вестник Калмыцкого института гуманитарных исследований РАН. 2017. № 5. С. 155–179.

11. Крылов 2017в ― Крылов С. А. Монгольские аналитические словоформы: опыт лингвостатистического исследования // Куканова В. В. (отв. ред.). Вестник Калмыцкого института гуманитарных исследований РАН. 2017. № 6. С. 79–93.

12. Крылов 2018а ― Крылов С. А. Опыт дистрибутивно-статистической классификации монгольских аналитических словоформ // Oriental studies, Vol. 36, Is. 2, 2018. С. 88–101.

13. Крылов 2018б ― Крылов С. А. О гибридных жанрах словарей (на материале монгольского языка) // Панина А. С. (сост.). Востоковедные чтения – 2018. Лексикология и лексикография. К 200-летию ИВ РАН. Тезисы докладов межинститутской науч. конф. (г. Москва, 4–6 апреля 2018 г.). М.: ИВ РАН, 2018. С. 33–34.

14. Крылов 2018в ― Крылов С. А. О гибридных жанрах словарей (на материале монгольского языка) // Шаляпина З. М. (отв. ред.), Панина А. С. (ред.-сост.). Труды Института востоковедения РАН. Вып. 19. Проблемы общей и востоковедной лингвистики: Лексикология и лексикография. М.: ИВ РАН, 2018. С. 156–165.

15. Ляшевская, Шаров 2009 ― Ляшевская О. Н., Шаров С. А. Новый частотный словарь русской лексики [электронный ресурс] // Электронная версия издания: Ляшевская О. Н., Шаров С. А. Частотный словарь современного русского языка (на материалах Национального корпуса русского языка). М.: Азбуковник, 2009. URL: http://dict.ruslang.ru/freq.php (дата обращения: 10.09.2019).

16. Шайкевич 1990 ― Шайкевич А. Я. Количественные методы в языкознании // Лингвистический энциклопедический словарь. М.: Советская энциклопедия, 1990. C. 231.

17. Шайкевич 2009 ― Шайкевич А. Я. Количественные методы в языкознании // Большая Российская энциклопедия. Т. 14 («Киреев – Конго»). М.: Большая Российская энциклопедия, 2009. C. 478.

18. Шайкевич, Андрющенко, Ребецкая 2013 ― Шайкевич А. Я., Андрющенко В. М., Ребецкая Н. А. Дистрибутивно-статистический анализ языка русской прозы 1850–1870-х гг. Т. 1. М.: Языки славянской культуры, 2013. 504 с.

19. Шайкевич, Андрющенко, Ребецкая 2016 ― Шайкевич А. Я., Андрющенко В. М., Ребецкая Н. А. Дистрибутивно-статистический анализ языка русской прозы 1850–1870-х гг. Т. 2. М.: Языки славянской культуры, 2016. 850 с.

20. Dawa & al. 2006 ― Dawa I., Husal, Liu Yue, Yue Yao Ming, Uulang, Bai Shuang Cheng, Batsaihan, Arai Y., Mitsunaga M., Isahara H., Nakamura S. Multilingual Text ― Speech Corpus of Mongolian // International Symposium on Chinese Spoken Language Processing (ISCSLP 2006), Kent Ridge, Singapore, December 13–16, 2006. Vol. II. Pp. 759–770. ISCA Archive https://www.isca-speech.org/archive_open/archive_papers/iscslp2006/B74.pdf (дата обращения: 10.10.2018).

21. Purev & al. 2003 ― Purev J., Hyun Seok Park, Altangerel Ch. Tree adjoining grammars for Mongolian // Proceedings of 3-rd International Conference on East-Asian Language, Processing and Internet Information Technology, EALPIIT 2003. Ulaan-baatar, 2003. Pp. 321–323. (In Eng.)

22. Purev & al. 2005 ― Purev J., Tsolmon Z., Altangerel Ch., and Cheol-Young O. PC-KIMMO-based Description of Mongolian Morphology // International Journal of Information Processing Systems. 2005. Vol. 1. No.1. Pp. 41–48. (In Eng.)

23. Purev, Odbayar 2008 ― Purev J., Odbayar Ch. Corpus Building for Mongolian Language // Proceedings of the 6th Workshop on Asian Language Resources (11–12 January 2008, India). Hyderabad, 2008. Pp. 97–98. (In Eng.)

24. Sharoff 2002 ― Sharoff, Serge. Meaning as use: exploitation of aligned corpora for the contrastive study of lexical semantics. // Proc. of Language Resources and Evaluation Conference (LREC02). May, 2002, Las Palmas, Spain, 2002.


Рецензия

Для цитирования:


Крылов С.А. Категориально-семантическая нотация базовых лексем монгольского языка в количественном освещении. Oriental Studies. 2019;12(6):1156-1175. https://doi.org/10.22162/2619-0990-2019-46-6-1156-1175

For citation:


Krylov S.A. Categorial–Semantic Markup of Basic Mongolian Lexemes: a Quantitative Perspective. Oriental Studies. 2019;12(6):1156-1175. (In Russ.) https://doi.org/10.22162/2619-0990-2019-46-6-1156-1175

Просмотров: 466


Creative Commons License
Контент доступен под лицензией Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 License.


ISSN 2619-0990 (Print)
ISSN 2619-1008 (Online)