Вид документа : Статья из сборника (выпуск продолж. издания)
Шифр издания : Ч2/У 49
Автор(ы) : Филимонов В. В., Живодеров А. А., Горбич Л. Г., Дерябина А. В.
Заглавие : Улучшение качества стилевой классификации русскоязычных текстов на основе статистических индексов
Место публикации : Ergo... Проблемы методологии междисциплинарных исследований и комплексного обеспечения научно-исследовательской деятельности : сборник научных трудов. - Екатеринбург, 2022. - С. 74-84
УДК : Ч2
Предметные рубрики: НАУКА. НАУКОВЕДЕНИЕ
Ключевые слова (''Своб.индексиров.''): автоматическая классификация текстов--дискриминантный анализ--n-грамма букв
Аннотация: Для решения задачи автоматической стилевой классификации текстов были применены методы дискриминантного анализа. В качестве возможных факторов классификации рассматривались индекс триграмм (ИТ), индекс биграмм (ИБ), их отношение (ИТ/ИБ), индекс сжимаемости текстов (Deflate), а также информационные индексы: соотношение порядка и хаоса в системе – так называемая R-функция (Rf), и функция развития (Df). Найдены оптимальные сочетания индексов для решения этой задачи. Удалось добиться значительного улучшения качества классификации текстов при одновременном уменьшении количества используемых индексов по сравнению с предыдущими работами

Доп.точки доступа:
Филимонов, В. В.; Живодеров, А. А.; Горбич, Л. Г.; Дерябина, А. В.