Инвентарный номер: нет.
   
   У 49


   
    Улучшение качества стилевой классификации русскоязычных текстов на основе статистических индексов / В. В. Филимонов, А. А. Живодеров, Л. Г. Горбич, А. В. Дерябина. – DOI 10.32460/ergo-6-2022-0006 // Ergo... Проблемы методологии междисциплинарных исследований и комплексного обеспечения научно-исследовательской деятельности : сборник научных трудов. - Екатеринбург, 2022. - С. 74-84
УДК
Рубрики: НАУКА. НАУКОВЕДЕНИЕ
Кл.слова (ненормированные):
АВТОМАТИЧЕСКАЯ КЛАССИФИКАЦИЯ ТЕКСТОВ -- ДИСКРИМИНАНТНЫЙ АНАЛИЗ -- N-ГРАММА БУКВ
Аннотация: Для решения задачи автоматической стилевой классификации текстов были применены методы дискриминантного анализа. В качестве возможных факторов классификации рассматривались индекс триграмм (ИТ), индекс биграмм (ИБ), их отношение (ИТ/ИБ), индекс сжимаемости текстов (Deflate), а также информационные индексы: соотношение порядка и хаоса в системе – так называемая R-функция (Rf), и функция развития (Df). Найдены оптимальные сочетания индексов для решения этой задачи. Удалось добиться значительного улучшения качества классификации текстов при одновременном уменьшении количества используемых индексов по сравнению с предыдущими работами