Web ИРБИС

Инвентарный номер: нет.

   М 81

    Мосин, А. Г.
    Программа "Родовая память": Задачи, первые результаты, перспективы [] / А. Г. Мосин // Человек и общество в информационном измерении : материалы регион. науч. конф., посвящ.10-летию деятельности науч. отд. ЦНБ УрО РАН (28 февр. - 1 марта 2001 г.). - Екатеринбург, 2001. - С. 24-27

ББК Ш1
Рубрики: ЯЗЫКОЗНАНИЕ
Кл.слова (ненормированные):
ИСТОРИЯ УРАЛА -- АНТРОПОНИМИКА -- ЦНБ УРО РАН -- РУССКИЕ ФАМИЛИИ -- КНИГОИЗДАНИЕ -- РОДОВАЯ ПАМЯТЬ (ПРОГРАММА) -- НАУЧНЫЕ ПРОГРАММЫ -- ЦЕНТРАЛЬНАЯ НАУЧНАЯ БИБЛИОТЕКА УРО РАН

Инвентарный номер: нет.

   Ш 37

    Шеваров, Д.
    За Далем - даль! [] : [В. И. Даль и как его последователь - А. Г. Мосин (Центральная научная библиотека УрО РАН)] / Д. Шеваров // На смену!. - 2001. - 13 нояб. : фот. - Перепеч. из газ.: Труд. - 2001. - 13 нояб.

ББК Ш1
Рубрики: ЯЗЫКОЗНАНИЕ
Кл.слова (ненормированные):
ЦЕНТРАЛЬНАЯ НАУЧНАЯ БИБЛИОТЕКА УРО РАН -- АНТРОПОНИМИКА -- РУССКИЕ ФАМИЛИИ -- ИСТОРИЯ УРАЛА

Инвентарный номер: нет.

   П 76


    Применение модели случайных блужданий для описания русскоязычных текстов [] / А. А. Крамаренко, В. В. Филимонов, А. А. Живодеров, А. М. Амиева // Информация: передача, обработка, восприятие : материалы международной научно-практической конференции (Екатеринбург, 12-13 января 2017 г.). - Екатеринбург, 2017. - С. 132-140

ББК Ш1
Рубрики: ЯЗЫКОЗНАНИЕ
Кл.слова (ненормированные):
МОДЕЛЬ СЛУЧАЙНЫХ БЛУЖДАНИЙ -- ЗАКОН ЭЙНШТЕЙНА -- КОЭФФИЦИЕНТ ДИФФУЗИИ -- АТРИБУЦИЯ ТЕКСТА
Аннотация: В статье рассматривается проблема анализа и атрибуции текста с помощью модели случайных блужданий. В качестве элемента атрибуции предлагается коэффициент пропорциональности в законе Эйнштейна, условно названный коэффициентом диффузии. В ходе работы было сделано предположение, что коэффициент диффузии связан с формой коммуникации между автором и читателем

Инвентарный номер: нет.

   А 92


    Атрибутирование русскоязычных текстов с использованием закона больших чисел [] / В. В. Филимонов, А. М. Амиева, А. А. Живодеров, А. А. Крамаренко // Информация: передача, обработка, восприятие : материалы междунар. науч.-практ. конф. (Екатеринбург, 12-13 января 2017 г.). - Екатеринбург, 2017. - С. 11-19

ББК Ш1
Рубрики: ЯЗЫКОЗНАНИЕ
Кл.слова (ненормированные):
КОРПУС -- СТАТИСТИКА Х2 -- ДЛИНА ТЕКСТА -- СТАНДАРТНОЕ ОТКЛОНЕНИЕ -- КЛАСТЕР
Аннотация: Работа посвящена статистическому исследованию русскоязычных текстов. Исследуется связь между длиной текста и среднеквадратичным отклонением величины χ2 для распределения сочетаний гласных букв. Установлена справедливость закона больших чисел для этой величины. Работа выполнена на кафедре полиграфии и веб-дизайна ИРИТ-РтФ УрФУ.

Инвентарный номер: нет.

   М 38


    Машинная атрибуция русскоязычных текстов: обзор методов [] / А. М. Амиева, А. А. Крамаренко, В. В. Филимонов, А. А. Живодеров // Новые информационные технологии в образовании и науке : материалы X Междунар. науч.-практ. конф. (Екатеринбург, 27 февраля–3 марта 2017 г.). - Екатеринбург, 2017. - С. 371-375

ББК Ш1
Рубрики: ЯЗЫКОЗНАНИЕ
Кл.слова (ненормированные):
АТРИБУЦИЯ ТЕКСТА -- ЗАКОН БОЛЬШИХ ЧИСЕЛ -- СТАТИСТИКА Х2 -- МОДЕЛЬ СЛУЧАЙНЫХ БЛУЖДАНИЙ

Инвентарный номер: нет.

   Г 67

    Горбич, Л. Г.
    Использование статистических индексов для различения научных и научно-популярных текстов на примере трудов А.Е. Ферсмана [] / Л. Г. Горбич, А. А. Живодеров. - DOI:10.15827/0236-235X.132.720-725 // Программные продукты и системы. - 2020. - № 4. - С. 720-725. - Библиогр.: с. 725 (15 назв.)

ББК 81
Рубрики: ЯЗЫКОЗНАНИЕ
Кл.слова (ненормированные):
СТИЛЬ ТЕКСТА -- АВТОМАТИЧЕСКАЯ КЛАССИФИКАЦИЯ ТЕКСТОВ -- СТАТИСТИЧЕСКИЙ ИНДЕКС -- ЛОГИСТИЧЕСКАЯ РЕГРЕССИЯ -- ДИСКРИМИНАТНЫЙ АНАЛИЗ -- ГОС-КРИВАЯ
Аннотация: С развитием информационной техники и информационных систем актуализировалась проблема разработки методик машинной атрибуции текстов. Эти методики могут быть использованы для автоматического поиска текстов необходимого жанра и стиля и установления авторства с помощью компьютерных технологий. В основу разработки рассматриваемой в статье методики была положена гипотеза о том, что существуют структурные особенности текста, которые позволяют без учета смыслового содержания отнести его к определенному жанру или автору на основе вычисления чисто количественных значений некоторых параметров и индексов. Авторы наряду с другими исследователями в течение ряда лет занимались разработкой таких индексов и формированием из них оптимального набора и добились в этом определенных успехов. В частности, был сформирован набор индексов, позволяющий правильно классифицировать тексты по жанру с вероятностью до 86 %. Для решения задачи автоматической классификации научных и научно-популярных текстов авторы применили и усовершенствовали набор статистических индексов, разработанный ими ранее для атрибуции других стилей. В качестве материала исследования были взяты труды академика А.Е. Ферсмана. Одной из особенностей этого автора является стилевая двойственность – наличие большого числа принадлежащих ему как научных, так и научно-популярных текстов, что создало уникальную возможность для попытки решения задачи автоматической классификации стилей текстов, принадлежащих одному автору. В ходе работы было показано, что выборочные средние статистических индексов для текстов двух стилей достоверно различаются. Применяя методы дискриминантного анализа, логистической регрессии и ROC-кривых, авторы продемонстрировали возможность автоматической классификации текстов двух стилей и с помощью оптимизации используемого набора индексов добились существенного повышения качества классификации. Предложен также новый статистический индекс, позволяющий минимизировать вычислительные затраты и успешно (до 100 % точности) решать задачу классификации научных и научно-популярных текстов даже при использовании его в качестве единственного фактора. Результаты исследования были проверены на текстах других авторов.

Инвентарный номер: нет.

   Г 67

    Горбич, Л. Г.
    Поиск оптимального набора букв для стилевой классификации художественных текстов методом статистических индексов / Л. Г. Горбич. - DOI: 10.15827/0236-235X.142.654-660 // Программные продукты и системы. - 2023. - Т. 36, № 4. - С. 654-660

ББК Ш1
Рубрики: ЯЗЫКОЗНАНИЕ
Кл.слова (ненормированные):
СТИЛЕВАЯ КЛАССИФИКАЦИЯ -- НАБОР БУКВ -- АВТОМАТИЧЕСКАЯ КЛАССИФИКАЦИЯ ТЕКСТОВ -- СТАТИСТИЧЕСКИЙ ИНДЕКС -- МАШИННОЕ ОБУЧЕНИЕ -- МЕТОД ОПТИМИЗАЦИИ -- ROC-КРИВАЯ
Аннотация: В статье рассматривается проблема улучшения методов стилевой классификации русскоязычных текстов. В качестве возможного направления исследований предложен метод оптимизации набора (множества) букв, применяемого для вычисления статистических индексов текстов. Для оптимизации и контроля результатов использованы поэтические и прозаические художественные тексты на русском языке. Объем текстов составлял порядка 300 тысяч знаков при оптимизации и 100 тысяч знаков при контрольной оценке. Для вычисления статистических индексов рассчитывались частотности биграмм и триграмм букв. При оптимизации опробован также и вариант совместного использования индексов биграмм и триграмм. В статье дано краткое описание метода статистических индексов, приведены применявшиеся в исследовании алгоритм пошаговой оптимизации, вид возможной оптимизационной функции и формула для нахождения границы классификации. Показано, что оптимизация набора букв улучшает классификацию по сравнению с вариантом использования как полного набора букв, так и набора из гласных букв в применении к задаче автоматического различения поэтических и прозаических художественных текстов на русском языке. Проведено сравнение результатов классификации по предложенной формуле границы классификации с результатами расчетов по классификации методом ROC-кривых. В итоге для разных сочетаний статистических индексов и способов определения границы классификации интервал верной классификации составил 72–74 % для набора, включающего все буквы, 82–86 % для набора, включающего только гласные буквы, и 80.5–92.5 % для разных наборов букв, полученных при оптимизации

request_decrypt("(<.>S=ЯЗЫКОЗНАНИЕ<.>)","");