Определение жанра и автора литературного произведения статистическими методами

PDF
Märgi loetuks
Kuidas lugeda raamatut pärast ostmist
Raamatu kirjeldus

В работе решается задача кластеризации литературных текстов по авторам и жанрам статистическими методами. Основным инструментом анализа являются функции распределения текста по буквам и буквосочетаниям, а также выборочные буквенные распределения, построенные по фрагментам текстов. Для набора текстов, объём наименьшего из которых достаточен для того, чтобы считать буквенное распределение каждого из них стационарным с ошибкой не более 3%, вычисляются расстояния между распределениями букв в пространстве суммируемых функций. Критерий кластеризации, основанный на близости между двухбуквенными распределениями текстов, позволяет правильно идентифицировать автора с ошибкой не более 5%, а жанр – с ошибкой не более 15%. Однобуквенные распределения дают ошибку 15% и 25% соответственно.

Täpsemad andmed
Vanusepiirang:
0+
Lisatud LitResi:
01 aprill 2013
Kirjutamiskuupäev:
2010
Maht:
14 lk.
Kogusuurus:
0 MB
Lehekülgi kokku:
14
Lehekülje mõõdud:
190 x 265 мм
Copyright:
Синергия
Raamat Ю. Н. Орлов "Определение жанра и автора литературного произведения статистическими методами" — laadige alla pdf või lugege tasuta. Kirjutage kommentaare ja ülevaateid, hääletage oma lemmiku poolt.
Raamat kuulub seeriasse
«Прикладная информатика. Научные статьи»
Постановка задачи обеспечения автоматизации полного цикла поддержки принятия решения
Исследование цветовых отличий при воспроизведении памятных цветов на устройствах визуализации
Задача параметрического программирования с моделями прогнозирования урожайности сельскохозяйственных культур
-5%

Отзывы

Сначала популярные

Оставьте отзыв