Основной контент книги Система классификации документов с маркшейдерскими данными
Tekst PDF

Maht 16 lehekülge

2021 aasta

0+

Система классификации документов с маркшейдерскими данными

€1,81

Raamatust

Все предприятия, осуществляющие геологоразведочные работы на территории РФ, сталкиваются с необходимостью формирования задач для маркшейдерской службы и контроля выполнения поставленных задач. Это отражается в процессах документооборота предприятий. В данной связи существует проблема организации эффективной обработки документов в системах электронного документооборота – своевременного выявления документов, содержащих маркшейдерские данные. В статье представлено возможное решение указанной проблемы – автоматизированная система классификации документов в СЭД в виде рекомендательной надстройки над системой 1С:Документооборот. В рамках создания системы классификации был разработан и реализован сценарий предварительной обработки первичных текстов документов, включающий очистку, лемматизацию и удаление стоп-слов, а также подготовку входных признаков для классификатора. Исследована применимость различных алгоритмов машинного обучения к решению рассматриваемой задачи классификации, определены значения гиперпараметров, обеспечивающие наибольшее значение метрики ROC AUC. Выполнена оценка качества всех полученных моделей с использованием метрик Precision, Recall и F-меры, исследована устойчивость качества классификации к изменению входных данных. Выявленная проблема нестабильности результатов классификации решалась путем построения модели машинного обучения в виде ансамбля классификаторов. Обученная модель (ансамбль классификаторов) тестировалась на наборе реальных документов ООО «Газпром недра»; качество классификации на тестовой выборке по метрике ROC AUC составило 0,91. Кроме собственно модуля классификации разработанная система включает базу данных хранения результатов обучения, библиотеку функций для организации работы с базой данных, а также API-интерфейсы, позволяющие обрабатывать запросы на классификацию, приходящие из внешних систем. В API-интерфейсах, в частности, реализованы возможности загрузки сохраненных обученных моделей, валидации данных, приходящих из внешних систем, предварительной обработки входных текстовых документов, обучения новых моделей и оценки их качества, сохранение как обученных моделей, так и результатов их тестирования. Реализована возможность дообучения сохраненных моделей на новых данных.

Teised versioonid

1 raamat alates 11,61 €
Logi sisse, et hinnata raamatut ja jätta arvustus
Raamat В. В. Еремеева, М. С. Цыгановой jt «Система классификации документов с маркшейдерскими данными» — laadi alla pdf formaadis või loe veebis. Jäta kommentaare ja arvustusi, hääleta lemmikute poolt.
Vanusepiirang:
0+
Ilmumiskuupäev Litres'is:
01 veebruar 2022
Kirjutamise kuupäev:
2021
Objętość:
16 lk
Üldsuurus:
1.0 МБ
Lehekülgede koguarv:
16
Õiguste omanik:
Синергия
Allalaadimise formaat:
Tekst PDF
Средний рейтинг 0 на основе 0 оценок
Tekst PDF
Средний рейтинг 3,5 на основе 4 оценок
Tekst PDF
Средний рейтинг 0 на основе 0 оценок
18+
Tekst, helivorming on saadaval
Средний рейтинг 5 на основе 1 оценок
Audio
Средний рейтинг 4,8 на основе 6 оценок
Audio
Средний рейтинг 4,7 на основе 377 оценок
Audio
Средний рейтинг 4,8 на основе 306 оценок
Audio
Средний рейтинг 4,8 на основе 13 оценок
Audio
Средний рейтинг 4,6 на основе 352 оценок