Репозитарiй DSpace

Покращення розпізнавання структурованого тексту нейронною мережею YOLO

Показати скорочений опис матеріалу

dc.contributor.author Зінченко, А. Ю.
dc.contributor.author Хайдуров, В. В.
dc.date.accessioned 2025-02-12T12:35:46Z
dc.date.available 2025-02-12T12:35:46Z
dc.date.issued 2025-02-12
dc.identifier.citation Зінченко А. Ю., Хайдуров В. В. Покращення розпізнавання структурованого тексту нейронною мережею YOLO. Системи та технології. № 2 (68). 2024. С. 23-31. uk_UA
dc.identifier.issn 2521-6643
dc.identifier.uri http://212.1.86.13:8080/xmlui/handle/123456789/7106
dc.description.abstract У даній роботі розглядається підхід до покращення розпізнавання структурованого тексту за допомогою інтеграції нейронної мережі YOLO (You Only Look Once) та технології OCR (Optical Character Recognition). Метою роботи є дослідження можливостей підвищення ефективності розпізнавання структурованого тексту шляхом інтеграції моделі YOLO з технологією OCR, а також створення автоматизованої інформаційної системи для виявлення текстових об’єктів та їх подальшого розпізнавання, що дозволяє підвищити ефективність обробки структурованого тексту. Авторами запропоновано архітектуру багатопотокової моделі, що використовує рекурентні та дво- та тривимірні згорткові нейронні мережі. Розроблене програмне забезпечення, що реалізує алгоритми обчислення оптичного потоку та частотного аналізу символів, написане на мові Python із використанням бібліотек Ultralytics, Pytesseract, Python Image Library та фреймворку веб-додатків Flask. Інтерфейс реалізовано за допомогою HTML, CSS та JavaScript, а для зберігання даних обрано базу даних MySQL. Головною особливістю системи є інтеграція моделі YOLO та OCR для забезпечення точного та швидкого розпізнавання текстових об’єктів на зображеннях. Розроблена автоматизована інформаційна система є сервіс-орієнтованою, що дозволяє користувачам завантажувати інвойси, зберігати їхні дані та отримувати аналітику щодо витрат і взаємодії з клієнтами. Система включає нейронну мережу YOLOv10, натреновану на 500 зображеннях інвойсів, REST API для користувацької взаємодії, інтерфейс для завантаження інвойсів, а також об’єкти бази даних MySQL для зберігання інформації про користувачів та їхні інвойси. Архітектура побудована за шаблоном MVC (Model-View-Controller): модель обробляє дані та бізнес-логіку, контролер зв’язує модель і представлення, а саме представлення демонструє дані користувачам. Така структура забезпечує чітке розмежування функцій між компонентами. Додатково система містить сервісні шари для бізнес-логіки та маршрутизації, а також використовує інструмент Blueprint фреймворку Flask для поділу додатка на менші компоненти та організації URL-адрес. Аналіз результатів розпізнавання тексту показав високу точність OCR, зокрема для структурованого тексту, хоча зустрічаються недоліки, такі як порушення початкової структури тексту. Однак ці недоліки можуть бути мінімізовані шляхом використання мережа YOLO разом з технологією OCR. uk_UA
dc.language.iso uk uk_UA
dc.publisher Університет митної справи та фінансів uk_UA
dc.subject YOLO uk_UA
dc.subject OCR uk_UA
dc.subject розпізнавання тексту uk_UA
dc.subject нейронні мережі uk_UA
dc.subject обробка зображень uk_UA
dc.title Покращення розпізнавання структурованого тексту нейронною мережею YOLO uk_UA
dc.type Article uk_UA


Долучені файли

Даний матеріал зустрічається у наступних зібраннях

  • 2024/2(68)
    правонаступник наукового збірника "Вісник Академії митної служби України. Серія: "Технічні науки"

Показати скорочений опис матеріалу