Abstract:
У даній роботі наведено результати досліджень застосування Логістичної регресії та Дерева рішень з викори-стання алгоритму PCA в задачі виявлення та прогнозуванні онкології. Було проаналізовано проблему та актуальність даного дослідження. Проаналізовано різноманітні літературні джерела та методи машинного навчання. Проведений детальний аналіз обраних методів, а також розглянути їх математичні моделі. Було проведено тренування відповідних моделей та ряд експериментів для обрання найкращих параметрів на обраних двох наборах даних, які були детально проаналізовані в даній роботі. Наведено результати точності моделей та побудовані відповідні метрики, такі як Classification report, Confusion Matrix, Roc-curve. Також були проведені експерименти для покращення точності моде-лей з використання алгоритму PCA. В результаті були отримані набагато кращі результати у випадку з другим набо-ром даних, але з першим покращити точність не вдалося. Після проведення експериментальної частини було детально проаналізовано отримані результати та наведені відповідні гістограми для кожного з наборів даних з отриманими результатами. Дане дослідження доводить, що алгоритм PCA краще використовувати, тоді коли наявний набір даних з великою кількістю ознак. В результаті дослідження були отримані хороші результати у задачі виявлення та про-гнозування онкології та наведено цінність даного дослідження з описаними висновками. В роботі проводиться оцінка результатів за допомогою різних метрик, таких як точність та чутливість, і результати порівнюються з іншими методами аналізу та класифікації. Доведено, що ці методи можуть вдосконалити процес діагностики онкології, спри-яти зменшенню помилкових класифікацій та сприяти ранньому виявленню хвороби