隊長是神豬

國內外多項研究顯示糖尿病與癌症高度關聯,糖尿病患的罹癌風險或死於癌症的風險都比非糖尿病患高。雖然目前癌症無法根治,但若能早期發現癌症並進行治療,就能大幅提高病患存活率,因此,本計畫將針對糖尿病患建構罹癌風險之預測模型。我們將從台灣全民健保資料庫擷取研究對象之病歷資料,進行預處理、整合,然後將資料集依6 : 2 : 2比例切割成訓練集 (training set)、驗證集 (validation set) 及測試集 (test set)。

再以機器學習 (machine learning) 及深度學習 (deep learning) 方法建構預測模型,以套索算法 (least absolute shrinkage and selection operator, LASSO) 提取重要特徵 (feature)、調整超參數 (hyper-parameter),然後以不同的類神經網路 (neural network) 建立模型。最後考量不同模型的正確性 (accuracy)、敏感性 (sensitivity,又稱召回率 recall)、特異性 (specificity)、精確性 (precision)、F1分數 (F1 score)、曲線下面積 (area under curve, AUC or AUROC),以及正確性及損失 (loss) 函式趨勢圖,選出最佳預測模型。

本團隊預計將以互動式網頁呈現風險預測之結果,並製作視窗小遊戲增加民眾對癌症的認知,推廣衛教知識,並參考醫師的專業意見以及病患回饋,改進系統。期望能在早期發現癌症,讓患者盡早就醫以增加糖尿病患治癒癌症之機率。