Python: Một kỹ thuật chuẩn đoán bệnh viêm da cơ địa sử dụng mạng học sâu
Vũ Văn Hiệu∗, Nguyễn Anh Minh†
∗Viện Công nghệ thông tin, Viện Hàn lâm Khoa học và công nghệ Việt Nam,
† Trường THPT Chuyên Ngoại Ngữ - ĐHQG Hà Nội
Tóm tắt nội dung—Bài báo đề xuất một phương pháp chuẩn đoán bệnh viêm da cơ địa dựa trên mạng học sâu bằng cách phân tích dữ liệu ảnh vùng da bị nhiễm bệnh. Bước thứ nhất sử dụng mạng học sâu trích rút bản đồ đặc trưng của ảnh bệnh và không bệnh. Phân tích bản đồ đặc trưng theo các tầng tích chập để lựa chọn tầng đặc trưng tốt nhất. Bước thứ hai trích rút đặc trưng HOG các ảnh của tầng đặc trưng tốt nhất. Bước thứ ba sử dụng bộ phân loại SVM để phân lớp bệnh và không bệnh dựa vào đặc trưng ở bước hai. Phương pháp đề xuất chứng minh được hiệu quả về cả tốc độ và có thể xem như một giải pháp hỗ trợ cho cách chuẩn đoán truyền thống. Kết quả đạt được độ chính xác 98% với ảnh bênh (AD) và 96% với ảnh không bệnh (not_AD) tương đương với chuyên gia chuẩn đoán trong khi hạn chế sự không đồng nhất giữa những người chuẩn đoán.
Keywords-Atopic Dermatitis-AD, Deep Learning, Convolutional Neural Networks-CNNs
I. GIỚI THIỆU
Bệnh viêm da cơ địa (Atopic Dermatitis-AD) là một triệu chứng nặng của bệnh chàm (Eczema- Ecz) [1]; gây xưng, đỏ, rạn và ngứa trên da. Hầu hêt số ca bệnh xảy ra trong độ tuổi trẻ em chiếm 70%, trong đó có đến 15-20% trẻ em từ tuổi 13 trở xuống bị ảnh hưởng bởi bệnh [2], [3]. Để đạt hiệu quả cao trong điều trị cần có một phương pháp ước tính độ phát triển nghiêm trọng của bệnh nhằm đánh giá sự tiến triển của bệnh nhân. Hiện nay công nghê học sâu đang phát triển rất nhanh trong kỷ nguyên số và được sử dụng nhiều trong các lĩnh vực y tế như bệnh học và ảnh X quang [4], [5]. Tuy vậy sự áp dụng của công nghệ học sâu trong lĩnh vực da liễu còn khá khiêm tốn và nhiều sai số vì sự phức tạp của các biến chủng [6].
AD là một dạng nặng của bệnh chàm gây ngứa mãn tính, ảnh hưởng 15-20% trẻ em nhưng có thể bị nhiễm ở mọi lứa tuổi. Ước tính rằng có tới 16.5 triệu người lớn tại Mỹ (tương ứng 7.3%) đã từng bị mắc AD khi chỉ mới ngưỡng 2 tuổi trở lên, với 40% trong số đó mắc bệnh vừa hoặc nặng[7]. Ngoài những ảnh hường về da, những người mắc phải AD có nguy cơ nhiễm bệnh dị ứng đường hô hấp như hen suyễn hoặc viêm mũi dị ứng, hay những bệnh về rối loạn thần kinh như trầm cảm hay rối loạn lo âu [8], [9]. Thêm vào đó, AD thường dễ bị chuẩn đoán sai do các triệu chứng thường phân bố và biến đổi bất thường và có điểm tương đồng với các loại bệnh viêm về da khác. Vì vậy cần thiết có phương pháp để hỗ trợ các bác sĩ và chuyên gia trong việc chuẩn đoán, đặc biệt hữu ích cho chuyên gia da liễu trẻ và thiếu kinh nghiệm.
Kỹ thuật học sâu (Deep Learning-DL) đang trở thành một từ thông dụng ngày nay, đặc biệt là đối với các bài toán ảnh y tế, chẳng hạn như chẩn đoán do đạt được hiệu năng cao trong phân loại ảnh. Trong số các loại hình học sâu, mạng nơ-ron tích chập (Convolutional Neural Networks- CNNs) là loại mô hình DL phổ biến nhất được sử dụng để chẩn đoán và phân tích hình ảnh y tế. Các mô hình học sâu, cụ thể như CNNs, RNNs (Recurrent Neu- ral Networks) hay GANs (Generative Adversarial Networks) đã cho thấy sự hiệu quả trong việc phân tích dữ liệu ảnh lâm sàng. Một số ví dụ như việc CNNs đã được áp dụng trong hỗ trợ chuẩn đoán và phát hiện sớm dấu hiệu của bệnh Alzheimer, viêm xương khớp hay võng mạc tiểu đường qua cơ sở dữ liệu các ảnh chụp loại ảnh chụp như MRI, EGG hoặc siêu âm [10]. Việc triển khai công nghệ học sâu trong chuẩn đoán da được bắt đầu bởi chuẩn đoán u ác tính. Từ đó, đã có một số nghiên cứu sử dụng trí tuệ nhân tạo để xác định bệnh ung thư da dựa trên cơ sở đầu vào là các ảnh chụp mô sinh thiết da và ảnh kính soi da. Việc sử dụng công nghệ tương tự trong chuẩn đoán các bệnh da liễu, cụ thể là AD là hoàn toàn thực tiễn và cần thiết.
Do CNNs phải chịu chi phí tính toán cao để thực hiện và có thể yêu cầu điều chỉnh số lượng lớn các tham số. Vì vậy để giải quyết vấn đề này một số mô hình được huấn luyện trước (pre-train) được thiết lập với kiến trúc mạng đã xác định trước. Trong nghiên cứu này, chúng tôi sử dụng mô hình học chuyển giao dựa trên nghiên cứu từ Visual Geometry Group với kiến trúc mô hình 16 tầng sâu (VGG16) [11]. Chúng tôi khai thác bản đồ đặc trưng trên một số tầng sâu, tiếp đó sử dụng kỹ thuật biến đổi HOG [12] để trích rút đặc trưng từ các bản đồ đặc trưng. Sau cùng, một bộ phân lớp nhị phân được lựa chọn để phân loại ảnh bệnh và không bệnh.
Trong phần tiếp theo: Phần II sẽ giới thiệu một số nghiên cứu liên quan, Phần III giới thiệu một kiến thức nền tảng xây dựng phương pháp đề xuất, Phần IV là phương pháp đề xuất và Phần VI là một số kết luận.
II. NGHIÊN CỨU LIÊN QUAN
A. Ứng dụng tự động đánh giá, phân loại và chuẩn đoán bệnh da liễu
Phương pháp sử dụng học sâu dựa trên dữ liệu ảnh để tự động chuẩn đoán các bệnh viêm da được giới thiệu trong [13], các tác giả đã xây dựng một trợ lý trí tuệ nhân tạo chuẩn đoán các bệnh da (AIDDA) dựa trên hình ảnh da lâm sàng để chuẩn đoán bệnh vảy nến (psoriasis-Pso), Ecz và AD sử dụng mô hình học sâu CNN EfficientNet-b4 từ Google như trong Hình 1.
Hình 1: Kiến trúc CNN EfficientNet-b4 phân tích ảnh bệnh.
Nghiên cứu này đã sử dụng Pytorch để khai triển nền tảng phần mềm học sâu, chỉ số hiệu năng ROC (Receiver Operating Characteristic curve) liên kết chỉ số độ nhạy và AUC (Area Under the Curve) cho thấy AIDDA đạt độ chính xác là 95.8% với sai số 0.09%; ROC và AUC lần lượt là 97.6% với sai số 0.12% và 95.89% với sai số 0.06%. Mặc dù AUC với những mô hình ConvNets khác được so sánh trong nghiên cứu (gồm SE-ResNeXt101- 32x4d, SE-ResNet101 [14] và Inception-v3 [15]) khá tương đồng, mô hình của nhóm nghiên cứu vẫn tốt hơn ở độ đo ROC. Mô hình được áp dụng tạo nên một ứng dụng trên điện thoại như Hình 2 và đã có hơn 7.000 bác sĩ tại các bệnh viện đăng ký sử dụng ứng dụng này. Dữ liệu người dùng cho thấy đã có gần 100.000 ảnh chụp từ các bác sĩ vào ứng dụng để cải thiện quá trình chuẩn đoán, chứng minh sự hiệu quả và cần thiết cho một công cụ hỗ trợ sử dụng mạng học sâu như vậy, đặc biệt trong chuẩn đoán các bệnh về da liễu nói chung và viêm da cơ địa nói riêng.
Hình 2: Mô hình luồng làm việc trên nền tảng di động của AIDDA.
Tương tự [13], trong các năm gần đây nhiều nghiên cứu, thử nghiệm đã tiến hành sử dụng kết hợp CNNs trong chuẩn đoán bệnh viêm da cơ địa, kết quả cho thấy độ chính xác tăng cao, tốc độ tính toán cũng được cải thiện. Trong [7] các tác giả đã thực nghiệm với công nghệ học sâu kết hợp độ đo đánh giá mức độ nghiêm trọng của viêm da cơ địa (SCORAD) để tạo thành thuật toán tính SCORAD tự động (ASCORAD). Họ cũng dùng Pytorch để xây dựng mô hình và ba bộ dữ liệu từ 3 nguồn chuyên gia da liễu khác nhau, dựa trên hai chỉ tiêu: phân đoạn bề mặt bị thương và đánh giá mực độ nghiêm trọng của dấu hiệu trực quan. Kết quả đạt được cho thấy chỉ số RMAE tổng thể đạt được một ngưỡng là 13.0% và chỉ số AUC là 0.93 và IoU là 0.75 khi ước tính bề mặt tổn thương trên da sáng. Điều này chứng minh rằng mạng học sâu có thể là một phương pháp thay thế thuận lợi và khách quan cho tự động đánh giá về AD với nhiều tiềm năng, có thể so sánh với kết quả đánh giá của chuyên gia, đồng thời giảm sự không tương đồng của việc nhiều chuyên gia đánh giá và giảm sự hao tốn thời gian.
Trong [16] đã sử dụng một phương pháp tương tự thông qua hai mô hình học sâu CNN và LSTM (long short-term memory) để chuẩn đoán bệnh vảy nến (Psoriasis-Pso), một loại bệnh có nhiều đặc điểm tương đồng với AD (cùng thuộc nhóm bệnh viêm da), có quan hệ tương tự với Ecz. Kết quả cho thấy độ chính xác thu được ở CNN và LSTM lần lượt là 84.2% và 72.3%. Điều đó cho thấy tiềm năng của việc áp dụng mô hình học sâu trong chuẩn đoán các bệnh về da liễu và là bằng chứng cho sự cải thiện đáng kể về độ chính xác của mô hình trong [13]. Việc sử dụng học sâu như R-CNN để chuẩn đoán các bệnh như AD, mụn trứng cá và ghẻ lở được nhóm nghiên cứu [17] đã khai thác. Các tác giả đã xây dựng một hệ thống dựa trên nền tảng web để chuẩn đoán nhanh và hiệu quả hơn những bệnh về da. Kết quả cho thấy mô hình dự đoán chính xác 88% cho AD, 85% cho mụn trứng cá và 84.7% cho ghẻ lở. Thông qua so sánh có thể thấy kết quả sự tương đồng kết quả với nhiều nghiên cứu khác như trong [13], [16]. Nghiên cứu [18] giới thiệu một cách đánh giá khác sử dụng CNN và ảnh RSOM 3D thô để phân loại AD dựa trên các cách tiếp cận học máy truyền thống như SVM (support vector machine) và RF (Random Forest). Các tác giả đánh giá trên chỉ số EVSI (Eczema Vascular Severity Index) bao gồm (i) da khỏe với AD và (ii) triệu chứng nhẹ với vừa-nặng của AD. Kết quả cho thấy mô hình CNN đạt dược độ chính xác là 97% và RF là 65%. Điều này lần nữa chứng minh hiệu năng của học sâu, đặc biệt là CNN.
B. Ứng dụng sử dụng dữ liệu hệ phiên mã và quần thể vi khuẩn
Các tác giả trong [10], [19] xây dựng hai thuật toán phân loại học máy sử dụng hệ phiên mã của tế bào biểu mô ruột (i) dữ liệu quần thể vi khuẩn đường ruột (ii) để chuẩn đoán AD với độ chính xác cao một cách tự động. Nghiên cứu đã tạo bước đầu trong quá trình chuẩn đoán và đưa ra những thấu hiểu mặt sinh học về sự phát triển sinh học của loại bệnh này. Từ kết quả đạt được tại [10], [19], các tác giả trong [20] sử dụng dữ liệu hệ phiên mã ở mô hữu cơ trong da dựa trên Random Forest (RF) và mạng nơ-ron nhân tạo để phát hiện AD một cách chính xác hơn đạt AUC bằng 0.9802 ở bộ dữ liệu huấn luyện và bằng 1.0000, 0.8500 ở lần lượt hai tập kiểm tra GSE5667 và GSE102628. Kết quả cho thấy sự phát triển đáng kể từ những kết quả của nghiên cứu trước, và sự phù hợp trong việc áp dụng RF để chuẩn đoán AD cũng như làm tiền đề cho những nghiên cứu sau như trong [18]. Mặc dù vậy, còn một số hạn chế như việc mẫu thử còn khá ít để thực sự chứng minh tiềm năng và còn thiếu các dữ liệu để dùng trong kiểm thử.
III. MỘT SỐ KHÁI NIỆM CƠ BẢN
A. Mạng nơ-ron tich chập (Convolutional Neural Networks -CNNs)
CNNs là một lớp của mạng nơ-ron nhân tạo thường được dùng trong các bài toán phân lớp, được áp dụng phổ biến nhất để phân tích hình ảnh trực quan. CNNs còn nhiều ứng dụng phổ biến khác trong thị giác máy tính [21], hệ thống gợi ý, xử lý ngôn ngữ tự nhiên hay phân loại hình ảnh, tính toán dữ liệu ảnh y tế [22]. Hệ thống CNNs thường gồm 3 phần miêu tả như trong Hình 3 bao gồm: đầu vào, gồm nguồn dữ liệu được chuẩn bị sẵn từ một mô hình huấn luyện bên thứ 3; lớp ẩn, gồm phần chọn lọc đặc trưng và các lớp phân loại; và đầu ra, gồm dữ liệu chuẩn đoán và các chỉ số liên quan tới dữ liệu.
Hình 3: Mô hình cấu tạo đơn giản mạng CNNs.
Trong đó, các lớp phân loại và trích rút đặc trưng thường có vai trò quyết định trong việc đưa ra kết quả cuối cùng, được chia thành nhiều nhánh nhỏ, gồm nhiều lớp và phân loại tương ứng. Trong các thử nghiệm, mỗi CNNs đều bao gồm một số lượng đáng kể của tầng lớp phân loại, chúng giúp nhìn nhận được sự thay đổi chỉ số ở mỗi tầng, từ đó đưa ra được kết luận và mô hình áp dụng chính xác nhất. Trong nghiên cứu này, chúng tôi đề xuất sử dụng mạng VGG16 trong việc trích rút đặc trưng ảnh. Chúng tôi không sử dụng nhãn lớp đầu ra mà sử dụng ảnh được lọc qua một số tầng của lớp mạng tại conv3, conv5 như trong Hình 4.
B. Chỉ số đánh giá hiệu năng
Đường ROC (Receiver Operating Characteristic) là một dạng đồ thị được dùng khá phổ biến trong kiểm thử (validation), dựa trên chỉ số độ nhạy & độ chuyên biệt (Sensitivity-TPR & Specificity-FPR) của một mô hình học sâu. Hầu hết các nghiên cứu liên quan đều sử dụng ROC để đánh giá tính khách quan mô hình học sâu theo một ngưỡng nào đó. TPR và FPR cũng là hai tham số trên hai trục của đồ thị, được tính theo Công thức (1) và (2).
- TPR (True Positive Rate), đồng nghĩa với chỉ số Recall được xác định:
- Precision được xác định:
AUC là một chỉ số chỉ diện tích dưới một đường cong ROC. Chỉ số đo toàn bộ diện tích hai chiều ở dưới đường cong, cho ta một cái nhìn toàn diện về hiệu suất tất cả các ngưỡng phân loại. AUC có miền từ 0.0 đến 1.0, với 1.0 tương ứng 100% độ chính xác và ngược lại. Hình 5 là ví dụ cho một biểu đồ ROC curve chứa AUC.
Hình 5: Biểu đồ đường cong ROC và AUC
A. Độ đo Precision, Recall & F1-score
Precision, Recall và F1-score đều là những chỉ số dựa trên TPR và FPR đã được xác định ở phần trên. Theo đó,
- Recall đồng nghĩa với TPR, được xác định:
- FPR (False Positive Rate) được xác định:
Trong mô hình hai chỉ số này càng cao càng tốt. Tuy nhiên trong thực tế, nếu ta điều chỉnh mô hình tăng Recall quá mức có thể làm giảm Precision và ngược lại. Do đó chúng ta cần hai đại lượng này cân bằng. Để giải quyết bài toán này khi chọn cách điều chỉnh mô hình, ta có chỉ số F1-score được xác định theo Công thức (5).
Trong điều kiện lý tưởng, F1-score = 1, từ đó ta có thể căn cứ chọn mô hình thông qua F1-score.
IV. PHƯƠNG PHÁP ĐỀ XUẤT
A. Mô hình thực nghiệm
Mô hình gồm có đầu vào từ bộ dữ liệu đã được lọc từ tầng CNN là VGG16 (Hình 6), một tầng gồm phân lớp ảnh HOG (Histogram of Oriented Gradients) và qua phân lớp SVM. Chỉ số đánh giá hiệu năng được sử dụng gồm chỉ số độ chuẩn xác (Accuracy), độ chính xác phép đo (Precision) và điểm F1.
Thông qua mô hình trích rút đặc trưng trong [23], Mỗi ảnh đưa vào hệ thống (Hình 8), để đánh giá toàn diện hiệu năng tại mỗi tầng tích chập sẽ có 64 lớp ảnh đặc trưng ở từng tầng cuối của từng lớp tích chập trong mô hình VGG16. Kết quả cho bộ dữ liệu mỗi ảnh gồm 320 ảnh đặc trưng chia ra tương ứng với 5 thư mục được đặt tên theo lớp tích chập đó. Ngoài ra còn có một thư mục chứa 5 ảnh 8x8 gồm tất cả các ảnh đặc trưng của từng lớp nhằm đánh giá toàn diện chất lượng từng tầng (xem Hình 7).
Hình 7: Cách phân tách & trích rút ảnh của các tầng tích chợp
Nghiên cứu đề xuất được so sánh với kỹ thuật cơ sở (baseline) là mạng học sâu theo các tầng tích chập là Conv1, Conv2, Conv3, Conv4, Conv5 tương ứng với các lớp tích chợp của VGG16 theo như Hình 5 và được cấu trúc theo 5 thư mục ảnh tương ứng. Trong mỗi thư mục gồm hai thư mục con gắn nhãn AD và not_AD đại diện cho đặc trưng bệnh AD và các bệnh da liễu khác. Điều này nhằm mục đích chọn ra tầng hay thư mục có đặc trưng có thể được chuẩn đoán một cách chính xác và hiệu quả nhất để làm dữ liệu đầu vào. Các bước thực hiện theo Thuật toán 1.
Để đánh giá hiệu năng đặc trưng theo các tầng tích chập cho 30% số ảnh trên cả hai tập ảnh bệnh và không bệnh. Sau khi trích rút đặc trưng HOG, bộ phân loại SVM được sử dụng như một bộ phân loại nhị phân. Mô hình đề xuất được biểu diễn như trong Hình 8. Kết quả như trong Bảng I cho thấy đặc trưng ảnh tại tầng thứ 3 (Conv3) đạt được kết quả tốt nhất.
|
precision |
recall |
f1-score |
Conv1 |
0.60 |
1.00 |
0.75 |
Conv2 |
0.80 |
0.80 |
0.80 |
Conv3 |
1.00 |
0.75 |
0.86 |
Conv4 |
0.80 |
0.80 |
0.80 |
Conv5 |
0.83 |
0.83 |
0.83 |
V. KẾT QUẢ THỰC NGHIỆM
A. Miêu tả dữ liệu
Bộ dữ liệu chúng tôi dùng để thực nghiệm được thu thập1 gồm hai thư mục chính: AD (ảnh chụp bị mắc viêm da cơ địa) và not_AD (ảnh chụp không phải viêm da cơ địa). Bộ dữ liệu gốc có tổng cộng 207 mẫu ảnh được chia vào hai thư mục AD và not_AD. Trong đó, có 90 ảnh nằm trong AD và 117 ảnh nằm trong not_AD. Trong thư mục AD gồm ảnh chụp những vùng bị nhiễm viêm da cơ địa ở nhiều phần bộ phận cơ thể khác nhau. Tập tin trong not_AD gồm ảnh chụp những vùng bị nhiệm những bệnh viêm da hay da liễu khác như vảy nến, bệnh chàm và viêm da dầu.
B. Cài đặt thực nghiệm và đánh giá
So sánh với kết quả trong các kỹ thuật cơ sở (Conv1, Conv2, Conv4, Conv5) theo chỉ số F1- score cũng như hai chỉ số là precision và recall cho thấy hiệu năng cải thiện một cách đáng kể. Tuy vậy, chúng tôi khuyết khích sử dụng tầng Conv3 để tiếp tục những nghiên cứu sau này, vì tầng này mang những đặc trưng sâu hơn của ảnh thay vì chỉ giới hạn đánh giá bề mặt như 2 tầng đầu Conv1 & Conv2 cũng như tránh việc bị giảm độ chính xác đáng kể ở 2 tầng cuối Conv4 & Conv5. Hiệu năng đánh giá trên toàn bộ tập dữ liệu cho kết quả như trong Bảng II.
Bảng II: Hiệu năng của hệ thống đề xuất
|
precision |
recall |
f1-score |
AD |
0.98 |
0.95 |
0.97 |
not_AD |
0.96 |
0.98 |
0.97 |
1https://github.com/vuvanhieu/IOIT_AtopicDermatitis/blob/ main/images.zip
Với kết quả đạt được cho phép ứng dụng thực tiễn có thể được phát triển thông qua thực nghiệm. Ví dụ cụ thể nhất là kết hợp mô hình này làm lớp giữa cho một hệ thống hay DNN/CNN khác, đóng vai trò vừa là một lớp phân loại cho bộ dữ liệu ở tầng CNNs trước vừa là một cơ sở dữ liệu cho một tầng CNNs sau. Ngoài ra còn có thể kết hợp với một số bộ phân loại khác để tăng hiệu năng của CNNs. Điều này được thể hiện sự tiềm năng cũng như linh hoạt của CNNs, đặc biệt trong việc ứng dụng khoa da liễu, khi dữ liệu mà thực nghiệm sử dụng dựa trên cơ sở bệnh viêm da cơ địa.
Thực nghiệm cho độ chính xác tốt hơn so với các nghiên cứu khác, như [13] khi mô hình cũng đạt kết quả về độ chính xác ngưỡng 0.86. Một số thực nghiệm khác cũng áp dụng VGG16 làm lớp tích chợp phân loại trước khi cho ảnh vào phân loại đặc trưng HOG. Một trong số đó có thể kể đến là [22], thực nghiệm thay vì phân loại và đánh giá ảnh, các tác giả phân tích ảnh logo thương hiệu. Thông thường, những nghiên cứu về tách biểu tương hay nhãn của hình ảnh như logo sẽ kết hợp sử dụng SVM sau khi đã thu được kết quả từ tính toán đặc trưng ảnh HOG như [23]. Điều này cũng chứng minh sự khả thi của việc áp dụng SVM với lớp DNN như CNN và phân loại HOG một cách tương tự trong đánh giá và chuẩn đoán AD và viêm da liễu nói riêng, thậm trí kể đến ung thư da và các bệnh da khác nói chung.
Hình 8: Mô hình kiến trúc hệ thống
VI. KẾT LUẬN
Bài nghiên cứu cùng với thực nghiệm của chúng tôi đã cho thấy một số kết luận nhất định trong nâng cao hiệu quả phát hiện và chuẩn đoán bệnh viêm da cơ đia sử dụng mang học sâu. Mạng học sâu được sử dụng chính trong các bài nghiên cứu và thực nghiệm của chúng tôi là CNNs, cho ra kết quả chuẩn đoán và đánh giá cao các đầu ảnh dữ liệu đạt độ chính xác cao. Điều này cho thấy tiềm năng của công nghệ này không chỉ trong phát hiện viêm da cơ địa nói riêng mà cả các bệnh da liễu nói chung, thậm chí có thể áp dụng trong chuẩn đoán ung thư da với bộ dữ liệu đủ lớn để đưa ra những chỉ số có thể so sánh được với chuẩn đoán của chuyên gia. Thực nghiệm của chúng tôi cũng cho thấy việc sử dụng phân loại đặc trưng HOG đạt được kết quả tốt khi kết hợp với một tầng CNNs làm đầu vào dữ liệu nhằm phục vụ chuẩn đoán AD. Tương tự như vậy, việc kết hợp CNNs với nhiều tầng lớp phân loại và DNN khác là hoàn toàn khả thi, không chỉ dừng lại trong chuẩn đoán ảnh y tế mà công việc này đã được thực thi trong nhận diện khuôn mặt hay logo đại diện thương hiệu. Mặc dù những điểm tích cực kể trên, còn một số hạn chế nhất định khi sử dụng mạng học sâu để chuẩn đoán AD. Một trong số đó là hạn chế về số lượng và chiều sâu của các bộ dữ liệu và sự thiếu nhất quán trong các bộ dữ liệu ảnh. Tuy nhiên, công nghệ đã đạt được mục đích nâng cao hiệu quả toàn diện và đã có những ứng dụng thực tiễn tại các bệnh viện trung ương cũng như tạo nền móng cho các nghiên cứu tương tự.
TÀI LIỆU
- T. Aoki, T. Fukuzumi, J. Adachi, K. Endo, and M. Kojima, “Re-evaluation of skin lesion distri- bution in atopic dermatitis. analysis of cases 0 to 9 years of age.” Acta dermato-venereologica. Supplementum, vol. 176, pp. 19–23, 1992.
- F. S. Larsen and J. M. Hanifin, “Epidemiology of atopic dermatitis,” Immunology and Allergy Clinics, vol. 22, no. 1, pp. 1–24, 2002.
- S. Hong, D. K. Son, W. R. Lim, S. H. Kim, H. Kim, H. Y. Yum, and H. Kwon, “The prevalence of atopic dermatitis, asthma, and allergic rhinitis and the comorbidity of allergic diseases in children,” Environmental health and toxicology, vol. 27, 2012.
- Z. C. C. Fuxench, J. K. Block, M. Boguniewicz, J. Boyle, L. Fonacier, J. M. Gelfand, M. H. Grayson, D. J. Margolis, L. Mitchell, J. I. Silver- berg et al., “Atopic dermatitis in america study: a cross-sectional study examining the prevalence and disease burden of atopic dermatitis in the us adult population,” Journal of Investigative Dermatology, vol. 139, no. 3, pp. 583–590, 2019.
- R. Luoma, A. Koivikko, and M. Viander, “De- velopment of asthma, allergic rhinitis and atopic dermatitis by the age of five years: a prospective study of 543 newborns,” Allergy, vol. 38, no. 5, pp. 339–346, 1983.
- J. Silverberg, J. Gelfand, D. Margolis, M. Bo- guniewicz, L. Fonacier, M. Grayson, P. Ong, Z. Chiesa Fuxench, and E. Simpson, “Symptoms and diagnosis of anxiety and depression in atopic dermatitis in us adults,” British Journal of Derma- tology, vol. 181, no. 3, pp. 554–565, 2019.
- A. Medela, T. Mac Carthy, S. A. A. Robles, C. M. Chiesa-Estomba, and R. Grimalt, “Automatic scor- ing of atopic dermatitis using deep learning: A pilot study,” JID Innovations, vol. 2, no. 3, p. 100107, 2022.
- S. Wang, D. M. Yang, R. Rong, X. Zhan, and G. Xiao, “Pathology image analysis using segmen- tation deep learning algorithms,” The American journal of pathology, vol. 189, no. 9, pp. 1686– 1698, 2019.
- M. A. Mazurowski, M. Buda, A. Saha, and M. R. Bashir, “Deep learning in radiology: An overview of the concepts and a survey of the state of the art with focus on mri,” Journal of magnetic resonance imaging, vol. 49, no. 4, pp. 939–954, 2019.
- M. S. Junayed, A. N. M. Sakib, N. Anjum, M. B. Islam, and A. A. Jeny, “Eczemanet: A deep cnn- based eczema diseases classification,” 2020 IEEE 4th International Conference on Image Process- ing, Applications and Systems (IPAS), pp. 174–179, 2020.
- K. Simonyan and A. Zisserman, “Very deep convo- lutional networks for large-scale image recognition,” CoRR, vol. abs/1409.1556, 2015.
- N. Dalal and B. Triggs, “Histograms of oriented gradients for human detection,” 2005 IEEE Com- puter Society Conference on Computer Vision and Pattern Recognition (CVPR’05), vol. 1, pp. 886–893 vol. 1, 2005.
- H. Wu, H. Yin, H. Chen, M. Sun, X. Liu, Y. Yu, Y. Tang, H. Long, B. Zhang, J. Zhang et al., “A deep learning, image based approach for automated diag- nosis for inflammatory skin diseases,” Ann Transl Med 2020, vol. 8(9), p. 581, 2020.
- J. Hu, L. Shen, S. Albanie et al., “Squeeze-and- excitation networks,” Proceedings of the IEEE con- ference on computer vision and pattern recogniton, pp. 7132–7141, 2018.
- E. Laitinen, E. S. Lohan, J. Talvitie, and S. Shrestha, “Access point significance measures in wlan-based location,” pp. 24–29, 2012.
- S. F. Aijaz, S. J. Khan, F. Azim, C. S. Shakeel, and U. Hassan, “Deep learning application for effective classification of different types of psoriasis,” Jour- nal of Healthcare Engineering, vol. 2022, 2022.
- P. Dwivedi, A. A. Khan, A. Gawade, and S. De- olekar, “A deep learning based approach for au- tomated skin disease detection using fast r-cnn,” in 2021 Sixth International Conference on Image Information Processing (ICIIP), vol. 6. IEEE, 2021, pp. 116–120.
- S. Park, S. N. Saw, X. Li, M. Paknezhad, D. Cop- pola, U. Dinish, A. B. E. Attia, Y. W. Yew, S. T. G. Thng, H. K. Lee et al., “Model learning analysis of 3d optoacoustic mesoscopy images for the clas- sification of atopic dermatitis,” Biomedical optics express, vol. 12, no. 6, pp. 3671–3683, 2021.
- Z. Jiang, J. Li, N. Kong, J.-H. Kim, B.-S. Kim, M.- J. Lee, Y. M. Park, S.-Y. Lee, S.-J. Hong, and J. H. Sul, “Accurate diagnosis of atopic dermatitis by combining transcriptome and microbiota data with supervised machine learning,” Scientific reports, vol. 12, no. 1, pp. 1–13, 2022.
- W. Zhou, A. Li, C. Zhang, Y. Chen, Z. Li, and Y. Lin, “Accurate diagnosis of atopic dermatitis by applying random forest and neural networks with transcriptomic data,” medRxiv, 2022.
- S. Khan, H. Rahmani, S. A. A. Shah, and M. Ben- namoun, “A guide to convolutional neural networks for computer vision,” Synthesis lectures on com- puter vision, vol. 8, no. 1, pp. 1–207, 2018.
- B. Kayalibay, G. Jensen, and P. van der Smagt, “Cnn-based segmentation of medical imaging data,” arXiv preprint arXiv:1701.03056, 2017.
- J. Brownlee, “How to visualize filters and feature maps in convolutional neural networks,” Machine Learning Mastery, 2019.