Mục lục
Bài viết được viết bởi Thạc sĩ, Bác sĩ Mai Viễn Phương - Bác sĩ nội soi tiêu hóa - Khoa Khám bệnh & Nội khoa - Bệnh viện Đa khoa Quốc tế Vinmec Central Park.
Loạn sản vảy thực quản được cho là tổn thương tiền ung thư biểu mô tế bào vảy thực quản và Barrett thực quản là tổn thương tiền ung thư có thể xác định được liên quan đến ung thư biểu mô tuyến thực quản. Việc theo dõi nội soi thực quản được khuyến nghị bởi các hiệp hội tiêu hoá để phát hiện sớm hai tổn thương này.
1. Tổng quan
Ung thư đường tiêu hóa trên (GI) là nguyên nhân hàng đầu gây tử vong liên quan đến ung thư trên toàn thế giới. Việc xác định sớm các tổn thương tiền ung thư đã được chứng minh là có thể giảm thiểu tỷ lệ mắc các bệnh ung thư đường tiêu hóa và chứng minh vai trò quan trọng của nội soi sàng lọc.
Tuy nhiên, không giống như ung thư đường tiêu hóa, các tổn thương tiền ung thư ở đường tiêu hóa trên có thể tinh vi và khó phát hiện. Các kỹ thuật trí tuệ nhân tạo, đặc biệt là các thuật toán học sâu với mạng nơ-ron phức hợp, có thể giúp các bác sĩ nội soi xác định các tổn thương tiền ung thư và giảm sự biến đổi giữa các máy chủ. Tình trạng của các thuật toán học sâu trong các tổn thương tiền ung thư tiêu hoá trên đã được tóm tắt một cách có hệ thống. Những thách thức và khuyến nghị nhằm vào lĩnh vực này được phân tích toàn diện cho các nghiên cứu trong tương lai.
2. Kỹ thuật trí tuệ nhân tạo trong nội soi thực quản
2.1. Kỹ thuật trí tuệ nhân tạo được sử dụng rộng rãi
Các kỹ thuật trí tuệ nhân tạo như học máy (ML) và học sâu (DL) đã được sử dụng rộng rãi trong hình ảnh nội soi để cải thiện độ chính xác và hiệu quả chẩn đoán của những tổn thương tiêu hoá khác nhau. Định nghĩa chính xác của trí tuệ nhân tạo, học máy và học sâu có thể bị hiểu nhầm bởi các bác sĩ. Trí tuệ nhân tạo, học máy và học sâu là các nguyên tắc chồng chéo.
- Trí tuệ nhân tạo là một hệ thống phân cấp bao gồm học máy và học sâu, nó mô tả một giải pháp máy tính hóa để giải quyết các vấn đề về nhận thức của con người do McCarthy xác định năm 1956.
- Học máy là một tập hợp con của trí tuệ nhân tạo, trong đó thuật toán có thể thực hiện các tác vụ phức tạp, nhưng nó cần trích xuất tính năng thủ công. Học máy bắt nguồn từ những năm 1980 và tập trung vào các mẫu và suy luận.
Học sâu là một tập con của học máy và trở nên khả thi vào những năm 2010, nó tập trung đặc biệt vào các mạng nơ-ron sâu. Mạng nơ-ron tích chập (CNN) là thuật toán học sâu chính để xử lý hình ảnh.
2.2. Thuật toán học sâu trong nội soi phát hiện các bất thường tiền ung thư ở niêm mạc thực quản
Ung thư thực quản là dạng ung thư phổ biến thứ 8 và gây tử vong cao thứ 6 trên toàn cầu. Có hai loại ung thư thực quản, đó là ung thư biểu mô tế bào vảy thực quản (ESCC) và ung thư biểu mô tuyến thực quản (EAC).
Loạn sản vảy thực quản (ESD) được cho là tổn thương tiền ung thư thực quản ESCC, Barrett thực quản (BE) là tổn thương tiền ung thư có thể xác định được liên quan đến EAC. Theo dõi nội soi họng thực quản được khuyến nghị bởi các hiệp hội tiêu hoá để cho phép phát hiện sớm hai tổn thương này. Tuy nhiên, các phương pháp chẩn đoán nội soi hiện tại cho bệnh nhân BE, chẳng hạn như sinh thiết 4 góc phần tư ngẫu nhiên, nội soi bằng laser, nội soi nâng cao hình ảnh,... có những nhược điểm liên quan đến đường cong học tập, chi phí, sự thay đổi giữa máy chủ và các vấn đề về thời gian.
Tiêu chuẩn hiện tại để xác định ESD là nội soi sắc tố của Lugol, nhưng nó cho thấy độ đặc hiệu kém. Bên cạnh đó, nhuộm i-ốt thường tiềm ẩn nguy cơ phản ứng dị ứng. Để vượt qua những thách thức này, các hệ thống trí tuệ nhân tạo dựa trên học sâu đã được thiết lập để giúp các nhà nội soi xác định ESD và BE.
2.3. Thuật toán học sâu trong ESD
Các khối u nội biểu mô cấp độ thấp và cấp độ cao, được gọi chung là ESD, được coi là tổn thương tiền ung thư thực quản ESCC. Việc phát hiện sớm và chính xác ESD là điều cần thiết nhưng cũng đầy thách thức. Học sâu có thể mô tả ESD một cách đáng tin cậy trong nội soi họng thực quản trên thời gian thực. Cai và cộng sự đã thiết kế một hệ thống chẩn đoán mới với sự hỗ trợ của máy tính để xác định vị trí ESCC sớm, bao gồm ung thư nội biểu mô cấp độ thấp và cấp độ cao, thông qua nội soi ánh sáng trắng thời gian thực (WLE). Hệ thống đạt độ nhạy, độ đặc hiệu và độ chính xác lần lượt là 97,8%, 85,4% và 91,4%.
Họ cũng chứng minh rằng, khi tham khảo kết quả của hệ thống, khả năng chẩn đoán tổng thể của bác sĩ nội soi đã được tăng lên. Nghiên cứu này đã mở đường cho việc chẩn đoán ESD và ESCC theo thời gian thực. Sau công trình này, Guo và cộng sự đã áp dụng 6473 hình ảnh dải hẹp (NB) để đào tạo hệ thống chẩn đoán tự động để hỗ trợ những người không phải là chuyên gia trong việc phát hiện ESD và ESCC. Hệ thống này đóng vai trò như một “quan sát viên thứ hai” trong nội soi thực quản và đạt được độ nhạy 98,04%; độ đặc hiệu là 95,30% trên hình ảnh NB. Độ nhạy mỗi khung hình là 96,10% để phóng đại video hình ảnh dải hẹp (M-NBI) và 60,80% cho video không phải M-NBI. Độ nhạy trên mỗi tổn thương là 100% trong video M-NBI.
2.4. Thuật toán học sâu trong BE (Barret’s thực quản)
BE là một rối loạn trong đó niêm mạc của thực quản bị tổn thương bởi axit dịch vị. Mục đích quan trọng của việc theo dõi Barrett qua nội soi là phát hiện sớm chứng loạn sản liên quan đến BE. Gần đây, đã có nhiều nghiên cứu về chẩn đoán BE dựa trên học sâu và các tác giả xem xét một số nghiên cứu đại diện.
De Groof và cộng sự đã thực hiện một trong những nghiên cứu thử nghiệm đầu tiên để đánh giá hiệu suất của hệ thống dựa trên học sâu trong quá trình nội soi trực tiếp của bệnh nhân có hoặc không mắc chứng loạn sản BE. Hệ thống đã chứng minh độ chính xác 90%, độ nhạy 91% và độ đặc hiệu 89% trong phân tích theo cấp độ. Sau nghiên cứu, họ đã cải tiến hệ thống này bằng cách sử dụng học chuyển đổi từng bước và năm bộ dữ liệu nội soi độc lập. Hệ thống nâng cao có độ chính xác hơn so với các nhà nội soi không có chuyên môn, hiệu suất phân định tương đương. Hơn nữa, nhóm của họ cũng chứng minh tính khả thi của hệ thống dựa trên học sâu để mô tả đặc điểm mô của nội soi NBI ở BE, hệ thống này đã đạt được độ chính xác chẩn đoán đầy hứa hẹn.
3. Thuật toán học sâu trong các bất thường tiền ung thư ở niêm mạc dạ dày
3.1. Nội soi phát hiện các bất thường tiền ung thư ở niêm mạc dạ dày
Ung thư dạ dày là dạng ung thư phổ biến thứ 5 và gây tử vong cao thứ 3 trên toàn cầu. Mặc dù tỷ lệ ung thư dạ dày đã giảm trong vài thập kỷ qua, nhưng ung thư dạ dày vẫn là một vấn đề lâm sàng quan trọng, đặc biệt ở các nước đang phát triển. Điều này là do hầu hết bệnh nhân được chẩn đoán ở giai đoạn muộn với tiên lượng xấu và các lựa chọn điều trị bị hạn chế.
Cơ chế bệnh sinh của ung thư dạ dày liên quan đến một loạt các sự kiện bắt đầu từ viêm mãn tính do Helicobacter pylori gây ra (H. pylori), tiến triển thành viêm dạ dày teo, chuyển sản ruột, loạn sản và cuối cùng là ung thư dạ dày.
Bệnh nhân có các tổn thương tiền ung thư (ví dụ như viêm mãn tính do H. pylori gây ra, viêm teo dạ dày, chuyển sản ruột và loạn sản) có nguy cơ đáng kể gây ung thư dạ dày. Người ta đã lập luận rằng, việc phát hiện các tổn thương tiền ung thư như vậy có thể làm giảm đáng kể tỷ lệ mắc ung thư dạ dày. Tuy nhiên, kiểm tra nội soi rất khó xác định các tổn thương tiền ung thư này, kết quả chẩn đoán cũng có sự thay đổi giữa các ống soi cao do khác hình thái tinh vi của chúng trong niêm mạc và thiếu các bác sĩ nội soi có kinh nghiệm.
Hiện nay, nhiều nhà nghiên cứu đang cố gắng sử dụng các phương pháp dựa trên thuật toán học sâu để phát hiện các tổn thương tiền ung thư dạ dày.
3.2. Thuật toán học sâu trong nhiễm H. pylori
Hầu hết các tổn thương tiền ung thư dạ dày có liên quan đến nhiễm H. pylori lâu dài. Shichijo và cộng sự đã thực hiện một trong những nghiên cứu tiên phong áp dụng CNN trong chẩn đoán nhiễm H. pylori. CNN được xây dựng trên GoogLeNet và được đào tạo trên 32208 hình ảnh WLE. Một trong những mô hình CNN của họ có độ chính xác cao hơn so với các nhà nội soi. Nghiên cứu cho thấy tính khả thi của việc sử dụng CNN để chẩn đoán H. pylori từ hình ảnh nội soi.
Sau nghiên cứu này, Itoh và cộng sự đã phát triển một mô hình CNN để phát hiện H. pylori nhiễm trùng trong hình ảnh WLE và cho thấy độ nhạy là 86,7%; độ đặc hiệu là 86,7% trong bộ dữ liệu thử nghiệm.
Một mô hình tương tự được phát triển bởi Zheng và cộng sự để đánh giá tình trạng nhiễm H. pylori. Độ nhạy, độ đặc hiệu và độ chính xác trên mỗi bệnh nhân của mô hình lần lượt là 91,6%; 98,6% và 93,8%. Bên cạnh WLE, hệ thống hình ảnh màu liên kết và sáng bằng laser xanh lam đã được Nakashima cùng cộng sự ứng dụng một cách có hiệu quả để thu thập hình ảnh nội soi. Với những hình ảnh này, họ đã tinh chỉnh một GoogLeNet được đào tạo trước để dự đoán H. pylori tình trạng nhiễm trùng. So với hình ảnh màu liên kết, mô hình đạt được độ nhạy cao nhất (96,7%) và độ đặc hiệu (86,7%) khi sử dụng hình ảnh laser màu xanh lam-sáng. Nakashima và cộng sự cũng đã thực hiện một nghiên cứu tiền cứu tại một trung tâm duy nhất để xây dựng mô hình CNN để xác định tình trạng của H. pylori ở những bệnh nhân chưa nhiễm, hiện đã nhiễm và sau khi tiệt trừ. Diện tích dưới đường cong đặc tính hoạt động của máy thu đối với các loại chưa nhiễm, hiện đã nhiễm và sau loại trừ lần lượt là 0,90; 0,82 và 0,77.
3.3. Thuật toán học sâu trong viêm teo dạ dày
Viêm teo dạ dày là một dạng viêm mãn tính của niêm mạc dạ dày, nội soi chẩn đoán chính xác rất khó. Guimarães và cộng sự đã báo cáo việc áp dụng CNN để phát hiện viêm dạ dày thể teo, hệ thống này đạt độ chính xác 93% và hoạt động tốt hơn các chuyên gia nội soi.
Gần đây, một hệ thống khác dựa trên CNN để phát hiện viêm dạ dày teo đã được báo cáo bởi Zhang và cộng sự. Mô hình CNN được đào tạo và thử nghiệm trên tập dữ liệu chứa 3042 hình ảnh có viêm dạ dày teo và 2428 không có viêm dạ dày teo. Độ chính xác chẩn đoán, độ nhạy và độ đặc hiệu của mô hình lần lượt là 94,2%; 94,5% và 94,0%, tốt hơn so với kết quả của các chuyên gia.
Gần đây hơn, Horiuchivà cộng sự đã khám phá khả năng chẩn đoán của mô hình CNN để phân biệt ung thư dạ dày sớm và viêm dạ dày thông qua M-NBI; CNN 22 lớp được xây dựng trên GoogleNet và được đào tạo trước bằng cách sử dụng 2570 hình ảnh nội soi. Độ nhạy, độ đặc hiệu và độ chính xác trên 258 hình ảnh lần lượt là 95,4%; 71,0% và 85,3%. Ngoại trừ độ nhạy cao, mô hình CNN cũng cho thấy tốc độ thử nghiệm tổng thể là 0,02 giây cho mỗi hình ảnh, nhanh hơn so với các chuyên gia về con người.
3.4. Thuật toán học sâu trong chuyển sản ruột
Chuyển sản ruột là sự thay thế các tế bào biểu mô niêm mạc loại dạ dày bằng các tế bào loại ruột, đây là một tổn thương tiền ung thư với tỷ lệ lưu hành trên toàn thế giới là 25%. Các đặc điểm hình thái học của chuyển sản ruột rất tinh vi và khó quan sát, vì vậy việc chẩn đoán thủ công chuyển sản ruột đầy thách thức. Wang và cộng sự đã báo cáo trường hợp đầu tiên của một hệ thống trí tuệ nhân tạo để bản địa hóa và xác định chuyển sản ruột từ các hình ảnh WLE. Hệ thống đạt được độ chính xác phân loại cao và kết quả phân đoạn đạt yêu cầu.
Nghiên cứu gần đây đã phát triển một hệ thống chẩn đoán dựa trên CNN có thể phát hiện viêm dạ dày teo và chuyển sản ruột từ hình ảnh WLE. Độ nhạy phát hiện và độ đặc hiệu đối với viêm dạ dày thể teo lần lượt là 87,2% và 91,1%. Để phát hiện chuyển sản ruột, hệ thống cũng đạt độ nhạy 90,3% và độ đặc hiệu 93,7%.
Gần đây, nhóm của các tác giả cũng đã phát triển một hệ thống chẩn đoán dựa trên học sâu mới để phát hiện chuyển sản ruột trong hình ảnh nội soi. Sự khác biệt so với nghiên cứu trước đó là hệ thống của các tác giả bao gồm ba CNN độc lập, có thể xác định chuyển sản ruột từ NBI hoặc M-NBI. Độ nhạy, độ đặc hiệu và độ chính xác trên mỗi bệnh nhân của hệ thống lần lượt là 91,9%; 86,0% và 88,8%. Hiệu suất chẩn đoán không có sự khác biệt đáng kể so với các chuyên gia về con người. Nghiên cứu của các tác giả cho thấy rằng, việc tích hợp NBI và M-NBI vào hệ thống học sâu có thể đạt được hiệu suất chẩn đoán thỏa đáng cho chuyển sản ruột.
3.5. Thuật toán học sâu trong loạn sản dạ dày
Loạn sản dạ dày là bước cuối cùng của quá trình sinh ung thư dạ dày và chẩn đoán chính xác tổn thương này vẫn còn nhiều tranh cãi. Để phân loại chính xác loạn sản cấp độ thấp tiên tiến, loạn sản cấp độ cao, ung thư dạ dày sớm và ung thư dạ dày, Choetal đã thiết lập ba mô hình CNN dựa trên 5017 hình ảnh nội soi. Họ nhận thấy rằng, mô hình Inception-Resnet-v2 hoạt động tốt nhất, trong khi nó cho thấy độ chính xác năm lớp thấp hơn so với các nhà nội soi (76,4% so với 87,6%).
Inoue và cộng sự đã xây dựng một hệ thống phát hiện bằng cách sử dụng máy dò Multibox Chụp một lần, có thể tự động phát hiện u tuyến tá tràng và chứng loạn sản cấp cao từ WLE hoặc NBI. Hệ thống phát hiện 94,7% u tuyến và 100% loạn sản cấp cao trên tập dữ liệu chứa 1080 hình ảnh nội soi chỉ trong vòng 31 giây. Mặc dù hầu hết các hệ thống được hỗ trợ bởi trí tuệ nhân tạo có thể đạt được độ chính xác cao trong chẩn đoán nội soi, nhưng chưa có nghiên cứu nào khảo sát vai trò của trí tuệ nhân tạo trong việc đào tạo các bác sĩ nội soi cơ sở. Để đánh giá vai trò của trí tuệ nhân tạo trong việc đào tạo các bác sĩ nội soi cơ sở trong việc dự đoán mô học của các tổn thương dạ dày qua nội soi, bao gồm cả loạn sản, Lui và cộng sự đã thiết kế và xác thực bộ phân loại CNN dựa trên hình ảnh 3000 NB. Máy phân loại đạt độ chính xác tổng thể 91,0%, độ nhạy 97,1% và độ đặc hiệu 85,9%, vượt trội so với tất cả các bác sĩ nội soi cơ sở. Họ cũng chứng minh rằng với phản hồi từ máy phân loại CNN, đường cong học tập của các bác sĩ nội soi cơ sở đã được cải thiện trong việc dự đoán mô học của các tổn thương dạ dày.
4. Độ nhạy và độ chuyên của phương phám chẩn đoán này
Hashimoto và cộng sự đã phát triển mô hình phân loại thời gian thực của bệnh tân sinh thực quản sớm ở BE, họ cũng áp dụng YOLO-v2 để vẽ các hộp bản địa hóa xung quanh vùng được phân loại là loạn sản. Hệ thống đạt độ nhạy 96,4%, độ đặc hiệu 94,2% và độ chính xác 95,4% trong chẩn đoán ung thư. Hussein và cộng sự đã xây dựng mô hình CNN để chẩn đoán niêm mạc BE loạn sản với độ nhạy 88,3%; độ đặc hiệu là 80,0%.
Kết quả sơ bộ chỉ ra rằng, hiệu suất chẩn đoán của mô hình CNN gần với hiệu suất chẩn đoán của các bác sĩ nội soi có kinh nghiệm. Ebigbo và cộng sự đã khai thác việc sử dụng hệ thống dựa trên CNN để phân loại và phân đoạn ung thư ở BE. Hệ thống đạt được độ chính xác 89,9% ở 14 bệnh nhân mắc ung thư BE.
5. Thuật toán học sâu có thể phân biệt nhiều loại tổn thương thực quản
Học sâu cũng đã đạt được kết quả xuất sắc trong việc phân biệt nhiều loại tổn thương thực quản, bao gồm cả BE. Liu và cộng sự đã khám phá việc sử dụng mô hình CNN để phân biệt ung thư thực quản với BE.
Sau khi xử lý trước và tăng dữ liệu, độ nhạy, độ đặc hiệu và độ chính xác trung bình của mô hình CNN lần lượt là 94,23%; 94,67% và 85,83%. Wu và cộng sự đã phát triển một khung dựa trên CNN có tên ELNet để điều trị tổn thương thực quản tự động (tức là phân loại và phân đoạn EAC, BE, viêm). ELNet đạt được độ nhạy phân loại là 90,34%; độ đặc hiệu là 97,18% và độ chính xác là 96,28%. Độ nhạy, độ đặc hiệu và độ chính xác của phân đoạn lần lượt là 80,18%; 96,55% và 94,62%. Một nghiên cứu tương tự đã được đề xuất bởi Ghatwary và cộng sự, người đã áp dụng thuật toán CNN để phát hiện BE, EAC, ESCC từ video nội soi và thu được độ nhạy 93,7%, độ đặc hiệu là 93,2%.
Khám sàng lọc ung thư đường tiêu hoá là biện pháp khoa học và hiệu quả để phát hiện sớm ung thư đường tiêu hóa (ung thư thực quản, ung thư dạ dày, ung thư đại tràng) và đưa ra phác đồ điều trị tốt nhất.
Tài liệu tham khảo:
Yan T, Wong PK, Qin YY. Học sâu để chẩn đoán các tổn thương tiền ung thư trong nội soi đường tiêu hóa trên: Một đánh giá. World J Gastroenterol 2021; 27 (20): 2531-2544 [DOI: 10.3748 / wjg.v27.i20.2531]
- Tìm hiểu nội soi thực quản - dạ dày - tá tràng dải tần hẹp (NBI)
- Chi phí nội soi dạ dày gây mê có cao không?
- Quy trình thực hiện chụp x quang thực quản