0. Reference
https://www.nature.com/articles/s41598-022-16283-3
0.1. Data-set(대장암 및 위암 환자의 조직학적 이미지의 패치 411,890개)
https://zenodo.org/records/2530835
Histological images for MSI vs. MSS classification in gastrointestinal cancer, FFPE samples
This repository contains 411,890 unique image patches derived from histological images of colorectal cancer and gastric cancer patients in the TCGA cohort (original whole slide SVS images are freely available at https://portal.gdc.cancer.gov/). All images
zenodo.org
0.2. Source Code
https://github.com/jeonghyukpark/msi_highlow.
1. Introduction
- 딥러닝은 다양한 의학 정보를 예측하고 추출할 수 있는 능력을 입증해왔다고 한다.
- 일반적으로 딥러닝은 데이터 기반 방식으로 이미지에서 직접 target을 예측하도록 훈련되며, 그 성능은 임상 적용이 가능할 정도로 높다.
- 그러나 end-to-end방식이기에 예측하는 과정을 분석하기 어려워 black-box model이라고 불린다.
cf) ent-to-end : 원본데이터를 받아 알아서 최종 목표까지 예측하는 방식
- 이러한 딥러닝의 해석 가능성 부족 문제를 극복하기 위해,
- 최근에 딥러닝 모델을 이용하여 형태학적(morphological)특징을 먼저 예측한 후,
- 이를 기반으로 목표를 예측하는 새로운 접근법이 연구되고 있다고 한다.
- 해당 연구에서
- i) 조직 분할 모델(암 조직, 암 관련 기질, 괴사 조직의 세가지 분류),
- ii) 세포 탐지 모델(림프구, 형질세포, 섬유아세포,대식세포, 암세포의 다섯 가지 분류)
- 을 훈련하여 H&E(Hematoxylin and Eosin) 이미지에서 조직과 세포를 예측했다고한다.
cf) H&E : 의료 및 병리학에서 가장 널리 사용되는 조직 염색 방법
- 이후, 조직 및 세포 정보를 조합하여 총 607개의 image-based features을 정의한 후,
- 이를 이용해 예측한 결과, 해당 모델의 성능이 end-to-end와 유사한 수준이라고 한다.
- 해당 연구는 새로운 imaging biomarkers를 발굴하는 데 기여할 수 있어, 임상적으로 중요한 의미를 가진다고 한다.
cf) imaging biomarker는 특정 데이터에서의 특징이 질병과 관련이 있는 경우, 그 특징을 의미한다.
- 일반적으로, high-level approach model이 low-level approach model보다 우수한 것으로 알려져 있다.
- 해당 연구에서의 궁금증은 다음과 같다.
i) 동일한 예측 환경에서 두 모댈의 성능 차이는 어느 정도인가?
ii) 두 모델이 추출하는 형태학적 특징(morphological features)는 유사한가?
- 현재 biomarkers 연구에서 특정 모델을 선택할 과학적 근거가 부족하다고 한다.
- 이러한 두 질문에 답을 찾게 된다면, 병리학 연구에서 더 적합한 방법을 선택하는데 도움이 될 것이다.
- 해당 답을 찾기위해 마이크로 새틀라이트 불안정성 (MSI,Microsatellite Instability)
- 예측하는 문제를 연구 대상으로 선정하였다고 한다.
1.1. MSI?
- Microsatellite(MS)는 DNA에서 1~6개 염기가 반복되는 서열로,
- DNA 복제 과정에서 삽입또는 결실이 발생할 수 있다.
- 정상적으론 MMR(Mismatch Repair)이 이러한 오류를 수정하지만,
- MMR 유전자 결손이 있는 종양에서는 MSI가 발생한다고 한다.
- 해당 연구에서, MSI를 조직학적 특징 기반 low-level approch model로도 예측할 수 있는지 검증하고자 하였다.
1.2. 연구 방법
- 본 연구에서 TCGA 기반의 MSI 데이터셋을 사용하여 대장암(CRC) 및 위암(STAD) 환자 데이터를 분석하였다고 한다.
i) High-level approach
-- EifficientNet을 기반으로 end-to-end 모델을 구축하였다고 한다.
ii) low-level approach
-- 세 가지 딥러닝 기반 feature 추출 모델을 사용하여 조직 및 세포 정보를 분석하였다고 한다.
--- 9개 조직 분류 모델 (EfficientNet)
--- 6개 세포핵 검출 모델 (Hover-Net)
--- 2개 분비샘 검출 모델 (MaskRCNN)
- 추출된 특징을 LightGBM에 입력하여 MSI 상태를 분류하였다고 한다.
2. Result
2.1. Deep Learning models for high/low-level approaches
i) High-level approaches(MSI 분류 모델)
- Hold-out cross validation대신 5-fold cross-validation을 적용하였다고 한다.
- 평가 지표로 AUROC를 사용하였다고 한다.
- Efficient Net 기반 모델이 가장 우수한 성능을 보였다고 하고,
- 대장암(CRC) text set에서 AUROC = 0.8065를 기록하였다고 한다.
ii) Low-level approaches(형태학적 특징 추출을 위한 딥러닝 모델)
"""
1. 조직 분류 모델(Efficient net)
- 데이터 셋: 9개 조직 유형을 포함한 대장 조직 분류 데이터셋 사용
--> ADI,BACK,DEB,LYM,MUC,MUS,NORM,STR,TUM
2. 세포핵 검출 모델(HoVer-Net)
- PanNuke Dataset으로 pre-training된 model을 사용하였다고 한다.
- 6개의 세포핵 유형을 분류한다. (No-label, Neoplastic, Inflammatory, Connective,Necrosis,Non-neoplastic)
3. 분비샘 검출 모델(MaskRCNN)
- GlaS 챌린지 데이터셋을 사용하여 학습하였다고 한다.
"""
2.2. Image feature characteristics of the datasets.
- 특정 조직(Tissue) 패치의 형태학적 특징이 예상대로 서로 상관관계를 보인다고 한다.
- 예측된 세포 수 및 Gland 수를 분석하여, CRC의 조직 유형별 특징을 비교하였다고 한다.
- TUM 패치에서는 신생 세포수가 높았으며, NORM 패치에서는 양섬샘의 개수가 많았다고한다.
- 전반적으로, 신생 세포와 악성 샘의 수가 많은 것은 MSI 데이터셋 자체가 종양 조직에서 샘플링 되었기 때문일 가능성이 높다고 한다.
- 다음으로 MSS(Microsatellite Stable)과 MSI(Microsatellite Instable)의 이미지 특징을 분석하였다고 한다.
- MSS 그룹에서는 NORM, STR, TUM, Connective, Neoplastic, Malignant glands의 Z-score가 높게 나타났다고 한다.
- MSI 그룹에서는 DEB, LYM, Necrosis의 Z-score가 높게 나타났다고 한다.
- 이러한 결과가 임상적으로 보고된 "MSI 종양의 특징인 높은 TIL 침윤 및 분화 불량"과 일치하는 결과라고 한다.
--> 임상적으로 보고 된 것과 end-to-end로 학습한 결과가 일치한다고 생각하면 된다.
2.3. Image features related to microsatellite instability extracted by high/low-level approaches
- MSI 예측에서, High-level approache가 low-level approache보다 높은 성능을 보인다고한다.
- High-level,low-level 모두 MSI 예측에서 DEB,LYM,Necrosis가 중요한 특징으로 나타났다고 한다.
- STAD(위암) 데이터를 추가하여 성능 변화를 평가하였지만,
- High-level, low-level 모두 성능 향상이 일어나지 않았다고 한다.
--> STAD와 CRC가 MSI관련 이미지 특징이 다르기 때문일 가능성이 높다고 한다.
2.4. Qualitative review of select cases
- LYM 패치 내 괴사성 핵의 개수를 추가 feature로 사용하여 LGBM모델을 재학습하였더니,
- AUROC가 기존 0.6749 -> 0.6785로 소폭 향상되었다고 한다.
- 즉, 림프구 수가 MSI 예측에서 중요한 역할을 할 가능성을 시사한다고 볼 수 있다.
3. Discussion
3.1. High-level Approach vs Low-level Approach
- 일반적으로 high-level Approach model이 low-level approach model보다 높은 성능을 보인다고 한다.
- 하지만, feature engineering이 충분히 이루어지면, low-level approach도 high-level approach에 근사해진다고 한다.
- 그러나, 이러한 복잡한 특징을 정의하고 추출하는 것이 어렵기 때문에 low-level approach의 단점으로 작용된다.
3.2. High-level Approach를 위한 개선 방향
- MSI와 관련된 형태학적 특징을 더욱 정확히 식별하기 위해 WSL(Seakly Supervised Learning) 또는 MIL(Multiple instance learning)기법 적용이 필요하다고 한다.
3.3. 연구의 한계점
- 종양 영역에서 샘플링된 패치만 사용하였다고 한다.
--> 비종양 영역에서 중요한 특징이 존재할 가능성을 배제 못한다.
- 특정 배율(magnification)에서만 패치를 추출 하였다고 한다.
--> 더 넓은 영역에서의 형태학적 특징은 고려되지 않았다.
- 이질적인(hetergeneous) 세포 및 샘 구조 검출이 어렵다고 한다.
- 특히, 악성 샘(malignant glands)는 비정형적인 형태를 보이므로 개별 샘을 정확히 구별하기 어려웠다고 한다.
4. Materials and methods
4.1. Dataset
- 본 연구에선 세 가지 공개 데이터셋을 사용하였다고 한다.
i) MSI dataset
ii) Tissue dataset
iii) GlaS dataset
4.2. High-level MSI classification
- Optimizer는 Adam을 사용하였고, L2-Regularization을 사용하였다고 한다.
- learning rate : (1e-3,1e-6)
- MSS 패치와 MSI 패치의 개수를 동일하게 조정하여 학습
- Loss Function : Binary Corss-Entropy Loss
- Augmentation : 50% 확률로 Horizontal 및 vertical 적용, Affine 변환 적용
- EfficieintNet을 선택한 이유는 ResNet18,SguffleNet,ResNext50,EfficientNet중 가장 성능이 좋았다고 한다.