[논문 리뷰] [CV] Deep Residual Learning for Image Recognition

2025. 3. 21. 12:34· Paper Review(논문 리뷰)/Computer Vision
목차
  1. 0. Reference
  2. 1. Introduction
  3. 2. Deep Residual Learning
  4. 2.1. Residual Learning
  5. 2.2. Identity Mapping by Shortcuts
  6. 2.3. Architecture

0. Reference

https://arxiv.org/abs/1512.03385

 

Deep Residual Learning for Image Recognition

Deeper neural networks are more difficult to train. We present a residual learning framework to ease the training of networks that are substantially deeper than those used previously. We explicitly reformulate the layers as learning residual functions with

arxiv.org

1. Introduction

- 해당 논문은 "더 성능이 좋은 Network를 만들기 위해서, 단순히 layer를 추가하면 될까?"라는 질문에서 시작되었다.

- Network의 깊이가 증가함에 따라 정확도가 일정수준에서 saturated되는 것을 확인할 수 있었다고 한다.

- 근데, 놀랍게도 Overfitting이 문제가 아니라고 하며, training error가 증가하는 현상이 관찰되었다고 한다.

 

- Depth-model과 Shallow-model을 비교하였을 때,

- 그냥 단순히 Depth-model을 Shallow-model에 identity mapping만 더해준 형태라고 생각하면,

- 이 둘의 error의 차이는 이론적으로 크지 않아야 된다.

- 하지만, Depth model의 성능이 더 떨어지게 되는데(Degradation problem),

- 그 이유는 Optimization이 depth model에서 Optimal solution을 찾기 힘든 아이이기 때문이다.

- cf) Gradient vanish나 gradient explode가 발생할 가능성이 높다.

 

2. Deep Residual Learning

2.1. Residual Learning

- 기존의 Deep learning model이 학습을 하는 방식은 다음과 같다.

- x -------> H(x)

 

- resnet이 학습하는 방식은 다음과 같다.

- H(x) = x + f(x) #여기서 f(x)만 learning되고, x는 not learning된다.

 

- 핵심 아이디어는 다음과 같다. 우리가 앞서서 단지 H(X)자체를 Identity function으로 근사하는게 목적이라고 생각하자.

- 그러면 기존의 Deep learning방식은 x를 I(x)로 완전히 다르게 mapping시켜야 하지만,

- Resnet방식을 잘 보면, 그냥 f(x)를 0으로 이루어진 tensor로만 만들어주면 H(x) = x가 되면서 Identity mapping이 가능하게 된다.

- 즉, Residual Learning 방식이 보다 편하게 학습된다는 것을 알 수 있다.

cf) 여기서 x를 더해주는 과정을 Shortcut Connection이라고 한다.

 

2.2. Identity Mapping by Shortcuts

- Residual learning이 일어나는 block을 우리는 Residual block이라고 정의하자.

- Residual block를 수식으로 나타내면 다음과 같다.

y = f(x,wi) + x # + x : Shortcut connection

f(x,wi) = max(wi^Tx,0)

 

- 여기서, x와 f(x,wi)와의 dimension이 다를 경우, identity mapping하여 dimension을 같게 만들어준다.

- 이과정은 broadcasting과 유사한 작업이라고 생각하면 좋다.

 

cf) 아래 그림처럼 Affine층을 한번만 거치는 Residual Learning은 효과가 없다고 한다.

 

2.3. Architecture

 

- 결과적으로 152 layer까지 쌓아올렸다고 한다.

 

'Paper Review(논문 리뷰) > Computer Vision' 카테고리의 다른 글

[논문 리뷰] [CV] Inception-v4, Inception-ResNet and the Impact of Residual Connections on Learning  (0) 2025.03.23
[논문 리뷰] [CV] Delving Deep into Rectifiers:Surpassing Human-Level Performance on ImageNet Classification  (0) 2025.03.21
[논문 리뷰] [CV] Rethinking the Inception Architecture for Computer Vision  (0) 2025.03.19
[논문 리뷰] [CV] Going deeper with convolutions  (0) 2025.03.18
[논문 리뷰] [CV] VERY DEEP CONVOLUTIONAL NETWORKSFOR LARGE-SCALE IMAGE RECOGNITION  (0) 2025.03.17
  1. 0. Reference
  2. 1. Introduction
  3. 2. Deep Residual Learning
  4. 2.1. Residual Learning
  5. 2.2. Identity Mapping by Shortcuts
  6. 2.3. Architecture
'Paper Review(논문 리뷰)/Computer Vision' 카테고리의 다른 글
  • [논문 리뷰] [CV] Inception-v4, Inception-ResNet and the Impact of Residual Connections on Learning
  • [논문 리뷰] [CV] Delving Deep into Rectifiers:Surpassing Human-Level Performance on ImageNet Classification
  • [논문 리뷰] [CV] Rethinking the Inception Architecture for Computer Vision
  • [논문 리뷰] [CV] Going deeper with convolutions
23학번이수현
23학번이수현
23학번이수현
밑바닥부터 시작하는 AI보안전문가
23학번이수현
전체
오늘
어제
  • 분류 전체보기 (242)
    • Statistic Study (47)
      • Mathematical Statistics(수리통.. (47)
    • Mathematics Study (15)
      • Linear Algebra (선형대수학) (15)
    • CS Study (73)
      • CLRS (자료구조 | 알고리즘) (49)
      • Database(DB) (11)
      • C++ (11)
      • 컴퓨터 구조 (2)
    • DS Study (56)
      • CS 229(Machine Learning) (19)
      • CS 224n(NLP) (5)
      • Web Scraping (7)
      • R4DS(R언어) (20)
      • 밑바닥부터 시작하는 딥러닝 1 (5)
    • Hacking Study (0)
      • Web Hacking (0)
    • 코딩테스트 (5)
      • 백준-Python (5)
    • Paper Review(논문 리뷰) (43)
      • Deep Learning (16)
      • TCGA 관련 논문 (4)
      • Computer Vision (18)
      • NLP (5)

블로그 메뉴

  • 홈
  • 태그
  • 방명록

공지사항

인기 글

태그

  • AI
  • db
  • web scraping
  • R언어
  • deep learning
  • R4DS
  • Algorithms
  • cs229
  • 딥러닝
  • Introduction to Algorithms
  • 데이터분석
  • 자료구조
  • Linear Algebra
  • 선형대수학
  • 파이썬
  • 백준
  • introduction to algoritmhs
  • 수리통계학
  • 정렬
  • clrs
  • graph
  • 시간복잡도
  • Machine Learning
  • cs 224n
  • LSTM
  • 논문 리뷰
  • Data Structure
  • NLP
  • C++
  • 알고리즘

최근 댓글

최근 글

hELLO · Designed By 정상우.v4.2.2
23학번이수현
[논문 리뷰] [CV] Deep Residual Learning for Image Recognition
상단으로

티스토리툴바

단축키

내 블로그

내 블로그 - 관리자 홈 전환
Q
Q
새 글 쓰기
W
W

블로그 게시글

글 수정 (권한 있는 경우)
E
E
댓글 영역으로 이동
C
C

모든 영역

이 페이지의 URL 복사
S
S
맨 위로 이동
T
T
티스토리 홈 이동
H
H
단축키 안내
Shift + /
⇧ + /

* 단축키는 한글/영문 대소문자로 이용 가능하며, 티스토리 기본 도메인에서만 동작합니다.