[논문 리뷰] [CV] Gradient-Based Learning Applied to Document Recognition, pytorch 구현

2025. 3. 16. 14:41· Paper Review(논문 리뷰)/Computer Vision
목차
  1. 0. Reference
  2. 1. Convolutional Neural networks for isolated character recognition
  3. 1.1. Convolutional Networks
  4. 1.2. LeNet-5
  5. 1.3. Loss Function
  6. 2. Pytorch 구현

0. Reference

https://ieeexplore.ieee.org/document/726791

 

Gradient-based learning applied to document recognition

Multilayer neural networks trained with the back-propagation algorithm constitute the best example of a successful gradient based learning technique. Given an appropriate network architecture, gradient-based learning algorithms can be used to synthesize a

ieeexplore.ieee.org

1. Convolutional Neural networks for isolated character recognition

- 기존의 Fully Connected Layer의 문제점은 다음과 같다.

i)

- 이미지의 픽셀은 인접한 픽셀과 관련이 되어 있는데, flatten을 거치면 locality 정보를 잃어버린다.

- 이로 인해 이동, 확대, 회전과 같은 변형에 취약해진다.

ii) 고해상도 이미지를 입력할 경우 parameter 수가 너무 많아지기 때문에, 막대한 계산비용을 초래한다.

1.1. Convolutional Networks

- FC Layer의 단점을 Convolution layer + pooling layer로 커버하게 된다.

- 우선 다음과 같은 장점이 존재한다.

 

i) local receptive fields를 학습할 수 있다, 즉, 주변 픽셀의 feature를 잘 추출할 수 있게 된다.

 

ii) shared weights

- FC Layer에 비해서 ConV Layer는 filter에만 weights가 주어지기 때문에, 학습할 파라미터 수가 적다.

iii) Subsampling

- 고해상도의 이미지를 저해상도의 이미지로 낮춰줄 수 있다. (Pooling을 통해)

 

1.2. LeNet-5

- LeNet-5의 구조는 다음과 같다.

i) C1

- Filter size : 5x5, stride = 1

- in channel : 1, out channel : 6

 

ii) S2

- Pooling size : 2x2, stride = 2

- average pooling

 

iii) C3 

- Filter Size : 5x5, stride = 1

- In Channel : 6, Out Channel : 16

- Overfitting을 방지하기 위해 다음 table에 맞춰서 필터를 연결하여 16개의 channel을 생성한다.

ex) 0번 feature map은 0,1,2번 filter를 통과후의 output

 

iv) S4

- Pooling size : 2x2, stride : 2

- average pooling

 

v) FC Layer

- 120 - 84 - 10

- 으로 FC Layer를 연결함

 

cf)

- 각각의 Activation function은 tanh을 사용하였다.

- Output Layer엔 RBF(Euclidean Radial Basis Function)을 사용하여 Output을 낸다.

 

1.3. Loss Function

- 사용되는 Lossfunction은 MSE를 사용한다.

 

2. Pytorch 구현

LeNet5.ipynb
0.11MB

 

'Paper Review(논문 리뷰) > Computer Vision' 카테고리의 다른 글

[논문 리뷰] [CV] Going deeper with convolutions  (0) 2025.03.18
[논문 리뷰] [CV] VERY DEEP CONVOLUTIONAL NETWORKSFOR LARGE-SCALE IMAGE RECOGNITION  (0) 2025.03.17
[논문 리뷰] [CV] Network In Network  (0) 2025.03.17
[논문 리뷰] [CV] Visualizing and Understanding Convolutional Networks  (1) 2025.03.17
[논문 리뷰] [CV] ImageNet Classification with Deep ConvolutionalNeural Networks  (0) 2025.03.16
  1. 0. Reference
  2. 1. Convolutional Neural networks for isolated character recognition
  3. 1.1. Convolutional Networks
  4. 1.2. LeNet-5
  5. 1.3. Loss Function
  6. 2. Pytorch 구현
'Paper Review(논문 리뷰)/Computer Vision' 카테고리의 다른 글
  • [논문 리뷰] [CV] VERY DEEP CONVOLUTIONAL NETWORKSFOR LARGE-SCALE IMAGE RECOGNITION
  • [논문 리뷰] [CV] Network In Network
  • [논문 리뷰] [CV] Visualizing and Understanding Convolutional Networks
  • [논문 리뷰] [CV] ImageNet Classification with Deep ConvolutionalNeural Networks
23학번이수현
23학번이수현
23학번이수현
밑바닥부터 시작하는 AI보안전문가
23학번이수현
전체
오늘
어제
  • 분류 전체보기 (243)
    • Statistic Study (47)
      • Mathematical Statistics(수리통.. (47)
    • Mathematics Study (15)
      • Linear Algebra (선형대수학) (15)
    • CS Study (74)
      • CLRS (자료구조 | 알고리즘) (49)
      • Database(DB) (11)
      • C++ (11)
      • 컴퓨터 구조 (2)
      • MongoDB (1)
    • DS Study (56)
      • CS 229(Machine Learning) (19)
      • CS 224n(NLP) (5)
      • Web Scraping (7)
      • R4DS(R언어) (20)
      • 밑바닥부터 시작하는 딥러닝 1 (5)
    • Hacking Study (0)
      • Web Hacking (0)
    • 코딩테스트 (5)
      • 백준-Python (5)
    • Paper Review(논문 리뷰) (43)
      • Deep Learning (16)
      • TCGA 관련 논문 (4)
      • Computer Vision (18)
      • NLP (5)

블로그 메뉴

  • 홈
  • 태그
  • 방명록

공지사항

인기 글

태그

  • graph
  • Data Structure
  • Algorithms
  • cs 224n
  • 파이썬
  • R4DS
  • 알고리즘
  • R언어
  • 선형대수학
  • 딥러닝
  • 데이터분석
  • 시간복잡도
  • clrs
  • 백준
  • LSTM
  • NLP
  • cs229
  • 정렬
  • db
  • 수리통계학
  • C++
  • Introduction to Algorithms
  • web scraping
  • Machine Learning
  • 자료구조
  • Linear Algebra
  • 논문 리뷰
  • introduction to algoritmhs
  • deep learning
  • AI

최근 댓글

최근 글

hELLO · Designed By 정상우.v4.2.2
23학번이수현
[논문 리뷰] [CV] Gradient-Based Learning Applied to Document Recognition, pytorch 구현
상단으로

티스토리툴바

단축키

내 블로그

내 블로그 - 관리자 홈 전환
Q
Q
새 글 쓰기
W
W

블로그 게시글

글 수정 (권한 있는 경우)
E
E
댓글 영역으로 이동
C
C

모든 영역

이 페이지의 URL 복사
S
S
맨 위로 이동
T
T
티스토리 홈 이동
H
H
단축키 안내
Shift + /
⇧ + /

* 단축키는 한글/영문 대소문자로 이용 가능하며, 티스토리 기본 도메인에서만 동작합니다.