[논문 리뷰] [CV] Gradient-Based Learning Applied to Document Recognition, pytorch 구현

0. Reference
1. Convolutional Neural networks for isolated character recognition
1.1. Convolutional Networks
1.2. LeNet-5
1.3. Loss Function
2. Pytorch 구현

0. Reference

https://ieeexplore.ieee.org/document/726791

Gradient-based learning applied to document recognition

Multilayer neural networks trained with the back-propagation algorithm constitute the best example of a successful gradient based learning technique. Given an appropriate network architecture, gradient-based learning algorithms can be used to synthesize a

ieeexplore.ieee.org

1. Convolutional Neural networks for isolated character recognition

- 기존의 Fully Connected Layer의 문제점은 다음과 같다.

- 이미지의 픽셀은 인접한 픽셀과 관련이 되어 있는데, flatten을 거치면 locality 정보를 잃어버린다.

- 이로 인해 이동, 확대, 회전과 같은 변형에 취약해진다.

ii) 고해상도 이미지를 입력할 경우 parameter 수가 너무 많아지기 때문에, 막대한 계산비용을 초래한다.

1.1. Convolutional Networks

- FC Layer의 단점을 Convolution layer + pooling layer로 커버하게 된다.

- 우선 다음과 같은 장점이 존재한다.

i) local receptive fields를 학습할 수 있다, 즉, 주변 픽셀의 feature를 잘 추출할 수 있게 된다.

ii) shared weights

- FC Layer에 비해서 ConV Layer는 filter에만 weights가 주어지기 때문에, 학습할 파라미터 수가 적다.

iii) Subsampling

- 고해상도의 이미지를 저해상도의 이미지로 낮춰줄 수 있다. (Pooling을 통해)

1.2. LeNet-5

- LeNet-5의 구조는 다음과 같다.

i) C1

- Filter size : 5x5, stride = 1

- in channel : 1, out channel : 6

ii) S2

- Pooling size : 2x2, stride = 2

- average pooling

iii) C3

- Filter Size : 5x5, stride = 1

- In Channel : 6, Out Channel : 16

- Overfitting을 방지하기 위해 다음 table에 맞춰서 필터를 연결하여 16개의 channel을 생성한다.

ex) 0번 feature map은 0,1,2번 filter를 통과후의 output

iv) S4

- Pooling size : 2x2, stride : 2

- average pooling

v) FC Layer

- 120 - 84 - 10

- 으로 FC Layer를 연결함

cf)

- 각각의 Activation function은 tanh을 사용하였다.

- Output Layer엔 RBF(Euclidean Radial Basis Function)을 사용하여 Output을 낸다.

1.3. Loss Function

- 사용되는 Lossfunction은 MSE를 사용한다.

2. Pytorch 구현

LeNet5.ipynb

0.11MB

'Paper Review(논문 리뷰) > Computer Vision' 카테고리의 다른 글

[논문 리뷰] [CV] Going deeper with convolutions (0)	2025.03.18
[논문 리뷰] [CV] VERY DEEP CONVOLUTIONAL NETWORKSFOR LARGE-SCALE IMAGE RECOGNITION (0)	2025.03.17
[논문 리뷰] [CV] Network In Network (0)	2025.03.17
[논문 리뷰] [CV] Visualizing and Understanding Convolutional Networks (1)	2025.03.17
[논문 리뷰] [CV] ImageNet Classification with Deep ConvolutionalNeural Networks (0)	2025.03.16

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

[논문 리뷰] [CV] Gradient-Based Learning Applied to Document Recognition, pytorch 구현

0. Reference