DCGAN

코딩 및 기타

DCGAN

정지홍 2025. 9. 11. 16:25

Leaky ReLU함수 ==> https://wikidocs.net/163752

DCGAN

GAN을 CNN으로 설계하여 안전성을 개선한 모델
- 초기의 GAN은 fully-connected였다.
  DCGAN은 이를 최대한 배재하였다..
  ==> "strided convolution"과 "transposed convolution"으로 네트워크 구조를 만듬.

왜 fully-connected layer를 제거하였나?
- FC는 파라미터가 급증하며, 공간구조를 깨뜨려서 지역패턴 학습이 비효율적이다.

표쥰 아키텍쳐 ( ex. 64x64 RGB , z=100 )
- Generator( G )
  - input : z∈R^100 ~N(0,1)
  - 4x4 x 1024 ==> 8x8 x 512 ==> 16x16 x 256 ==> 8x8 x 512 ==> 4x4 x 1024 --> 스칼라
  - 각각의 블록 : ConvTranspose2d( kernel 4 , stride 2 , padding 1 ) + batchNorm + ReLU
  - 마지막 블록 : ConvTranspose2d --> Tanh
- Discriminator
  - input : 64 x 64 x 3
  - 64x64 x 3 ==> 32x32 x 128 ==> 16x16 x 256 ==> 8x8 x 512 ==> 4x4 x 1024 --> 스칼라
  - 각각의 블록 : Conv2d( kernel 4 , stride 2 , padding 1 ) + batchNorm + LeakyReLU(0.2)
  - 마지막: Conv2d ==> Sigmoid(BCE) or linear( BCE with Logits )

generator

'코딩 및 기타' 카테고리의 다른 글

AE , AutoEncoder (0)	2025.09.14
latent vector (0)	2025.09.12
아나콘다 가상환경 설정 (0)	2025.09.11
pytorch lstm (0)	2025.09.10
Diffusion Model (1)	2025.09.09

현재글DCGAN

정지홍

Fuzzy, gz sim, anytime rrt, turtlesim, rrt*, SLAM, rrt star, turtlebot, urdf, 티스토리챌린지, 퍼지 이론, 퍼지이론, ros, 퍼지, Gazebo, ros2, Nav2, ROS 2, RRT, 오블완,

Today :
Yesterday :

티스토리툴바