전체 글 (48) 썸네일형 리스트형 [논문리뷰]Image Style Transfer Using Convolutional Neural Networks 이 포스트는 Style Transfer라고 알려져 있는 https://rn-unison.github.io/articulos/style_transfer.pdf에 대한 논문에 대한 리뷰입니다. Abstract 서로 다른 스타일의 이미지에서 의미있는 정보를 뽑는것은 어려운 image processing 문제이다. 저자는 CNN을 통해서 이미지에서 high level 정보를 뽑아낸다. 그리고 이를 통해 content image와 style image를 결합하는 과정을 통해 Artistic style 알고리즘을 만들었다. 1. Introduction 하나의 이미지의 스타일을 다른 이미지에 옮기는 것은 texture transfer하는 문제이다. Texture transfer의 목표는 source image로 부터.. [논문리뷰]ArcFace: Additive Angular Margin Loss for Deep Face Recognition Abstract Face recognition(FR)을 위한 feature learning을 진행할 때 중요한 부분은 적절한 loss function을 설계하는 것이다. SphereFace에 따르면 Angular space상 class representation으로 마지막 fc layer를 으로 사용할 수 있다. Face class의 분포를 최대한 멀리 떨어뜨리기 위해 margin을 포함한 loss function을 설계하는 것이 트렌드이다. 이를 종합하여 Additive Angular Margin Loss(ArcFace)라는 새로운 loss를 제안한다. 1. Introduction Deep Convolution Neural Network(DCNN)을 통해 face image의 map을 그렸을 때 같은 .. [논문리뷰]Face Recognition in Low Quality Images: A Survey Abstract Low-quality face recognition(LQFR)은 HQ image로만 처리하지 못하는 문제를 해결할 수 있다. 하나의 예시로 감시 비디오(CCTV)는 LQFR system이다. 감시 비디오의 특징으로는 물체와의 거리가 멀다는 것, challenging한 illumination condition, view의 다양한 각도 등이있다. LQFR의 approaches에는 super-resolution, deblurring, different resolution domain간의 관계 파악등의 기술이 쓰였다. 1. Introduction LQ image들의 종류와 그것의 원인은 아래와 같이 다양하다. Blurriness : out-of-focus, interlacing, object-c.. [논문리뷰]Deep Residual Learning for Image Recognition Abstract 깊은 신경망일수록 훈련시키기가 힘들다. 저자는 residual network를 통해 해당 문제를 해결하고자 한다. Residual network를 사용하면 더 깊은 층의 학습을 잘 수행할 수 있어 더 높은 accuracy를 얻을 수 있다. ImageNet 데이터셋에서 모델로 152 layers(VGG보다 8배 더 깊은)를 쌓아 3.57%의 error를 달성했다. 이 결과로 ILSVRC 2015에서 우승을 했다. 1. Introduction 최근(2015년)의 연구 결과들은 층을 깊게 쌓는것이 중요하다는 점을 시사하고, ImageNet의 대회에서 우수한 성적을 내는 모델들은 모두 층이 매우 깊다. 하지만 층을 깊게 쌓으면 여러 문제에 직면한다. 그 중 하나는 모델 weight의 수렴이 안되.. [논문리뷰]Sequence to Sequence Learning with Neural Networks 이 포스트는 Sequence to Sequence Learning with Neural Networks 논문에 대한 리뷰입니다. 부족한 지식으로 잘못된 내용이 있을 수 있습니다. Abstract 이 논문에서 저자는 여러층의 LSTM(encoder)을 사용하여 input sequence를 고정된 크기의 vector 변환한 이후, 또 다른 deep LSTM(decoder)을 통해 vector로 부터 target sequence를 만든다. WMT14 데이터셋을 사용했고, English to French 번역 문제를 해결했다. 여기서 34.8 BLEU score를 얻을 수 있었다. LSTM와 SMT 방식을 함께 사용했을 대는 36.5 BLEU score를 기록했다. 추가로 LSTM은 긴 문장에 대해서도 작업을 .. Style Transfer 구현 해당 포스트는 style transfer로 알려져 있는 Image Style Transfer Using Convolutional Neural Networks에 대한 구현입니다. 해당 코드는 tensorflow 홈페이지와 나동빈님의 github을 참고하여 작성하였습니다. 자세한 논문의 내용은 Style transfer 리뷰을 참고하세요 라이브러리 불러오기 import tensorflow as tf import numpy as np import matplotlib.pyplot as plt import os import IPython.display as display import PIL.Image 이미지 준비 style transfer를 위한 content image와 style image를 준비한다. dir.. ResNet 구현 (For CIFAR dataset classification) 여기서는 Deep Residual Learning for Image Recognition의 CIFAR-10 데이터셋을 ResNet을 통해 학습하고, 평가하는 부분을 구현한다. 논문에 대한 자세한 사항은 ResNet 리뷰를 참고. 주의 저는 딥러닝 초보이므로 논문을 구현함에 있어서 잘못된 부분이 있을 수 있습니다. 의견을 댓글로 남겨주시면 감사하겠습니다. 라이브러리 불러오기 try: %tensorflow_version 2.x except Exception: pass import tensorflow as tf print(tf.__version__) # 2.4.1 import numpy as np import os Config 네트워크, 인풋 이미지, 학습 등을 위해 필요한 기본 정보들을 선언한다. BATCH.. (시작하세요! 텐서플로 2.0 프로그래밍) 10장. 강화학습(Reinforcement Learning) 강화학습은 실수와 보상을 통해 배우는 알고리즘이다. 신경망이 정답과 예측 사이의 오차를 역전파해서 의미있는 가중치와 편향을 학습하는 것처럼 강화학습은 좋은 선택과 나쁜 선택에서 배운다. 신경망으로 경험 학습하기 강화학습의 환경으로 사용할 Gym에 대해 알아본다. Gym에는 전통적인 알고리즘 흉내 내기, Box2D를 사용한 간단한 물리 조작계, 아타리 게임 등 다양한 환경이 포함되어있다. Gym의 구조는 강화학습에서 요구하는 표준적인 구조이다. 일단 문제가 주어진 환경(environment)이 있고, 강화학습 문제를 풀기 위한 에이전트(agent)가 존재한다. 에이전트는 행동(action)으로 환경에 영향을 주고, 그 결과에 따라 보상(reward)을 받는다. 좋은 보상을 받으면 에이전트는 그 행동을 더 .. 이전 1 2 3 4 5 6 다음