논문리뷰 (10) 썸네일형 리스트형 [논문리뷰]FaceNet: A Unified Embedding for Face Recognition and Clustering AbstractFace 이미지를 Euclidian space(거리가 곧 유사도)로 mapping하는 Facenet을 제안Loss function으로 triplet loss를 사용LFW dataset에서 accuracy 99.63%, Youtube Faces DB에서 accuracy 95.12%로 SOTA 1. Introduction이 논문에서 verification, recognition, clustering을 수행하는 unified system을 소개한다. Face image를 Euclidean embedding하는 방법을 배움으로서 거리를 유사도로 사용할 수 있다. 즉, 같은 사람끼리는 가까운 거리에 embedding되고, 다른 사람끼리는 먼 거리에 embedding 된다. 이전의 face recog.. [논문리뷰]Image Style Transfer Using Convolutional Neural Networks 이 포스트는 Style Transfer라고 알려져 있는 https://rn-unison.github.io/articulos/style_transfer.pdf에 대한 논문에 대한 리뷰입니다. Abstract 서로 다른 스타일의 이미지에서 의미있는 정보를 뽑는것은 어려운 image processing 문제이다. 저자는 CNN을 통해서 이미지에서 high level 정보를 뽑아낸다. 그리고 이를 통해 content image와 style image를 결합하는 과정을 통해 Artistic style 알고리즘을 만들었다. 1. Introduction 하나의 이미지의 스타일을 다른 이미지에 옮기는 것은 texture transfer하는 문제이다. Texture transfer의 목표는 source image로 부터.. [논문리뷰]ArcFace: Additive Angular Margin Loss for Deep Face Recognition Abstract Face recognition(FR)을 위한 feature learning을 진행할 때 중요한 부분은 적절한 loss function을 설계하는 것이다. SphereFace에 따르면 Angular space상 class representation으로 마지막 fc layer를 으로 사용할 수 있다. Face class의 분포를 최대한 멀리 떨어뜨리기 위해 margin을 포함한 loss function을 설계하는 것이 트렌드이다. 이를 종합하여 Additive Angular Margin Loss(ArcFace)라는 새로운 loss를 제안한다. 1. Introduction Deep Convolution Neural Network(DCNN)을 통해 face image의 map을 그렸을 때 같은 .. [논문리뷰]Face Recognition in Low Quality Images: A Survey Abstract Low-quality face recognition(LQFR)은 HQ image로만 처리하지 못하는 문제를 해결할 수 있다. 하나의 예시로 감시 비디오(CCTV)는 LQFR system이다. 감시 비디오의 특징으로는 물체와의 거리가 멀다는 것, challenging한 illumination condition, view의 다양한 각도 등이있다. LQFR의 approaches에는 super-resolution, deblurring, different resolution domain간의 관계 파악등의 기술이 쓰였다. 1. Introduction LQ image들의 종류와 그것의 원인은 아래와 같이 다양하다. Blurriness : out-of-focus, interlacing, object-c.. [논문리뷰]Deep Residual Learning for Image Recognition Abstract 깊은 신경망일수록 훈련시키기가 힘들다. 저자는 residual network를 통해 해당 문제를 해결하고자 한다. Residual network를 사용하면 더 깊은 층의 학습을 잘 수행할 수 있어 더 높은 accuracy를 얻을 수 있다. ImageNet 데이터셋에서 모델로 152 layers(VGG보다 8배 더 깊은)를 쌓아 3.57%의 error를 달성했다. 이 결과로 ILSVRC 2015에서 우승을 했다. 1. Introduction 최근(2015년)의 연구 결과들은 층을 깊게 쌓는것이 중요하다는 점을 시사하고, ImageNet의 대회에서 우수한 성적을 내는 모델들은 모두 층이 매우 깊다. 하지만 층을 깊게 쌓으면 여러 문제에 직면한다. 그 중 하나는 모델 weight의 수렴이 안되.. [논문리뷰]Sequence to Sequence Learning with Neural Networks 이 포스트는 Sequence to Sequence Learning with Neural Networks 논문에 대한 리뷰입니다. 부족한 지식으로 잘못된 내용이 있을 수 있습니다. Abstract 이 논문에서 저자는 여러층의 LSTM(encoder)을 사용하여 input sequence를 고정된 크기의 vector 변환한 이후, 또 다른 deep LSTM(decoder)을 통해 vector로 부터 target sequence를 만든다. WMT14 데이터셋을 사용했고, English to French 번역 문제를 해결했다. 여기서 34.8 BLEU score를 얻을 수 있었다. LSTM와 SMT 방식을 함께 사용했을 대는 36.5 BLEU score를 기록했다. 추가로 LSTM은 긴 문장에 대해서도 작업을 .. Motion Planning Among Dynamic, Decision-Making Agents with Deep Reinforcement Learning review 본 포스트는 Motion Planning Among Dynamic, Decision-Making Agents with Deep Reinforcement Learning의 리뷰이다. Abstact 로봇에서 사람들 사이를 부딪히지 않으면서 안전하고, 효과적으로 주행하는 것은 중요한 문제이다. 본 연구에서는 LSTM을 사용해서 사람들의 수가 몇 명이든지 주행할 수 있었다. 또한 이 알고리즘은 시뮬레이션 그리고 현실에서도 사람들 사이를 주행을 부드럽게 할 수 있었다. 사람들을 피하는 방법은 다음과 같은 단계로 발전하였다. 사람들이 고정되었다고 가정하고, 회피할 수 있을만큼 재빨리 re-plan 사람들을 움직인다고 생각하지만, 같은 속도로 운동한다고 가정 사람들이 known or unknown policies에 .. Smart Patrolling An Efficient Road Surface Monitoring Using Smartphone Sensor and Crowdsourcing Sensors Review 이 글은 Smart Patrolling: An Efficient Road Surface Monitoring Using Smartphone Sensors and Crowdsourcing 논문의 리뷰이다. introduction road surface monitoring기술은 사고의 예방차원에서 중요하다. 요즘에는 smartphone을 통해 monitoring system을 개발하는 것이 트렌드이다. 이 논문에서는 기존의 threshold-based와 machine learning의 한계를 극복하기 위해 DTW technique를 사용했다. DTW는 미리 뽑아놓은 reference template과 센서 데이터를 비교하여 유사도를 계산하고, anomaly인지 판단하는 방법을 뜻한다. 기존의 방식에 비교해서 .. 이전 1 2 다음