반응형

Machine Learning 18

DEER: Detection-agnostic End-to-End Recognizer for Scene Text Spotting

" data-ke-type="html">HTML 삽입미리보기할 수 없는 소스  이번글에는 NAVER Clova 팀에서 발표한 DEER: Detection-agnostic End-to-End Recognizer for Scene Text Spotting 라는 모델에 대해 정리해봤습니다.DETR을 기반으로한 모델이며, Deformable DETR을 보고 오시면 더 이해가 빠릅니다.학습 코드가 공개되어 있지 않기 때문에 모델 사용을 위해선 직접 구현해야 합니다.Introduction일반적인 end-to-end text spotting 파이프라인은 text detector와 recogntion으로 구성됩니다. Text detector는 이미지내의 텍스트 위치를 Box 또는 Polygon 모양의 결과를 출력하고,..

Grounding DINO: Marrying DINO with Grounded Pre-Training for Open-Set Object Detection

오늘은 Grounding-DINO라는 논문에 대해서 리뷰하겠습니다. 본 논문은 Conditional-DETR, DAB-DETR, DN-DETR, Deformable-DETR 등등에 대한 기초 지식을 알고 있다는 전제하에 작성한 글입니다. 따로 해당 논문들에 대해에 대해 정리하겠지만 미리 공부하고 보면 더 도움이 될 것입니다.세부적인 내용들은 찾아보시는 걸 권장하고 틀린 부분이 있으면 언제든 댓글로 말씀해주시면 수정하겠습니다.(위의 언급된 기초지식들은 해당 블로그 다른 글에 작성되어있습니다.) Github : https://github.com/IDEA-Research/GroundingDINOPaper : https://arxiv.org/abs/2303.05499Abstract 본 논문에서는 Transfor..

DAB-DETR: Dynamic Anchor Boxes are Better Queries for DETR

오늘은 DAB-DETR이라는 논문에 대해서 리뷰하겠습니다. 본 논문은 Conditional-DETR에 대한 기초 지식을 알고 있다는 전제하에 작성한 글입니다. 따로 해당 논문들에 대해에 대해 정리하겠지만 미리 공부하고 보면 더 도움이 될 것입니다.세부적인 내용들은 찾아보시는 걸 권장하고 틀린 부분이 있으면 언제든 댓글로 말씀해주시면 수정하겠습니다. Github : https://github.com/IDEA-Research/DAB-DETRPaper : https://arxiv.org/abs/2201.12329 AbstractDAB-DETR는 DEtection TRansformers(DETR)의 성능을 향상시키기 위해 고안된 새로운 접근법입니다. 이 논문은 DETR에서 사용하는 고정된 Positional E..

DINO: DETR with Improved DeNoising Anchor Boxes for End-to-End Object Detection

오늘은 DINO이라는 논문에 대해서 리뷰하겠습니다. 본 논문은 DAB-DETR, Deformable-DETR, DN-DETR에 대한 기초 지식을 알고 있다는 전제하에 작성한 글입니다. 따로 해당 논문들에 대해에 대해 정리하겠지만 미리 공부하고 보면 더 도움이 될 것입니다.세부적인 내용들은 찾아보시는 걸 권장하고 틀린 부분이 있으면 언제든 댓글로 말씀해주시면 수정하겠습니다. Github : https://github.com/IDEA-Research/DINOPaper : https://arxiv.org/abs/2203.03605Abstract본 논문에서는 기존의 DETR(정확히는 Deformable DETR) 모델을 기반으로 한 객체 검출 성능 향상 방법을 제안향상된 디노이징(denoising) 앵커 박스 ..

CNN 기반 모델들

오늘은 Convolutional Neural Network(CNN) 기반 모델들에 대해서 정리하겠습니다.CNN 기반 모델들은 굉장히 다양하고 각각 논문들이 하나씩 있을만큼 내용들이 많으나 본 페이지에서는 간단하게 정리하려고 합니다. CNN 기초 지식이 있으면 훨씬 더 도움이 되실 것이라 생각합니다.세부적인 내용들은 찾아보시는 걸 권장하고 틀린 부분이 있으면 언제든 댓글로 말씀해주시면 수정하겠습니다.  1. Resnet모델이 깊어질수록 성능이 왜 안좋아질까?Overfitting때문이 아니라, 모델 최적화(Optimization)가 어려워지기 때문모델이 깊어질수록 gradient vanishing, gradient exploding 현상이 발생하기 때문기존 학습 방법x가 들어올 때, H(x)에 대해 이상적으..

Machine Learning 2024.06.25

DN-DETR: Accelerate DETR Training by Introducing Query DeNoising

오늘은 DN-DETR이라는 논문에 대해서 리뷰하겠습니다. 해당 논문은 헝가리안 알고리즘에 대한 기초 지식을 알고 있다는 전제하에 작성한 글입니다. 따로 헝가리안 알고리즘에 대해 정리하겠지만 미리 공부하고 보면 더 도움이 될 것입니다.세부적인 내용들은 찾아보시는 걸 권장하고 틀린 부분이 있으면 언제든 댓글로 말씀해주시면 수정하겠습니다.  Feng Li, Hao Zhang, Shilong Liu, Jian Guo, Lionel M. Ni, Lei Zhang  et.al. "DN-DETR: Accelerate DETR Training by Introducing Query DeNoising" (2022)https://arxiv.org/abs/2203.01305Abstract이 논문에서는 DETR(DEtectio..

Deformable DETR

오늘은 DETR(End-toEnd Object Detection with Transformers)에서 발생한 Small Object Detection과 느린 학습 속도 등의 문제점을 Deformable 방법론을 더하여 해결한 Deformable DETR에 대해 알아보겠습니다.Zhu, Xizhou, et al. "Deformable detr: Deformable transformers for end-to-end object detection." arXiv preprint arXiv:2010.04159 (2020).Deformable DETR: Deformable Transformers for End-to-End Object DetectionIntroductionDETR(2020)은 객체 감지에서 많은 수작..

딥러닝 기초 지식

딥러닝 기초부터 심화, 논문 리뷰까지 차근 차근 작성하여 글을 작성할 계획입니다.먼저, 딥러닝이라는 기술에 대해 기초 지식부터 적어보고자 합니다. 세부적인 내용들은 찾아보시는 걸 권장하고 틀린 부분이 있으면 언제든 댓글로 말씀해주시면 수정하겠습니다.1. 딥러닝1-1. 구성요소Layer : 모델을 구성하는 각층Node : 각 layer를 구성하는 요소Weight : 다음 layer에 있는 Node에 미치는 영향을 주는 요소최종적으로 Loss를 최소로 만드는 weight를 찾는 것이 목표 1-2. 학습 순서Forward-Propagation : 예측 값을 구하는 과정Loss 계산 : 실제 값과 오차를 구함Back-Propagation : Loss를 줄일 수 있는 weight 업데이트 2. 경사 하강법개념함수..

Machine Learning 2024.06.11
반응형