본문 바로가기

반응형

분류 전체보기

(17)
[논문 리뷰] CRAFT(Character Region Awareness for Text Detection) 논문명: Character Region Awareness for Text Detection Youngmin Baek, Bado Lee, Dongyoon Han, Sangdoo Yun, and Hwalsuk Lee∗ Clova AI Research, NAVER Corp. 최근 신경망을 기반으로 한 장면 텍스트 탐지 방법이 등장하며 유망한 결과를 보여줌 이전 방법들은 고정된 단어 수준의 bounding box로 학습되어 임의의 형태로 텍스트 영역을 표현하는데 한계가 있었음. 논문에서는 각 문자와 문자들 사이의 affinity를 탐색함으로써 텍스트 영역을 효과적으로 탐지할 수 있는 새로운 장면 텍스트 탐지 방법을 제안. 개별 문자 수준의 주석 부족을 극복하기 위해, 제안된 프레임 워크는 합성 이미지에 대해 주..
[딥러닝] Transformer 이란? Transformer 모델은2017년 구글 연구자에 의해 ‘Attention Is All You Need’ 라는 논문에서 처음 소개 주로 자연어 처리(NLP) 분야에서 사용되며, 이후 다양한 분야에서도 활용되고 있음 Transformer의 핵심 아이디어는 전통적인 RNN이나 LSTM과 같이 시퀀스 데이터를 순차적으로 처리하는 대신, 어텐션 메커니즘을 통해 데이터의 전체 시퀀스를 한번에 처리하는 것 이로 인해 모델이 시퀀스 내에서의 장거리 의존성을 더 잘 파악할 수 있게 됨. 1. 어텐션 메커니즘(Attention Mechanism): Transformer 의 핵심은 어텐션 메커니즘으로, 입력 시퀀스의 모든 단어 사이의 관계를 동시에 계산. 이를 통해 모델이 중요한 정보에 집중하고, 덜 중요한 정보는 무시..
[딥러닝] CNN 이란? CNN 이란? 합성곱 신경망(Convolutional Neural Networks, CNN)은 딥러닝의 한분야로, 주로 이미지 처리, 비디오 분석, 이미지 분류, 객체 인식 및 다른 유형의 시각적 데이터 분석에 널리 사용. CNN은 1980년대 후반에 발전하기 시작했으며, 이미지를 ‘이해’하는데 특히 효과적인 구조로 인식. 1. 합성곱 계층(Convolutional Layer): 합성곱 계층은 CNN의 핵심 구성 요소. 이 계층에서 필터(또는 커널)를 입력 데이터(이미지)에 적용하여 특징 특성을 감지 예를 들어, 이미지에서 가장자리, 색상변화, 질감 등을 감지할 수 있음. 필터는 일반적으로 작은 크기(3x3, 5x5 등)의 행렬로, 전체 이미지 위를 이동하며 각 위치에서 필터와 해당 영역의 요소별 곱셈 ..
[비지도학습] 클러스터링(k-means, GMM, DBSCAN)_차원축소(PCA, SVD)_개념, 정리 비지도학습(Unsupervised Learning) 1. 훈련 샘플의 레이블 정보가 없거나 활용하지 않는 형태의 학습 2. 데이터 내재된 특성과 규칙을 찾아 다음 단계의 데이터 분석을 위한 기초로 다지는 목적 클러스터링(Clustering) 1. 데이터 세트의 샘플들을 교차하지 않는 여러 개의 부분집합으로 분할하는 방법 2. 각각의 부분집합을 클러스터하고 일컬음 3. 각 클러스터는 잠재적인 개념(클래스)에 대응됨 4. 클러스터링 알고리즘은 잠재적인 개념 및 대응 관계에 대한 사전 정보가 없음 1) 클러스터링의 목적 1. 단일로 사용될 경우 데이터 내의 분포 구조를 찾는데 사용될 수 있음 2. 본격적인 분석에 앞서 하나의 사전 절차로 사용될 수 있음 2) 성능 척도 1. 클러스터링 유효성 지표(validi..
EPL Player Analysis- PCA and Clustering 안녕하세요. PCA와 클러스터링 모델링을 통해 EPL 선수들을 분석하여 특성을 파악하고자 합니다. 1. 데이터 출처 : Kaggle에서 17/18 시즌의 EPL 선수들의 데이터 셋을 활용하였습니다. https://www.kaggle.com/datasets/mauryashubham/english-premier-league-players-dataset English Premier League Players Dataset, 2017/18 A unique dataset containing FPL data, popularity and market values www.kaggle.com 2. 데이터 설명 : 17 / 18 시즌 EPL 선수들의 시장 가치 3. 데이터 변수 - name: 선수 이름 - club: 선수..
[데이터/AI 관련 공모전 추천] 데이콘 고객 대출등급 분류 해커톤(1/15~2/5) 데이터/ AI 관련 공모전 소개해드립니다. 주제 - 고객의 대출등급을 예측하는 AI 알고리즘 개발 설명 - 대출 고객과 관련된 데이터 분석을 통해 고객의 대출등급 예측하는 AI 모델을 개발해야 합니다. 주최/주관 - 데이콘 참가대상 - 데이터라면 누구나 대회 주요일정 - 1/15(대회시작) → 2/5(대회종료) → 2/9(코드 제출 마감) →2/18(코드 평가 종료) → 2/19 (최종 수상자 발표) 공모전 사이크 링크 - https://dacon.io/competitions/official/236214/overview/description 고객 대출등급 분류 해커톤 - DACON 분석시각화 대회 코드 공유 게시물은 내용 확인 후 좋아요(투표) 가능합니다. dacon.io 평가 - 평가산식 : Macro..
[머신러닝] 앙상블(Ensemble) 기법_스태킹(Stacking)_알고리즘 소개(2) Blending Ensemble(혼합 앙상블) 소개 1) 정의: Stacking과 같은 종류의 앙상블로써 메타모델이 홀드아웃데이터(테스트데이터)에 의해 만들어진 예측치로 훈련되는 앙상블 기법 2) 특징 - Stacking에 비해 더 간단한 기법이고, 정보 손실 위험이 더 낮은 특징이 있음 - One Million Dollar Netflix ML Competition에서 알려진 테크닉 - Blending Ensemble과 Stacking 차이 1. blending ensemble: 메타모델이 훈련할 때 홀드아웃 데이터셋에 의해서 만들어진 예측치를 사용 2. stacking: 메타모델이 훈련할 때 k-fold-cv로 인한 out-of-fold 데이터셋에 의해 만들어진 예측치를 사용 3) 혼합 앙상블에서의 단..
[머신러닝] 앙상블(Ensemble) 기법_스태킹(Stacking)_알고리즘 소개(1) Weighted Average Ensemble: 가중 평균 앙상블 소개 1) 앙상블의 일부 모델이 다른 모델보다 더 많은 기술을 지니고 있어 더 많은 기여를 한다고 가정 2) 모델 예측값에 고정 가중치가 할당됨 3) 투표 앙상블의 확장: 모든 모델이 동일하게 학습되고, 앙상블에 의해 만들어진 예측에 비례적 기여를 함 4) 기여도 결정 = 기능 또는 기술에 비례하여 가중치가 부여됨 5) 투표 앙상블에서 모델 예측의 평균 = 가중 평균 앙상블에서 모델의 기여도에 비례하여 계산 6) 모든 모델이 동등하게 효과적이라는 투표 앙상블의 한계를 극복 7) 분류: 각 클래스 레이블에 대한 가중치 합을 계산 / / 회귀: 앙상블 구성원의 예측 산술 평균을 계산하는 방식 Weighted Voting Ensemble 소개 ..

반응형