[WSSS] OC-CSE논문 정리

Notice

Recent Posts

Recent Comments

Link

GitHub

« 2025/04 »
일	월	화	수	목	금	토
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30

Tags more

Archives

Today

Total

관리 메뉴

히비스서커스의 블로그

[WSSS] OC-CSE논문 정리 본문

Theory/Computer Vision

[WSSS] OC-CSE논문 정리

HibisCircus 2022. 2. 14. 01:38

728x90

※ Unlocking the Potential of Ordinary Classifier: Class-specific Adversarial Erasing Framework for Weakly Supervised Semantic Segmentation의 논문을 읽고 이해한대로 정리해본 글입니다. 아래에 첨부된 그림들 중 논문에 나와있지 않은 그림들은 제가 제작한 내용이니 사용 시 반드시 출처를 남겨주시기 바랍니다. OC-CSE 논문은 핵심 아이디어만 정리하였습니다. 풀잎스쿨 18기 WSSS 논문으로 입문하기를 통해 같이 공부한 분들께 감사를 드립니다.

개인적인 생각

AE(Adversarial Erasing)을 통해 WSSS를 하는 방법에 대해 가장 훌륭하다고 생각되는 아이디어들만을 고려하였고, 기존과는 달리 classifier로 사용하였던 모델을 다시 재사용한다는 아이디어로 현재까지 AE를 쓴 WSSS 방법 중에서는 가장 우수한 논문이라고 생각한다. (매우 개인적인 의견이다.)

Abstract

특징

1. ordinary classifier를 선택하여 지울 영역을 알림
2. 이미지의 기존 클래스 중 지울 특정 클래스를 무작위로 샘플링함
- 클래스별 마스크를 생성함
- 정확한 CAM을 얻음

핵심

OC-CSE => 대상 class의 CAM을 생성 + CAM이 다른 class 객체의 영역을 침범하지 않도록 제한

Potential of Ordinary Classifier

핵심아이디어

ordinary classifier는 이미 객체의 전체 영역을 활성화할 수 있는 충분한 수용력을 가지고 있다.

CAM의 한계의 재해석

더 분별력이 적은 부분은 CAM에서 더 적게 활성화된다. 하지만 이는 classifier가 인식을 못해서가 아닌 더 분별력 있는 영역이 존재하기 때문인 것이다. CAM의 한계는 CAM 자체의 sparsity나 불완전성 때문이 아닌 activation의 불균형이다.

방식

단순히 이미지를 처리하고 ordinary classifier에서 활성화된 영역을 순차적으로 집계함

문제점

더 완전한 CAM을 생성하는데 도움이 될 수 있는 패턴을 인식하고 학습할 가능성이 없음
Ground Truth Semantic Segmentation 레이블 없이 각 이미지에 대한 masking threshold값을 최적화하는 것은 극히 어려움

해결방법

이러한 문제를 처리하면서 ordinary classifier의 잠재력을 잠금해제하기 위해
적용/재귀(adaptive/recursive) 방식으로 앞서 언급한 체계를 활용하는 학습 기반 AE framework를 제안함

Proposed Method

CAMs Generation

CAM의 방식: GAP -> FClayer의 방식이 아닌 ACoL에서의 1x1 conv layer의 방식으로 통해 CAM을 얻음

ACoL에서 CAM을 얻는 과정으로 CAM을 얻었다. 위의 그림 부분은 ACoL에서 가져왔다.

Proposed Framework

제안된 Framework는 크게 두 가지 Network로 구성된다.

1. CGNet - CAM Generate Network

input :: $I$ (image)
output :: $A_i$ (CAM) & $p_i$ (class prediction)

2. Ordinary Classifier - Pretrained Classifier

input :: $\hat{i}$ (masked image)
output :: $\hat{p_i}$ (class prediction)

자세한 과정의 위의 그림에 설명되어 있다.

Class-specific Erasing Method(CSE)

기존의 CAE(Class Agnostic Erasing)에서의 loss와 OC-CSE에서의 CSE(Class Specific Erasing)에서의 loss의 차이이다.

CAM Refinement

보다 정확한 psedo pixel-level label을 위해 CGNet에서 생성된 CAM을 개선하기 위한 작업을 한다. AffinityNet을 훈련이 필요한 foreground와 background label들은 정제된 CAM에 crf를 적용함으로써 얻어진다. crf를 CAM에 적용하기 위한 식은 다음과 같다.

-히비스서커스-

728x90

저작자표시

'Theory > Computer Vision' 카테고리의 다른 글

[WSSS] CIAN 논문 정리 (0)	2022.03.10
[WSSS] SEC 논문 정리 (0)	2022.02.21
[WSSS] EADER 논문 정리 (0)	2022.02.13
[WSSS] ACoL 논문 정리 (2)	2022.02.13
[WSSS] AE-PSL 논문 정리 (0)	2022.02.13

'Theory/Computer Vision' Related Articles

히비스서커스의 블로그 끊임없이 새로운 것을 배워나가는 히비스서커스의 기록

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

히비스서커스의 블로그

히비스서커스의 블로그

[WSSS] OC-CSE논문 정리 본문

[WSSS] OC-CSE논문 정리

개인적인 생각

Abstract

Potential of Ordinary Classifier

Proposed Method

CAMs Generation

Proposed Framework

Class-specific Erasing Method(CSE)

CAM Refinement

'Theory > Computer Vision' 카테고리의 다른 글

티스토리툴바

개인정보

단축키

내 블로그

블로그 게시글

모든 영역