일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
- 티스토리챌린지
- airflow
- Multi-Resolution Networks for Semantic Segmentation in Whole Slide Images
- aiffel exploration
- vscode
- cs231n
- docker
- 도커
- 사회조사분석사2급
- Jupyter notebook
- CellPin
- GIT
- cocre
- 코크리
- 프로그래머스
- numpy
- docker exec
- Pull Request
- 기초확률론
- ssh
- AIFFEL
- Decision Boundary
- WSSS
- logistic regression
- 오블완
- 히비스서커스
- docker attach
- 백신후원
- HookNet
- IVI
- Today
- Total
목록Programming (77)
히비스서커스의 블로그
파이썬에서 대용량 dataframe을 다루다 보면 시간이 오래걸릴 때가 있다. 대용량부터는 데이터를 효율적으로 읽어들이는 방법을 써야 시간을 아낄 수 있다. 이번에도 아니나 다를까 시간이 오래 걸려 코드를 개선하였는데 훨씬 더 빨라졌다. 기존 코드에 작성한 코드는 다음과 같다. def __getitem__(self, idx): item = {} img_path = self.df.values[idx,1].replace('./','/data/nas_data/Public/dacon_mai/') image = cv2.imread(img_path) image = self.transform(image) reduced_matrix = self.df..
구글드라이브의 폴더를 공유 받았을 때 리눅스 명령어로 받는 방법을 정리해보았다. 1. gdrive를 먼저 다운로드 해준다. https://github.com/glotlabs/gdrive/releases 옆의 링크에서 gdrive_linux-x64.tar.gz를 찾아서 링크를 복사한다. wget 명령어로 다운로드를 해준다.wget [복사한 다운로드 링크] -O gdrive tar.gz 파일은 압축 파일이므로 아래와 같이 압축을 풀어준다.tar -xvzf gdrive 그 후, 아래의 명령어로 /usr/local/bin에 gdrive 파일을 옮겨주고 실행 권한을 주면 사용가능하다. # 이동sudo mv gdrive /usr/local/bin/# 실행 권한 추가sudo chmod +x /usr/local/..
benchmark dataset을 다운받는 경우 예전에는 다른 외부 사이트나 구글드라이브에 올려진 데이터를 다운받는 경우가 많았던 것 같은데 요새는 hugging face에 많이 업로드하는 것 같다. 로그인 없이 직접 다운로드 받을수도 있지만, access를 요청해서 승인을 받아야 다운로드를 받을 수 있는 경우도 존재한다. 그래서, python에서 직접 hugging face에 업로드 된 benchmark datatset을 다운로드 받는 방법을 정리해보았다. 1. hugging face 사이트에서 로그인 후 dataset에 대한 access 요청 https://huggingface.co/ Hugging Face – The AI community building the future. huggingfac..
딥러닝 논문을 보다보면 model의 FLOPs에 관해서 비교하는 것을 심심치 않게 볼 수 있다. FLOPs와 비슷한 개념으로 MACs , FLOPS가 존재하는데 이들의 차이 간단한 차이는 다음과 같다. FLOPs는 FLoating point OPerations 의 약자로 딥러닝 model의 연산량을 나타낸다.MACs는 Multipl-Accumulate Computations의 약자로 딥러닝 모델에서 FMA가 몇 번 연산되었는지 나타낸다.(FMA는 Floating point Multiply and Add operation의 약자로 A*x + B를 하나의 연산으로 처리한다.)FLOPS는 FLOating point Operations per Second의 약자로 GPU의 성능을 나타낸다. 참조: https..
VSCode로 Python 파일을 디버깅하다가 argparse가 되어있어 잠시 난관에 봉착하였다. launch.json 파일을 생성해서 argparse의 내용들을 적어주면 된다는데 어디다 작성하라는건지 감도 안왔지만 직접 부딪혀보면서 해보니 해결하였다. 해결방법은 다음과 같다. 1. F5 버튼을 눌러서 Debug 콘솔 열어서 '구성 추가' 버튼을 누르고 json 파일 생성된다. 2. 생성된 json 파일의 program에는 실행시킬 파이썬 파일의 경로를 넣어주고, args에는 argparse로 들어갈 tag들을 설정해준다. 꼭 argparse에 들어가는 --가 들어간 tag가 아니어도 된다. 즉, 다른 파이썬 파일의 경로가 들어가는 경우에도 가능하다. 아래의 명령어는 위의 json파일을 shell에서 명..
오픈소스에 pull request 후 merged가 되어 말로만 듣던 오픈소스에 기여하게 되었다. 근래들어 좋은 일들이 많이 일어나는데 이것만큼은 정말 짜릿하였다. 기쁨을 제쳐두고 그 과정을 천천히 기록해보려고 한다. 에러 발견 및 코드 수정 8월 9일 mmdetection에서 VOCMetric에서 mAP가 아닌 recall을 구하려고 하는데 에러가 발생했다. source 코드를 확인해보니 (경로는 mmdetection / mmdet / evaluation / metrics / voc_metric.py의 159번째 줄 이후이다.) # TODO: Currently not checked. 이런 주석 처리가 되어 있고 난데 없이 정의도 하지 않은 self.annotations를 불러와서 에러가 발생하였다. 확..
이미지 분석을 주로 하다보니 VSCode에서 debugging하면서 이미지를 확인하고 싶어 관련 설정들을 찾아보았다. 개발 환경은 윈도우 개인 PC에서 우분투 서버로 SSH 접속을 하고 있으며 Docker로 컨테이너를 띄운 환경에 접속하여 세팅하였다. 이와 같은 경우 window 창을 띄워서 하는 것이 어려우므로 jupyter를 활용하여 확인하는 방법을 사용한다. ipykernel 설치하기 및 VSCode 창 다시 띄우기 아래의 명령어로 ipykernell을 설치한 후pip install -U ipykernel docker extension에서 jupyter 관련 extension도 모두 설치해준다. 그 후, F1을 누르고Developer: Reload Window를 통해 다시 VSCode 창을 띄워준..
이번 포스팅에서는 Airflow를 docker 컨테이너에서 사용할 경우 PostgreSQL 컨테이너와 네트워크로 연결하는 방법을 정리하였다. 왜 DB container로 PostgreSQL을 사용하려는가? 일단 Airflow에서 공식적으로 제공하는 docker-compose 파일에서 PostgreSQL을 DB container로 업로드 하도록 세팅되어 있다. 그 이유는 아마도 Airflow에서 병렬처리를 하는 Executor를 사용하려면 PostgreSQL를 DB로 하는 것이 유리하기 때문인 것으로 보인다. (만약 SQLite를 DB로 사용하게 될 경우 Executor가 아닌 Sequential Executor를 사용하여야 해서 병렬이 아닌 순차적를 할 수 밖에 없다고 한다.) Docker환경에서 Air..