본문 바로가기

기술스택을 쌓아보자83

도커 콘테이너와 로컬에 파일 전송하기 및 내려받기 콘테이터 -> 로컬 docker cp :/path/in/container /path/for/local 로컬 -> 콘테이터 docker cp /path/for/local :/path/in/container docker cp 명령어를 사용하면 된다! 어디든 잘쓰이는 cp 명령어! 2021. 3. 13.
[pandas] ffill과 bfill ffill: forward 데이터로 뒤를 채우는 것 bfill: backward 데이터로 앞을 채우는것 2021. 1. 12.
[jupyter] .ipynb 파일 내의 변수를 다른 곳에서 import 하기(주피터 매직커맨드/ %store) 파이썬은 코드를 작성하면 코드 내의 변수가 모듈처럼 사용될 수 있습니다. 그런데, shell 단위로 코드를 실행하는 .ipynb내의 변수를 다른 파일에서 사용할 수 없을까요? 이럴때는 % store 를 사용하는 것이 편리합니다. 예시 보시죵 다른 파일에서 사용하고자 하는 리스트를 in-db value로 저장하기 a = [1] % store a >>> Stored 'a' (list) list a가 in-db value로 저장된 것을 확인할 수 있습니다. 저장 확인은 단순히 셸에 % store를 치고 실행하면 된다. % store >>> Stored variables and their in-db values: a -> [1] 저장한 데이터 다른 파일에서 호출하기 % store -r a print(a) >>>.. 2021. 1. 12.
pandas 번역: Scaling to large datasets, pandas 최적화(pandas User guide 번역/pandas 기초 입문/Pandas 간단 요약/데이터 최적화/ pandas 최적화) Scaling to large datasets pandas 는 메모리 데이터셋보다 더욱 크고 다루기 까다로운 인메모리 분석을 위한 데이터 구조들을 제공합니다(series, dataframe 등). 가끔 pandas의 함수들 중에서는 데이터 셋의 복사본을 만들어서 연산을 진행하기 때문에 다룰 수 있는 규모의 데이터들도 다루기 어려워 질 때도 있습니다. 이 문서에서는 큰 규모의 데이터셋을 다루는 몇몇 방법을 추천할 예정입니다. 해당 문서는 분석 속도를 높이고, 메모리사이즈에 맞는 데이터셋에 집중한 Enhancing performance의 내용에서 추가적으로 보완하는 문서입니다. 그렇지만 먼저, (빅데이터를 다루는데에) pandas 를 사용하지 않는 것 또한 하나의 방법이 될 수 있다는 점을 기억해주세요, p.. 2021. 1. 9.