본문 바로가기

기술스택을 쌓아보자/Python26

[Pandas] 데이터프레임을 병합하는 다양한 방법들(1) how: outer, inner, left, right (밥먹고 마저쓴다) 매번 봐도봐도 헷갈리는 데이터프레임(이하 df)을 합치는 방법들! 이것과 떨어질 수 없는 것들이 바로 pandas 의 concat, join, merge 함수들인데요, 이들은 다음에 더 자세히 보고(제가 집중을 잘 못해서^^...) 오늘은 merge 함수를 기준으로 how에 들어가는 방법들을 정리해보겠습니다. 저도 공부중이기도 하고, 자주 쓰이는 함수들이기에 복습하는 겸 적어보았습니다. 글을 읽어보시고 알고계시는 다른 방법이나, 더 나은 점이 있다면 댓글로 알려주세요! outer, inner, left, right pandas의 df를 합치는 함수들을 사용하다보면, 항상 언급되는 인자가 바로 how 입니다. how인자로는 "outer", "inner", "left", "right" 등의 인자값이 들어가는.. 2020. 12. 29.
[pandas/판다스] 해당 기간 내의 날짜 구하기 import pandas as pd from datetime import date start = date(2020, 3, 31) end = date(2020, 4, 30) pd.date_range( start, end, freq='d' ) 이렇게 하면 해당 기간내의 날짜들이 쭈욱! 반환된다. 2020. 9. 13.
[pandas/판다스] 판다스 익숙하지 않으신 분들이 공부하기 좋은 사이트 3선 많은 분들이 데이터사이언스를 공부하다보면 필수적인 것들이 pandas와 numpy라고 말씀하십니다. 실제로 numpy는 그 자체로의 수많은 인공지능들은 모두 데이터를 행렬과 벡터 형태로 전처리하여 학습하다보니 이제는 거의 모르는 분이 없는 정도이고, pandas도 많은 분들이 사랑하고 계시는 패키지인 것 같습니다.(특히 금융권에서) 그러다 보니 저도 처음 공부를 시작할 때 해당 패키지들을 공부해야겠다고 생각했습니다. 목적도 없이 공부하다가 막막해서 포기한 적도 많은 것 같습니다. 무작정 numpy 문서를 정독하는건 제 끈기가 허용하지 않았습니다. 공부를 어떻게 해야할까요? 공부한 기간이 짧지만, 현재 초보의 입장에서 베스트는, 실제로 아무거나 구현해보면서 그때 그때 구글링해보는게 Best!라고 생각합니다.. 2020. 9. 13.
pandas 번역: 10분만에 판다스 보기 (pandas User guide 번역/pandas 기초 입문/Pandas 간단 요약) 주니어로서 어떤 능력을 갖추는게 좋을까요? 라고 과장님께 질문을 했더니 pandas cookbook을 빌려주시며, 나즈막하게 '이 책을 뜯어드시면 됩니다..'라고 말씀하시고 떠났다. 그래서 pandas User guide를 번역해보기로 했다. 덩달아 영어 실력도 좋아질 것 같다. 오늘이 그 시작! 10 minutes to pandas 해당 문서는 새로운 유저에게 맞춰진 짧은 pandas 소개입니다. 좀 더 복잡한 부분은 cookbook에서 확인해볼 수 있습니다. 보통 아래와 같이 import 하여 사용합니다. import numpy as np import pandas as pd Object creation(객체 생성) 자세한 내용은 Data Structure Intro section 을 참고하세요. li.. 2020. 9. 6.