본문 바로가기

전체 글101

[python/파이썬] 여러 개의 json 파일 합치기, 병합하기 저는 그냥 json을 dataframe 형태로 변환하여 concat 한 다음 다시 json으로 저장하는 방식을 사용했는데요, 딱봐도 과정이 많죠? 그래서 그냥 json 파일끼리 병합하는 방식을 찾아보았습니다. 근데 아래 방법보다 더 좋은 방법도 분명 있을 것 같아요, 있다면 댓글로 알려주세요! 1. json 파일 로드 여기서 로드된 두 json파일, data1, data2는 파이썬 코드 상에서 list 타입을 가지고있고, list 내의 원소들은 모두 dict 형태를 가지고 있습니다. import json with open('/path/to/file1') as file_1: data1 = json.load(file_1) with open('/path/to/file2') as file_2: data1 = j.. 2020. 9. 11.
[MySQL] COUNT() : 테이블 내의 데이터 갯수 세기 요약 COUNT() 함수는 SELECT 쿼리로 반환된 결과의 개수를 반환합니다. 문법 COUNT(expression) expression: 필드 및 문자열 * NULL은 따로 세지 않습니다!(어찌보면 당연) 예시 - 테이블에서 모든 행의 개수 세기 SELECT COUNT(*) FROM {TABLE_NAME}; - 테이블에서 특정 열의 데이터의 개수 세기 SELECT COUNT('col') FROM {TABLE_NAME}; - COUNT 내에 조건문을 사용할 수도 있다. SELECT COUNT('col'), COUNT(IF(a>1, a, NULL)) FROM {TABLE_NAME}; 출처 오늘도 배워 갑니당~! www.w3schools.com/sql/func_mysql_count.asp blog.shove.. 2020. 9. 11.
pandas 번역: 10분만에 판다스 보기 (pandas User guide 번역/pandas 기초 입문/Pandas 간단 요약) 주니어로서 어떤 능력을 갖추는게 좋을까요? 라고 과장님께 질문을 했더니 pandas cookbook을 빌려주시며, 나즈막하게 '이 책을 뜯어드시면 됩니다..'라고 말씀하시고 떠났다. 그래서 pandas User guide를 번역해보기로 했다. 덩달아 영어 실력도 좋아질 것 같다. 오늘이 그 시작! 10 minutes to pandas 해당 문서는 새로운 유저에게 맞춰진 짧은 pandas 소개입니다. 좀 더 복잡한 부분은 cookbook에서 확인해볼 수 있습니다. 보통 아래와 같이 import 하여 사용합니다. import numpy as np import pandas as pd Object creation(객체 생성) 자세한 내용은 Data Structure Intro section 을 참고하세요. li.. 2020. 9. 6.
특정 문자가 들어간 데이터프레임 열 이름 검색하기: df.filter() 나는 개발을 배운지 얼마되지 않아서, df로 표현될 수 있다면, 데이터프레임의 형태로 데이터를 다루는 것을 선호한다 (2D MATRIX의 강력함!) 그런데, 데이터 프레임이 점점 커지다보면, 열의 이름과 행의 위치를 정확히 기억할 수 없다. 이럴 때에는 데이터프레임 내의 열을 검색하는 메서드와 인덱싱하는 메서드가 크게 도움이 된다. import pandas as pd test = pd.DataFrame([ [1, 2, 3, 4], [5, 6, 7, 8] ] ) test.columns = ['a_a', 'b_b', 'c_a', 'd_b'] 요렇게 샘플로 데이터프레임을 만들어 보았다. 이제 여기서 '_a'가 들어간 열을 추출해보자 test.filter(regex='_a') 이렇게, DataFrame.filt.. 2020. 9. 3.
[1일 1모듈] collections -1: namedtuple 1일 1 모듈이지만 collection은 죄다 쪼개서 볼 것이다. 💡 선요약: 파이썬의 빌트인 모듈 중 하나로, 기본 자료형인 dict, list, set, tuple에서 더 나아가 namedtuple, deque, defaultdict 등 특수 자료형을 사용할 수 있도록 하는 모듈이다! *공부하면서 작성한 글- 틀린 게 있다면 언제든지 피드백 SVP~!* 최근 데이터의 중요성이 부각되고 있는 건 모두가 알고 있는 사실, 이러한 모듈들을 잘 사용하면 속도도 더욱 빠르고, 메모리도 절약하는 경제적인 코딩을 할 수 있다고 한다. namedtuple: ㅎㅇ 나 튜플. 이름 내놔 namedtuple이라는 단어를 뜯어보면, 말 그대로 '이름이 붙여진 튜플'이다. 작고 간단한 클래스를 만드는 것과 유사하다. 💡 튜.. 2020. 9. 3.