본문 바로가기
반응형

전체 글50

[PYTHON] JSON 파일 예쁘게 정렬해서 출력하는 방법 Python 3에서 JSON 파일을 열어보면 아래와 같이 읽기 힘든 형태로 출력된다. {"이름": "강박사","나이": 35,"학력": [{"고등학교": "너너고등학교","중학교": "거거중학교","초등학교": "더더초등학교"}]} 이런 경우에 필자는 보통 인터넷에 있는 json editor를 이용해서 정렬해서 json file을 확인하곤 했으나, python 3 내부에서 바로 처리가 가능하다. json 파일을 처리하는 dump 파일에서 indent와 sort_keys 인수를 넣어주면 깔끔하게 출력된다. 참고로 indent 값은 변경 가능하다. 일반적으로 tab구분으로 정렬하기에 4칸을 indent 값으로 주었다. 아래 예시를 보자. json.dump(json_file, indent = 4, sort_k.. 2021. 7. 5.
[Python Error] UnicodeDecodeError: 'cp949' codec can't decode byte 0xed in position 42: illegal multibyte sequence 에러명 UnicodeDecodeError: 'cp949' codec can't decode byte 0xed in position 42: illegal multibyte sequence 에러 내용 파이선 디코딩 에러로, 파이썬 3은 파일을 읽어올 때, ANSI 기준으로 인코딩 된 파일만 읽어올 수 있다. 그 이외의 형식으로 인코딩 된 파일들은 인코딩 명을 명시 해줘야 한다. 해결 방안 현재 에러는 CP949형태의 인코딩 방식을 사용한 파일을 그냥 OPEN 하려 하였기에 발생한 에러로, 파일의 인코딩을 명시해주면 된다. 아래는 예시로, 인코딩이 UTF8로 된 파일을 읽을 떄를 기준으로 작성하였다. 자신의 파일의 인코딩을 확인하고 해당하는 인코딩방식을 UTF8 대신 기입해 주면 된다. with open(fi.. 2021. 7. 5.
[ETL][0] ETL이란 무엇인가? - 이 글은 제가 공부를 하며, 이해한 것을 바탕으로 작성하는 글입니다. - 그렇기에 틀리거나 잘못된 부분이 있을 수 있습니다. - 글의 오류를 발견하시면, 댓글로 말씀해 주시면 정말 감사하겠습니다. ETL에 대한 간략한 정리가 필요하다 판단하여 공부를 하게 되었다. 개념이 잘 잡히지 않은 분들은 같이 읽어나가며 공부를 하는 것도 좋을 것 같다. 가장 먼저, ETL의 정의를 한번 살펴보자. 여러 정의를 가지고 읽어 보자 [1] 정의 1. ETL은 extract, transform, load를 의미하며, 조직 내외부의 복수의 source들로부터의 data를 data 분석을 위한 data warehouse, data mart 내로 이동시키는 process로서, 추출, 재구성(reformatting), 정제,.. 2021. 6. 28.
[MYSQL] CHAR_LENGTH 함수 - 문자열 길이 CHARACTER_LENGTH 함수 CHARACTER_LENGTH 함수는 문자열이 단순히 몇 개가 있는지 측정해서 반환하는 함수입니다. 같은 함수로는 CHAR_LENGTH가 존재합니다. 사용법은 동일합니다. CHARACTER_LENGTH = CHAR_LENGTH 함수의 사용법이 아래와 같이 간단하여, 바로 예제를 보시겠습니다. CHARACTER_LENGTH('문자열') [1] 사용 형태 1. 문자열의 글자 수 세기 select character_length('abcde'); -> 결과는 5 2. 해당하는 열의 글자 수 가져오기 NICKNAME NAME COUNTRY sigong 강박사 대한민국 storm 점줄줄 브라질 yog 정정줄 아르헨티나 table1 SELECT CHAR_LENGTH(NAME) FR.. 2021. 5. 31.
반응형