본문 바로가기
반응형

전체 글54

[PYTHON] JSON 파일 예쁘게 정렬해서 출력하는 방법 Python 3에서 JSON 파일을 열어보면 아래와 같이 읽기 힘든 형태로 출력된다. {"이름": "강박사","나이": 35,"학력": [{"고등학교": "너너고등학교","중학교": "거거중학교","초등학교": "더더초등학교"}]} 이런 경우에 필자는 보통 인터넷에 있는 json editor를 이용해서 정렬해서 json file을 확인하곤 했으나, python 3 내부에서 바로 처리가 가능하다. json 파일을 처리하는 dump 파일에서 indent와 sort_keys 인수를 넣어주면 깔끔하게 출력된다. 참고로 indent 값은 변경 가능하다. 일반적으로 tab구분으로 정렬하기에 4칸을 indent 값으로 주었다. 아래 예시를 보자. json.dump(json_file, indent = 4, sort_k.. 2021. 7. 5.
[Python Error] UnicodeDecodeError: 'cp949' codec can't decode byte 오류 이 글은 공부하며 정리한 내용입니다. 틀리거나 보완할 점이 있다면 댓글로 알려주시면 감사하겠습니다.1. 핵심 요약UnicodeDecodeError: 'cp949' codec can't decode byte 에러는 파이썬이 파일을 읽을 때, 기본 인코딩(cp949 또는 ANSI)으로 읽으려다 실패할 때 발생한다.파일의 실제 인코딩 방식과 읽을 때 설정된 인코딩이 일치하지 않으면 발생한다.보통 UTF-8로 저장된 파일을 Windows 환경에서 열 때 많이 발생한다.2. 상세 내용 설명2-1. 에러 메시지 예시UnicodeDecodeError: 'cp949' codec can't decode byte 0xed in position 42: illegal multibyte sequence'cp949'는 Windo.. 2021. 7. 5.
ETL이란 무엇인가 – 개념 이 글은 공부하며 정리한 내용입니다. 틀리거나 보완할 점이 있다면 댓글로 알려주시면 감사하겠습니다.1. 핵심 요약ETL은 Extract(추출), Transform(변환), Load(적재)의 약자로, 데이터를 옮기고 바꾸고 저장하는 전체 흐름을 말한다.예를 들어 여러 시스템(DB, 로그 등)에 흩어진 데이터를 하나로 모아서 분석용 테이블에 저장하는 게 전형적인 ETL 흐름이다.흔히 데이터 웨어하우스(DW), 데이터 마트(DM) 같은 저장소에 데이터를 쌓기 위한 전처리 과정으로 활용된다.2. 상세 내용 설명ETL의 구성 요소Extract (추출)다양한 원천 시스템에서 데이터를 가져오는 단계예: MySQL, PostgreSQL, Excel, API, 로그 파일 등Transform (변환)가져온 데이터를 목적에.. 2021. 6. 28.
[MYSQL] CHAR_LENGTH 함수 - 문자열 길이 CHARACTER_LENGTH 함수 CHARACTER_LENGTH 함수는 문자열이 단순히 몇 개가 있는지 측정해서 반환하는 함수입니다. 같은 함수로는 CHAR_LENGTH가 존재합니다. 사용법은 동일합니다. CHARACTER_LENGTH = CHAR_LENGTH 함수의 사용법이 아래와 같이 간단하여, 바로 예제를 보시겠습니다. CHARACTER_LENGTH('문자열') [1] 사용 형태 1. 문자열의 글자 수 세기 select character_length('abcde'); -> 결과는 5 2. 해당하는 열의 글자 수 가져오기 NICKNAME NAME COUNTRY sigong 강박사 대한민국 storm 점줄줄 브라질 yog 정정줄 아르헨티나 table1 SELECT CHAR_LENGTH(NAME) FR.. 2021. 5. 31.
반응형