본문 바로가기
반응형

분류 전체보기50

[PYTHON] JSON 파일 예쁘게 정렬해서 출력하는 방법 Python 3에서 JSON 파일을 열어보면 아래와 같이 읽기 힘든 형태로 출력된다. {"이름": "강박사","나이": 35,"학력": [{"고등학교": "너너고등학교","중학교": "거거중학교","초등학교": "더더초등학교"}]} 이런 경우에 필자는 보통 인터넷에 있는 json editor를 이용해서 정렬해서 json file을 확인하곤 했으나, python 3 내부에서 바로 처리가 가능하다. json 파일을 처리하는 dump 파일에서 indent와 sort_keys 인수를 넣어주면 깔끔하게 출력된다. 참고로 indent 값은 변경 가능하다. 일반적으로 tab구분으로 정렬하기에 4칸을 indent 값으로 주었다. 아래 예시를 보자. json.dump(json_file, indent = 4, sort_k.. 2021. 7. 5.
[Python Error] UnicodeDecodeError: 'cp949' codec can't decode byte 0xed in position 42: illegal multibyte sequence 에러명 UnicodeDecodeError: 'cp949' codec can't decode byte 0xed in position 42: illegal multibyte sequence 에러 내용 파이선 디코딩 에러로, 파이썬 3은 파일을 읽어올 때, ANSI 기준으로 인코딩 된 파일만 읽어올 수 있다. 그 이외의 형식으로 인코딩 된 파일들은 인코딩 명을 명시 해줘야 한다. 해결 방안 현재 에러는 CP949형태의 인코딩 방식을 사용한 파일을 그냥 OPEN 하려 하였기에 발생한 에러로, 파일의 인코딩을 명시해주면 된다. 아래는 예시로, 인코딩이 UTF8로 된 파일을 읽을 떄를 기준으로 작성하였다. 자신의 파일의 인코딩을 확인하고 해당하는 인코딩방식을 UTF8 대신 기입해 주면 된다. with open(fi.. 2021. 7. 5.
[ETL][0] ETL이란 무엇인가? - 이 글은 제가 공부를 하며, 이해한 것을 바탕으로 작성하는 글입니다. - 그렇기에 틀리거나 잘못된 부분이 있을 수 있습니다. - 글의 오류를 발견하시면, 댓글로 말씀해 주시면 정말 감사하겠습니다. ETL에 대한 간략한 정리가 필요하다 판단하여 공부를 하게 되었다. 개념이 잘 잡히지 않은 분들은 같이 읽어나가며 공부를 하는 것도 좋을 것 같다. 가장 먼저, ETL의 정의를 한번 살펴보자. 여러 정의를 가지고 읽어 보자 [1] 정의 1. ETL은 extract, transform, load를 의미하며, 조직 내외부의 복수의 source들로부터의 data를 data 분석을 위한 data warehouse, data mart 내로 이동시키는 process로서, 추출, 재구성(reformatting), 정제,.. 2021. 6. 28.
[MYSQL] CHAR_LENGTH 함수 - 문자열 길이 CHARACTER_LENGTH 함수 CHARACTER_LENGTH 함수는 문자열이 단순히 몇 개가 있는지 측정해서 반환하는 함수입니다. 같은 함수로는 CHAR_LENGTH가 존재합니다. 사용법은 동일합니다. CHARACTER_LENGTH = CHAR_LENGTH 함수의 사용법이 아래와 같이 간단하여, 바로 예제를 보시겠습니다. CHARACTER_LENGTH('문자열') [1] 사용 형태 1. 문자열의 글자 수 세기 select character_length('abcde'); -> 결과는 5 2. 해당하는 열의 글자 수 가져오기 NICKNAME NAME COUNTRY sigong 강박사 대한민국 storm 점줄줄 브라질 yog 정정줄 아르헨티나 table1 SELECT CHAR_LENGTH(NAME) FR.. 2021. 5. 31.
[MYSQL] LIKE 함수 - 특정 문자 검색하기 LIKE() 함수 LIKE 함수는 문자열 내에서 내가 원하는 문자열을 찾는 함수입니다. REGEXP를 자주 사용하지만, 간단하게 LIKE를 사용하기도 합니다. LIKE함수는 WILDCARDS 문자들과 함께 쓰입니다. WILDCARD에 대한 간단한 설명은 아래 적어두었습니다. WILDCARDS(와일드 카드) 문자란 컴퓨터에서 특정 명령어로 명령을 내릴 때, 여러 파일을 한꺼번에 지정할 목적으로 사용하는 기호를 가리킨다. 이 문자는 어느 곳에서 사용하느냐에 따라 약간의 차이를 보인다. 주로 특정한 패턴이 있는 문자열 혹은 파일을 찾거나, 긴 이름을 생략할 때 쓰인다. SQL에서의 와일드 카드는 간단히 문자열에서 하나 이상의 문자를 대체하는 데 사용되는 문자!라고 생각 해주시면 좋을 것 같습니다. 이 WILD.. 2021. 5. 26.
[MYSQL] MID/ SUBSTRING/ SUBSTR 함수 - 문자열 일부 가져오기 MID/ SUBSTRING/ SUBSTR 함수 이 3가지 함수들은 MYSQL에서 문자열의 일부분을 가지고 오는 함수들입니다. 다른 함수 같지만, 모두 동일한 역할을 수행하고 사용법 또한 동일합니다. MID = SUBSTR = SUBSTRING MID/ SUBSTR/ SUBSTRING 함수: 지정된 문자열 중, 사용자가 원하는 위치에서부터 위치까지의 문자열을 가지고 오는 함수 함수는 다음과 같이 사용합니다. 인수는 3가지로, 사용할 문자열을 기입하는 인수(String), 문자열을 가지고 오기 시작할 지점(Position), 가져올 길이(Length) 순서로 되어있습니다. 문자열의 위치를 선정할 때 일반적인 방법과 같이 왼쪽에서 1부터 세어 글자의 위치를 판단할 수 있지만, 맨 마지막 문자열을 -1로 기준을.. 2021. 5. 25.
반응형