본문 바로가기
반응형

분류 전체보기50

[PYTHON] IS 와 == 의 차이는 무엇인가? - 이 글은 제가 공부를 하며, 이해한 것을 바탕으로 작성하는 글입니다. - 그렇기에 틀리거나 잘못된 부분이 있을 수 있습니다. - 글의 오류를 발견하시면, 댓글로 말씀해 주시면 정말 감사하겠습니다. is는 변수가 같은 Object(객체)를 가리키면 True ==는 변수가 같은 Value(값)을 가지면 True [1] 개념 보통 python에서 같다는 것을 표현할 때 2가지 방법이 존재한다. is와 ==이다. 일반적인 상황에서는 결과가 같다고 생각하여, 두 개를 혼용해서 사용할 수도? 있으나(아니다. 혼용은) 2가지는 완연히 다른 것이다. 결론부터 이야기하면, 둘은 완전히 다르다! 같은 결과를 보일 때가 있을 뿐! == : 어떠한 두 변수가 같은 값(value)을 가지면 True를 반환 is : 어떠한 .. 2022. 6. 4.
[DATA] ODS란 무엇인가? - 이 글은 제가 공부를 하며, 이해한 것을 바탕으로 작성하는 글입니다. - 그렇기에 틀리거나 잘못된 부분이 있을 수 있습니다. - 글의 오류를 발견하시면, 댓글로 말씀해 주시면 정말 감사하겠습니다. [1] 내용 설명 - ODS는 Operational Data Store의 준말로 운영 데이터 저장소라고 한다. 가장 일반적인 사용 방법은 다음과 같다. ODS는 막 생성된 많은 데이터(원천, 운영, prd 데이터)를 정형화 시킨 뒤(일정한 형태로 가공을 거친 뒤) 저장하여 유지, 관리하는 스테이징에 속하는 공간으로 DW를 구축하는데 중간 역할을 담당하는 공간을 말한다. 다른 목적은 아래와 같다. DW에 대규모 데이터에 대한 복잡한 쿼리를 수행할 수 있지만, ODS는 작은 데이터 집합에 대해 간단한 쿼리를 수.. 2022. 5. 8.
[Linux] nohup & Log 파일명 변경 생성 - 이 글은 제가 공부를 하며, 이해한 것을 바탕으로 작성하는 글입니다. - 그렇기에 틀리거나 잘못된 부분이 있을 수 있습니다. - 글의 오류를 발견하시면, 댓글로 말씀해 주시면 정말 감사하겠습니다. [0] 내용 설명 nohup은 no hang up의 약자로, 그냥 직역하면 끊지 말아라~라는 뜻이다. 즉, 내가 지금 운영체제를 사용하는 세션을 종료하더라도, 내가 실행하는 것을 데몬의 형태로 실행하여 종료하지 않고 계속 실행이 이어질 수 있게 처리하는 것이다. 보통은 백그라운드 실행인 &과 같이 사용한다. 이것은 작업을 사용자 눈에 보이지 않게 백그라운드로 실행한다는 명령어이다. 그래서 nohup 과 &을 같이 동시에 사용하면, 내가 운영체제를 사용하는 세션이 종료되더라도, 백그라운드로 실행된다. [1] .. 2022. 4. 24.
[BigQuery] ARRAY, NESTED - 이 글은 제가 공부를 하며, 이해한 것을 바탕으로 작성하는 글입니다. - 그렇기에 틀리거나 잘못된 부분이 있을 수 있습니다. - 글의 오류를 발견하시면, 댓글로 말씀해 주시면 정말 감사하겠습니다. - 이 글은 구글의 교육 ARRAY 페이지(GSP416)와 DOCS를 정리한 것입니다. 일반적으로 아래와 같은 테이블들이 존재할 때, 우리는 불편하다. 뭔지 모를 쪼개야 할 것 같은 생각이 들기 때문이다. 정규화를 해야 하겠군과 같은 생각이 든다. 사람 좋아하는 과일 강박사 사과 강박사 수박 줄줄이 사과 줄줄이 바나나 용용이 레몬 용용이 사과 그러나 BIGQUERY에서는 RDB가 아니기에 정규화를 해야하겠다는 생각을 버려야 한다. 오히려 반정 규화를 해서 테이블을 합쳐 놓는 것이 성능이 가장 좋다. BIGQ.. 2022. 4. 3.
[Pandas] 중복 행 찾기 Dataframe.duplicated() - 이 글은 제가 공부를 하며, 이해한 것을 바탕으로 작성하는 글입니다. - 그렇기에 틀리거나 잘못된 부분이 있을 수 있습니다. - 글의 오류를 발견하시면, 댓글로 말씀해 주시면 정말 감사하겠습니다. - 데이터를 처리하다 보면, 데이터를 처음 받아서 확인할 때 또는 데이터를 여러 번 join 하는 경우 등 중복된 행을 확인해야 하는 경우들의 종종 있다. 오늘은 pandas에서 중복 행 관련 처리하는 방법을 정리해 보려고 한다. [1] 개념 pandas에서는 duplicated 메서드를 이용하여, 판단하게 됩니다. 이를 이해하면, 중복 행 관련 작업을 쉽게 처리할 수 있습니다. DataFrame.duplicated(subset=???, keep='???') - return value True, False의.. 2022. 2. 27.
[Linux] Ubuntu에서 RPM 파일 설치 - 이 글은 제가 공부를 하며, 이해한 것을 바탕으로 작성하는 글입니다. - 그렇기에 틀리거나 잘못된 부분이 있을 수 있습니다. - 글의 오류를 발견하시면, 댓글로 말씀해 주시면 정말 감사하겠습니다. 프로젝트를 진행 중, 새로운 서버를 할당받아, 환경 구축을 하던 중, 필요한 프로그램을 설치해야 하는 경우가 있었다. 설치 파일을 다운로드하여 보니, Ubuntu에서 사용하지 않는, RPM 확장자로 된 파일이어서 설치를 하는데 애를 먹은 경험이 있다. RPM 파일과 이를 Ubuntu에서 설치하는 방법을 정리를 해보려고 한다. [1] RPM파일이란? RPM 패키지 매니저(RPM Package Manager←Red Hat Package Manager)는 원래 레드햇에서 사용되었던 패키지 파일이었지만, 현재는 많.. 2022. 2. 19.
반응형