본문 바로가기
반응형

전체 글50

[Pandas] 중복 행 찾기 Dataframe.duplicated() - 이 글은 제가 공부를 하며, 이해한 것을 바탕으로 작성하는 글입니다. - 그렇기에 틀리거나 잘못된 부분이 있을 수 있습니다. - 글의 오류를 발견하시면, 댓글로 말씀해 주시면 정말 감사하겠습니다. - 데이터를 처리하다 보면, 데이터를 처음 받아서 확인할 때 또는 데이터를 여러 번 join 하는 경우 등 중복된 행을 확인해야 하는 경우들의 종종 있다. 오늘은 pandas에서 중복 행 관련 처리하는 방법을 정리해 보려고 한다. [1] 개념 pandas에서는 duplicated 메서드를 이용하여, 판단하게 됩니다. 이를 이해하면, 중복 행 관련 작업을 쉽게 처리할 수 있습니다. DataFrame.duplicated(subset=???, keep='???') - return value True, False의.. 2022. 2. 27.
[Linux] Ubuntu에서 RPM 파일 설치 - 이 글은 제가 공부를 하며, 이해한 것을 바탕으로 작성하는 글입니다. - 그렇기에 틀리거나 잘못된 부분이 있을 수 있습니다. - 글의 오류를 발견하시면, 댓글로 말씀해 주시면 정말 감사하겠습니다. 프로젝트를 진행 중, 새로운 서버를 할당받아, 환경 구축을 하던 중, 필요한 프로그램을 설치해야 하는 경우가 있었다. 설치 파일을 다운로드하여 보니, Ubuntu에서 사용하지 않는, RPM 확장자로 된 파일이어서 설치를 하는데 애를 먹은 경험이 있다. RPM 파일과 이를 Ubuntu에서 설치하는 방법을 정리를 해보려고 한다. [1] RPM파일이란? RPM 패키지 매니저(RPM Package Manager←Red Hat Package Manager)는 원래 레드햇에서 사용되었던 패키지 파일이었지만, 현재는 많.. 2022. 2. 19.
[Linux] What does apt get update do? - 제가 궁금한 내용들을 검색하여 찾은 결과들을 저장합니다. - 추후, 정리가 되면 한글로 정리해서 새롭게 글을 업로드할 예정입니다. command line - What does "sudo apt-get update" do? - Ask Ubuntu 2022. 2. 14.
[DB] ODBC라는 것은 무엇인가. - 이 글은 제가 공부를 하며, 이해한 것을 바탕으로 작성하는 글입니다. - 그렇기에 틀리거나 잘못된 부분이 있을 수 있습니다. - 글의 오류를 발견하시면, 댓글로 말씀해 주시면 정말 감사하겠습니다. 이번 프로젝트에서는 파이썬으로 여러 DB, DW에 접근하여 필요한 데이터를 가져오는 경우가 많이 있었다. 어려웠고, 이해가 잘 되지 않았던 부분은 DB에 접속하는 방법이었다. PYMYSQL, PYMSSQL 라이브러리 같은 경우는 쉽게 사용할 수 있었지만, PYODBC 라이브러리의 사용은 쉽지 않았다. 우선 우분투에 설치하는 것부터가 난관이었고, 간단히 테스트를 위한 로컬(윈도우)에서의 사용도 쉽지 않았다. 이 것들에 관련하여, 검색하며 자료를 찾는 중, ODBC와 DSN과 같은 용어들이 많이 나와, 개념을 .. 2022. 2. 12.
반응형