본문 바로가기

Data Analysis/Python3

[Python] 결측치 처리 심화 (groupby, transform 함수) 이번 글에서는 python에서 결측치 처리하는 데 있어서, groupby()와 transform() 함수를 같이 사용하는 방법에 대해 살펴보고자 합니다. 우선 환자들에 대한 체온, 심박수 등 기본적인 정보에 대한 데이터가 있다고 가정하겠습니다. 수행하고 싶은 전처리는 데이터에 결측치가 존재할 때, 해당 결측치를 환자의 평균값으로 대치하는 것입니다. 예를 들어, A 환자의 심박수에 결측치가 존재하게 되는 경우, 해당 데이터는 A 환자의 평균 심박수로 대치되는 것입니다. for 구문을 통해 각 환자별 데이터를 추출하고, 결측치가 존재한다면 환자의 평균값을 계산하여 결측치를 대치할 수도 있습니다. 하지만 더 간단한 코드로 해당 과정을 수행하기를 원했고, 검색하다가 찾은 방법이 groupby()와 transfo.. 2023. 8. 29.
[Python] Configuration 관리 및 사용 이번 글에서는 Python에서 Configuration을 관리하고 사용하는 방법에 대해 살펴볼 예정입니다. Python을 비롯하여 대부분의 프로그래밍 언어를 사용하다 보면, 여러 코드에서 공통적으로 동일한 변수를 사용하게 되고, 변경될 때마다 각 코드에서 수정을 하신 경험이 있으실 겁니다. 이러한 경우에 사용하면 효율적인 것이 configuration을 활용하는 것입니다. 사용 방법에 대해 순서대로 설명하겠습니다. 1. Configuration 파일 생성 및 관리 우선 configuration으로 관리하고자 하는 변수들을 선정해주고, ini 확장자로 각 변수들을 할당해 줍니다. 예시는 아래와 같으며, DB 접속 정보를 configuration으로 관리하는 예시를 보여드리고자 합니다. [DB] DB_HOS.. 2023. 4. 21.
[Python] Python과 PostgreSQL 연동 이번 글에서는 Python과 PostgreSQL을 연동하여 DB에서 테이블을 불러오고 데이터 프레임 형태로 바꾸는 과정을 살펴보고자 합니다. 우선 terminal이나 conda를 이용하여 'psycopg2' 패키지를 설치해줍니다. 이후 DB 정보를 입력하고, 쿼리를 통해 테이블을 가져온 후 데이터 프레임으로 바꾸는 일반적인 코드는 다음과 같습니다. >>> import psycopg2 >>> import pandas as pd >>> >>> pgdb = psycopg2.connect( >>> host={'localhost' or ip address}, >>> dbname={DB name}, >>> user={User name}, >>> password={Password}, >>> port={Port num.. 2022. 11. 24.