728x90

빅데이터 분석기사[python] 16

[python 파이썬, pandas 판다스] 데이터 변환2 (열 필터링, 열 추가, 열 삭제)

데이터 변환 두 번째 정리에서는 열 필터링, 열 추가, 열 삭제 관련한 내용을 정리하려고 한다. 데이터 복사하기, 행 인덱스 및 칼럼명 확인하고 변경하기 관련 내용은 이전 포스팅인 아래의 링크를 참고하면 된다. [python 파이썬, pandas 판다스] 데이터 변환1 (데이터 복사, 행과 열의 이름 확인하기 및 변경하기) 판다스에서 데이터프레임 형태로 불러온 데이터는 복사도 가능하며 행 인덱스, 열이름을 확인하고 바꾸기도 가능하다. 이번엔 이러한 기능들에 대해 정리하고자 한다. 예시를 들기 위하여 kaggle sunning-10.tistory.com 예시를 위해 간단한 데이터프레임을 생성하였다. DF = pd.DataFrame({'name' : ['Minsoo','Minju','Yeomin','Hyer..

[python 파이썬, pandas 판다스] 데이터 불러오기 및 저장하기

판다스로 csv파일을 불러오는 방법, 판다스로 작업한 데이터프레임을 csv파일로 저장하는 방법에 대해 정리해보자. 1) csv파일 불러오기 : pd.read_csv('파일명.csv') 불러오려는 데이터가 코드 파일과 같은 폴더에 위치해 있다면 다음과 같이 불러올 수 있다. import pandas as pd DF = pd.read_csv('IRIS.csv') csv파일이나 excel파일을 불러올 때 오류가 발생한다면 아래의 링크의 내용을 통해 오류를 해결할 수 있을 것이다. [python 파이썬, pandas 판다스] csv 및 excel 파일 불러오기 (한글 깨지는 경우 해결) 파이썬에서 pandas로 csv나 xlsx 형태의 데이터를 불러올 수 있다. 그 방법은 아래와 같다. (물론 import pa..

[python 파이썬, pandas 판다스] 데이터 변환1 (데이터 복사, 행과 열의 이름 확인하기 및 변경하기)

판다스에서 데이터프레임 형태로 불러온 데이터는 복사도 가능하며 행 인덱스, 열이름을 확인하고 바꾸기도 가능하다. 이번엔 이러한 기능들에 대해 정리하고자 한다. 예시를 들기 위하여 kaggle의 예제 데이터를 사용하였다. 먼저 read_csv로 데이터를 불러온다. import pandas as pd DF = pd.read_csv('IRIS.csv', engine = 'python') DF.head() 1) 데이터프레임 복사하기 : df명.copy() 데이터 사용 시 데이터 DF를 DF1으로 복사하고 싶은 경우가 있다. 이때 주의할 점은 단순하게 DF1 = DF로 설정하면 향후 DF가 변경되면 DF1도 함께 변경된다는 것이다. 예로 DF1 = DF로 설정한 후에 DF의 칼럼명이 species인 열의 값을 다..

[python 파이썬, pandas 판다스] DataFrame 열(column) & 행(row) 불러오기

파이썬의 pandas에서 데이터프레임 형태로 데이터를 불러왔다면 이것을 확인하는 방법을 알아야한다. 데이터는 많은 행과 열로 이루어져 있으며 데이터에 따라 그 개수도 천차만별이다. 이것을 행 기준의 특정 부분, 혹은 열 기준의 특정 부분만 확인하려면 어떻게 해야할까? 예시로 사용할 데이터는 kaggle에서 다운로드받은 IRIS.csv 데이터를 사용하겠다. 먼저 pd.read_csv를 활용하여 데이터를 불러오자. 행(row) 기준 확인/불러오기 맨 앞 & 맨 뒤의 행 확인 : head(), tail() 변수명.head(불러올 행 개수) : 앞에서부터 n개의 행 확인 변수명.tail(불러올 행 개수) : 뒤에서부터 n개의 행 확인 head와 tail 모두 괄호 안이 공백이면 5개의 행만 출력한다. 150개의..

[python 파이썬, pandas 판다스] csv 및 excel 파일 불러오기 (한글 깨지는 경우 해결)

파이썬에서 pandas로 csv나 xlsx 형태의 데이터를 불러올 수 있다. 그 방법은 아래와 같다. (물론 import pandas as pd를 먼저 수행해야 하며 파일주소에 파일명, 확장자가 정확히 위치해야한다. 파일주소를 치기 귀찮다면 데이터 파일을 코드 파일과 같은 폴더에 위치시키면 파일 주소를 생략하고 파일명만 입력해도 된다.) csv 파일 불러오기 : pd.read_csv('파일주소/파일명.csv') xls/xlsx 파일 불러오기 : pd.read_excel('파일주소/파일명.xlsx') 예시로 kaggle에서 다운로드한 'IRIS.csv'라는 이름을 가진 csv 파일을 한 번 불러와보자. DF = pd.read_csv('IRIS.csv') ## 코드 파일과 csv 파일이 같은 폴더에 위치하면..

[python 파이썬, pandas 판다스] series와 dataframe

판다스(pandas) 자료구조 및 데이터 분석 처리를 위한 파이썬의 핵심 패키지 판다스는 시리즈(Series)와 데이터프레임(DataFrame) 형태 두 가지로 나눌 수 있음 시리즈(series) index와 value의 형태를 갖고 있는 판다스의 자료 구조 value 말고 index를 갖는다는 점에서 리스트와 차이점이 있음 import pandas as pd from pandas import Series, DataFrame ### Series ### a = Series([4,6,8,10]) print(a) print(a.values) ## value print(a.index) ## 시리즈 인덱스 변경하기 a2 = Series([4,6,8,10], index = ['a','b','c','d']) prin..

728x90