728x90

파이썬 35

[python, vs code] visual studio code에서 파이썬 개발 환경 만들기

visual studio code는 마이크로소프트가 윈도우, macOS, 리눅스용으로 개발한 소스 코드 편집기이다. 나는 그동안 아나콘다의 spyder나 jupyter notebook를 활용해 파이썬 개발을 했었는데, 이번엔 윈도우에서 vs code를 토대로 파이썬 작업 환경을 만드는 방법에 대해 공부해보자. 방법은 크게 3단계로 나눌 수 있다. visual studio code에서 파이썬 개발 환경 만들기 1. Python 인터프리터 설치하기 2. visual studio code 설치하기 3. 파이썬 Extension 설치하기 ▶ Python 인터프리터 설치하기 (미설치 상태라면 설치, 설치되어있다면 pass!) 아래의 링크에서 파이썬 인터프리터 설치파일 다운로드 및 설치 https://www.pyt..

[python] warning 숨기기 및 무시하기

파이썬에서 작업 중 오류, error가 아닌 경고, warning이 발생하는 경우가 있다. 이런 경고는 오류와 달리 주의를 주는 것일 뿐 코드는 잘 돌아가므로 말그대로 조심만 하면 될뿐 작업하는 데 별 문제가 되지 않는다. 이때 계속 반복하여 경고문이 발생할 때 이를 숨기는 방법에 대해 알아보자. (특히 AI 학습 시 한 번 warning이 발생하면 episode를 반복할때마다 경고문이 생기므로 학습 결과를 확인하는데 아래처럼 방해가 된다.) warning은 생각보다 간단하게 코드 두 줄로 숨길 수 있다. import warnings warnings.filterwarnings('ignore') warning을 말그대로 ignore 무시하겠다는 코드를 작성하고 똑같은 코드를 수행해보면 아래처럼 경고문이 숨..

[python] tensorflow 설치 오류 해결

저번 글에서 tensorflow.contrib 모듈 오류를 해결하기 위해 tensorflow 버전을 2.2.0에서 1.15.0으로 낮춰주었다. 그리고 import tensorflow as tf를 실행하자마자 새로운 오류를 마주하였다. 다시보아도 아찔한 엄청난 양의 무언가ㅎ 요약하면 TypeError가 발생하였다는 것 같다. TypeError: Descriptors cannot not be created directly. If this call came from a _pb2.py file, your generated code is out of date and must be regenerated with protoc >= 3.19.0. If you cannot immediately regenerate you..

[python 파이썬, pandas 판다스] pandas와 numpy 전환

판다스와 넘파이는 서로 간단하게 변환이 가능하다. 머신러닝, 딥러닝에서는 numpy로 분석해야 연산의 속도가 빨라지기 때문에 pandas로 기본 분석을 수행한 후 넘파이로 변환하여 머신러닝이나 딥러닝을 수행한다. 반면에 numpy는 데이터를 눈으로 확인하기 어려워 pandas로 변환하여 데이터를 확인한다. 1) 판다스(pandas)를 넘파이(numpy)로 변경하기 : df.to_numpy() 먼저 판다스로 데이터프레임 형태의 데이터를 불러오자. import pandas as pd DF = pd.read_csv('IRIS.csv', engine = 'python') DF.head() 이것을 DF.to_numpy()를 사용하면 간단히 numpy로 변경하여 불러올 수 있다. 하지만 이때 넘파이로 변환하면 행 ..

[python 파이썬, pandas 판다스] 데이터 값 변경하기, 바꾸기

이번에는 python 판다스에서 데이터의 특정 값을 바꾸고 싶을 때 어떻게 하는지 정리해보자. 먼저 pandas를 import해서 데이터 프레임을 만들어준다. import pandas as pd DF = pd.DataFrame({'name' : ['Minsoo','Minju','Yeomin','Hyeri','Junghun','Sunny','Bummee','Luna'], 'old' : [33,25,19,25,32,36,23,36], 'sex' : ['M','W','W','W','M','W','M','W'], 'score1': [91,50,69,98,72,85,43,61], 'score2': [65,77,56,82,79,91,71,63], 'time' : [30,95,64,88,34,69,15,25], })..

[python 파이썬, pandas 판다스] 데이터 특정 조건 추출

DF = pd.DataFrame({'name' : ['Minsoo','Minju','Yeomin','Hyeri','Junghun','Sunny','Bummee','Luna'], 'old' : [33,25,19,25,32,36,23,36], 'sex' : ['M','W','W','W','M','W','M','W'], 'score1': [91,50,69,98,72,85,43,61], 'score2': [65,77,56,82,79,91,71,63], 'time' : [30,95,64,88,34,69,15,25], }) DF 1) 나이가 30대 이상인 조건 추출하기 DF[DF['old']>=30] 2) 여성 중에 score1이 70점 미만인 조건 추출하기 DF[(DF['sex']=='W') & (DF['scor..

[python 파이썬, pandas 판다스] 데이터 변환2 (열 필터링, 열 추가, 열 삭제)

데이터 변환 두 번째 정리에서는 열 필터링, 열 추가, 열 삭제 관련한 내용을 정리하려고 한다. 데이터 복사하기, 행 인덱스 및 칼럼명 확인하고 변경하기 관련 내용은 이전 포스팅인 아래의 링크를 참고하면 된다. [python 파이썬, pandas 판다스] 데이터 변환1 (데이터 복사, 행과 열의 이름 확인하기 및 변경하기) 판다스에서 데이터프레임 형태로 불러온 데이터는 복사도 가능하며 행 인덱스, 열이름을 확인하고 바꾸기도 가능하다. 이번엔 이러한 기능들에 대해 정리하고자 한다. 예시를 들기 위하여 kaggle sunning-10.tistory.com 예시를 위해 간단한 데이터프레임을 생성하였다. DF = pd.DataFrame({'name' : ['Minsoo','Minju','Yeomin','Hyer..

[python 파이썬, pandas 판다스] 데이터 불러오기 및 저장하기

판다스로 csv파일을 불러오는 방법, 판다스로 작업한 데이터프레임을 csv파일로 저장하는 방법에 대해 정리해보자. 1) csv파일 불러오기 : pd.read_csv('파일명.csv') 불러오려는 데이터가 코드 파일과 같은 폴더에 위치해 있다면 다음과 같이 불러올 수 있다. import pandas as pd DF = pd.read_csv('IRIS.csv') csv파일이나 excel파일을 불러올 때 오류가 발생한다면 아래의 링크의 내용을 통해 오류를 해결할 수 있을 것이다. [python 파이썬, pandas 판다스] csv 및 excel 파일 불러오기 (한글 깨지는 경우 해결) 파이썬에서 pandas로 csv나 xlsx 형태의 데이터를 불러올 수 있다. 그 방법은 아래와 같다. (물론 import pa..

[python 파이썬, pandas 판다스] 데이터 변환1 (데이터 복사, 행과 열의 이름 확인하기 및 변경하기)

판다스에서 데이터프레임 형태로 불러온 데이터는 복사도 가능하며 행 인덱스, 열이름을 확인하고 바꾸기도 가능하다. 이번엔 이러한 기능들에 대해 정리하고자 한다. 예시를 들기 위하여 kaggle의 예제 데이터를 사용하였다. 먼저 read_csv로 데이터를 불러온다. import pandas as pd DF = pd.read_csv('IRIS.csv', engine = 'python') DF.head() 1) 데이터프레임 복사하기 : df명.copy() 데이터 사용 시 데이터 DF를 DF1으로 복사하고 싶은 경우가 있다. 이때 주의할 점은 단순하게 DF1 = DF로 설정하면 향후 DF가 변경되면 DF1도 함께 변경된다는 것이다. 예로 DF1 = DF로 설정한 후에 DF의 칼럼명이 species인 열의 값을 다..

[python 파이썬, pandas 판다스] DataFrame 열(column) & 행(row) 불러오기

파이썬의 pandas에서 데이터프레임 형태로 데이터를 불러왔다면 이것을 확인하는 방법을 알아야한다. 데이터는 많은 행과 열로 이루어져 있으며 데이터에 따라 그 개수도 천차만별이다. 이것을 행 기준의 특정 부분, 혹은 열 기준의 특정 부분만 확인하려면 어떻게 해야할까? 예시로 사용할 데이터는 kaggle에서 다운로드받은 IRIS.csv 데이터를 사용하겠다. 먼저 pd.read_csv를 활용하여 데이터를 불러오자. 행(row) 기준 확인/불러오기 맨 앞 & 맨 뒤의 행 확인 : head(), tail() 변수명.head(불러올 행 개수) : 앞에서부터 n개의 행 확인 변수명.tail(불러올 행 개수) : 뒤에서부터 n개의 행 확인 head와 tail 모두 괄호 안이 공백이면 5개의 행만 출력한다. 150개의..

728x90