주피터 노트북(2)
-
라이브러리를 활용하여 데이터 정리하기
데이터를 활용하려면, 데이터들이 필요한데 사용하기에 좋을 사이트 3가지를 먼저 소개하려고 한다. 1. https://www.kaggle.com/ --> 해외 사이트로 자료들이 많으나 조금 어려울 수 있다. 2. https://archive.ics.uci.edu/ml/index.php --> 해외 사이트이며, 자료들이 kaggle에 비해 직관적이나 자료 종류가 kaggle보다 적다. 3. https://www.data.go.kr/ --> 한국 사이트로 한국에서 관리하는 공공 데이터들이 존재한다. 데이터 활용 pandas 라이브러리를 활용하려면 .read_csv함수를 활용해야 한다. 이때 csv는 확장자 명으로, 데이터를 저장할 때 확장자를 csv로 하는 게 널리 쓰이는 방식이다. 데이터를 활용하는 순서는 ..
2021.06.29 -
주피터 노트북 라이브러리(기본)
주피터 노트북으로 파이썬을 코딩할 때 쓸 수 있는 기본적인 라이브러리가 존재한다. 라이브러리 이름 내용 pandas 데이터 프래임과 관련하여 데이터 가공을 도와주는 라이브러리 numpy 행렬, 다차원 배열을 처리하는 라이브러리 sklearn 데이터 전처리, 모델평가, 분류 알고리즘 등을 제공하는 라이브러리 matplotlib 시각화(그래프)를 지원하는 라이브러리 seaborn 시각화 라이브러리, 다양한 색상 태마와 차트 제공 위의 5가지 라이브러리가 주피터 노트북에서 데이터를 처리할 때 사용하는 대표적인 라이브러리이다. 경로 설정 라이브러리의 활용을 살펴보기전에 경로를 설정해보자, 먼저 현재 저장되고 있는 경로를 보자, 경로를 살펴보는 방법은 os.getcwd() 함수를 활용하는 것이다. #주석, 위치 ..
2021.06.29