[MachineLearning] 넘파이와 판다스
less than 1 minute read
파이썬 머신러닝 완벽가이드
1장. 넘파이와 판다스
- 머신러닝 개요
- 지도학습: 회귀, 분류
- 비지도 학습: 군집화
- 강화 학습
- 넘파이
- 선형 대수, 통계 등을 사용할 때 사용하는 라이브러리로, 처리할 데이터의 수가 많아질 수록 파이썬, C++ 보다도 좋은 빠른 성능을 보임
- ndarray: 기본적인 데이터 타입
- arange: ndarray 인스턴스 생성
- zeros, ones: 형상과 데이터 타입을 전달
- reshape: 형상을 재조정
- slicing: ndarray 일부를 인덱스로 가져옴
- np.sort(ndarray), ndarray.sort(): 정렬을 수행하는데, 정렬된 리스트를 리턴하는지 내부에서 정렬하여 None을 리턴하는지의 차이
- dot, transpose: 내적과 전치
- 판다스
- dataframe: 기본적인 데이터 타입
- read_csv: csv 파일을 읽어와 dataframe 인스턴스로 생성
- info, describe, head, tail: 데이터 프레임의 기본적인 정보들, 수치들 등을 보여줌
- pd.DataFrame(ndarray, columns): ndarray를 dataframe으로 변환
-
dataframe[열이름 |
[열이름1, 열이름2], …]: 원하는 컬럼을 가져옴 (데이터 셀렉션) |
- sort_values(by=[열이름]): 데이터 프레임 정렬, 기준 전달
- 데이터프레임[컬럼명].apply(lambda 식): 데이터프레임에 람다식 적용
Leave a comment