본문 바로가기

인공지능 AI

(2)
[머신러닝] 판다스(pandas) 패키지 1. 판다스(pandas)란? ▶ 판다스는 파이썬에서 데이터 처리를 위한 라이브러리로 열과 행으로 되어있는 데이터를 효율적으로 가공할 수 있는 기능을 제공한다. 판다스는 넘파이를 기반으로 만들어졌지만 넘파이보다 훨씬 유연하게 데이터 핸들링이 가능하다는 점에서 인기있는 라이브러리이다. 2. 파일을 Data Frame으로 로딩하기 ▶ 공공데이터포털, 오픈 API 등을 통해서 다양한 데이터를 구할 수가 있다. 이번 장에서는 캐글에 있는 타이타닉 탑승자 데이터 파일로 판다스를 활용해볼 것이다. ▶ 다음 링크로 들어가서 train.csv 파일을 다운받는다. https://www.kaggle.com/c/titanic/data?select=train.csv Titanic - Machine Learning from D..
[머신러닝] 넘파이(Numpy) 패키지 1. 넘파이(Numpy)란? ▶ 넘파이(Numpy)란 Numerical Python으로 파이썬에서 대규모의 다차원 배열을 다룰 때 쓰는 라이브러리이다. 머신러닝의 이론적 배경은 선형대수와 통계로 이루어져 있다. ▶파이썬에서 행렬과 선형대수를 다룰 때 대표적으로 쓰는 패키지가 넘파이이다. 반복문 없이 배열을 처리하기 때문에 대량의 배열 데이터 연산이 훨씬 더 빠르고 메모리를 효율적으로 사용한다. ▶넘파이는 c, c++기반의 타 프로그램과 데이터를 주고 받고, API를 호출해 쉽게 다루는 기능을 제공해 파이썬이 가지는 성능의 제약을 보완할 수도 있다. ▶ 많은 머신러닝 알고리즘이 넘파이 기반으로 되어 있기 때문에 넘파이를 이해하는 것은 파이썬 기반의 머신러닝을 이해하는 데 중요하다. 2. 모듈 사용하기 im..