Python과 Vectorization

  • 이번에는 Vectorization과 이를 Python으로 구현하는 방법에 대해 알아보겠다.

Vectorization

  • Vectorization은 데이터를 벡터화해서 연산하는 것을 일컫는다.
  • 이것의 장점은 반복문을 통해 연산 했을 때보다 속도가 훨씬 빠르다는 것이다.
  • 특히나 데이터의 값이 많아질수록 속도의 차이는 더욱 심해진다.
  • 아래는 Vectorization을 했을 때와 안 했을 때의 구현 차이다.

python-vectorization

Logistic Regression

  • Logistic Regression 알고리즘을 연산하기 위해서도 Vectorization을 사용할 수 있다.
  • 다음과 같이 데이터를 Vectorization 해서 연산할 수 있다.

python-vectorization

  • 이를 Python 코드로 구현해보면 다음과 같다.
  • np는 numpy를 일컫고, dot 함수는 내적을 일컫는다.

python-vectorization

관련 글