간단 지식/Deep Learning

05. 자연어 처리(NLP)에 필요한 라이브러리 및 패키지 설치

납작한돌맹이 2021. 8. 30. 18:29
반응형

자연어처리(Natural Language Processing)은 머신러닝과 딥러닝의 교집합 그 어드메라고 부를 수 있는 분야다. 그림으로 표현한다면 아래처럼 볼 수 있겠다.

구글 이미지

이러한 NLP의 세부 분야로는 감성분석 또는 감정분석, 의미 분석, 구문분석, 음성인식(질의응답) 등이 있다.

 

개발 환경은 아나콘다, 필요한 프레임워크는 아나콘다를 설치하면서 기본적으로 딸려오는 Numpy, Pandas, Jupyter notebook, scikit-learn, matplotlib, seaborn, nltk 등 외에 tensorflow, keras, gensim 이 세 가지만 별도로 아나콘다 프롬프트 창에서 pip를 통해 설치해야한다.

- tensorflow 설치

 pip install tensorflow

 

설치가 잘 됐는지 확인하는 방법

텐서플로우는 구글이 6년 전 2015년에 공개한 머신 러닝 오픈소스 라이브러리이다. 머신 러닝과 딥 러닝을 직관적인 설계로 머신러닝과 딥러닝을 손쉽게 할 수 있게 한다. 주로 tf라는 명칭으로 임포트하는 것이 관례다.

 

- keras 설치

pip install keras

설치가 잘 됐는지 확인하는 방법

케라스는 딥러닝 프레임워크인 텐서플로우에 대한 추상화 된 API를 제공한다. 케라스는 백엔드로 텐서플로우를 사용하며, 좀 더 쉽게 딥 러닝을 사용할 수 있게 해준다. 이렇게 설치한 케라스를 사용할 수도 있지만, 텐서플로우에서 케라스API를 사용할 수도 있습니다. 전자를 keras라고 표기한다면, 후자는 tf.keras라고 표기한다. 두 가지는 많은 면에서 문법이 같아서 keras 코드를 tf.keras로 변경하기 쉽고, keras를 학습하였다면 tf.keras도 금방 익숙하게 사용할 수 있다. 케라스 개발자는 keras보다는 tf.keras를 사용할 것을 권장한다.

- gensim 설치

 pip install gensim

설치가 잘 됐는지 확인하는 방법

젠심은 머신 러닝을 사용하여 토픽 모델링과 자연어 처리 등을 수행할 수 있게 해주는 오픈 소스 라이브러리이다.


다음으로 자연어 처리에 필요한 패키지를 설치해야 한다.

- konlpy 설치

pip install konlpy

설치가 잘 됐는지 확인하는 방법

코엔엘파이는 한국어 자연어 처리를 위한 형태소 분석기 패키지이다.

 

 

(이 글이 도움이 됐다면 광고 한번씩만 클릭 해주시면 감사드립니다, 더 좋은 정보글 작성하도록 노력하겠습니다 :) )

반응형

'간단 지식 > Deep Learning' 카테고리의 다른 글

04. Linear Regression - How to minimize cost?  (0) 2021.02.28
03. Activation - identity, softmax  (0) 2020.11.12
02. what is Deep Learning?  (0) 2020.10.23
01. what is Machine Learning?  (0) 2020.09.18