자연어처리(Natural Language Processing)은 머신러닝과 딥러닝의 교집합 그 어드메라고 부를 수 있는 분야다. 그림으로 표현한다면 아래처럼 볼 수 있겠다.
이러한 NLP의 세부 분야로는 감성분석 또는 감정분석, 의미 분석, 구문분석, 음성인식(질의응답) 등이 있다.
개발 환경은 아나콘다, 필요한 프레임워크는 아나콘다를 설치하면서 기본적으로 딸려오는 Numpy, Pandas, Jupyter notebook, scikit-learn, matplotlib, seaborn, nltk 등 외에 tensorflow, keras, gensim 이 세 가지만 별도로 아나콘다 프롬프트 창에서 pip를 통해 설치해야한다.
- tensorflow 설치
pip install tensorflow
텐서플로우는 구글이 6년 전 2015년에 공개한 머신 러닝 오픈소스 라이브러리이다. 머신 러닝과 딥 러닝을 직관적인 설계로 머신러닝과 딥러닝을 손쉽게 할 수 있게 한다. 주로 tf라는 명칭으로 임포트하는 것이 관례다.
- keras 설치
pip install keras
케라스는 딥러닝 프레임워크인 텐서플로우에 대한 추상화 된 API를 제공한다. 케라스는 백엔드로 텐서플로우를 사용하며, 좀 더 쉽게 딥 러닝을 사용할 수 있게 해준다. 이렇게 설치한 케라스를 사용할 수도 있지만, 텐서플로우에서 케라스API를 사용할 수도 있습니다. 전자를 keras라고 표기한다면, 후자는 tf.keras라고 표기한다. 두 가지는 많은 면에서 문법이 같아서 keras 코드를 tf.keras로 변경하기 쉽고, keras를 학습하였다면 tf.keras도 금방 익숙하게 사용할 수 있다. 케라스 개발자는 keras보다는 tf.keras를 사용할 것을 권장한다.
- gensim 설치
pip install gensim
젠심은 머신 러닝을 사용하여 토픽 모델링과 자연어 처리 등을 수행할 수 있게 해주는 오픈 소스 라이브러리이다.
다음으로 자연어 처리에 필요한 패키지를 설치해야 한다.
- konlpy 설치
pip install konlpy
코엔엘파이는 한국어 자연어 처리를 위한 형태소 분석기 패키지이다.
(이 글이 도움이 됐다면 광고 한번씩만 클릭 해주시면 감사드립니다, 더 좋은 정보글 작성하도록 노력하겠습니다 :) )
'간단 지식 > Deep Learning' 카테고리의 다른 글
04. Linear Regression - How to minimize cost? (0) | 2021.02.28 |
---|---|
03. Activation - identity, softmax (0) | 2020.11.12 |
02. what is Deep Learning? (0) | 2020.10.23 |
01. what is Machine Learning? (0) | 2020.09.18 |