Tagging
-
Make Label about the sentences
-
레이블을 붙이는 과정
- This moive is so nice -> Positive
- This moive is so boring -> Negative
-
Pair of Sentence and Label
-
문장과 레이블에 대해 쌍관계를 유지하는걸 태깅
- It can use other Machine Learning Model’s Input Data
- 이것을 바탕으로 데이터를 input할 수 수 있음
Sentiment Analysis
- 감성분석데이터
- 어떤 문장에 대해서 긍정/부정, 평점등으로 평가하는데 이걸 예측하는 것
- Benchmark Dataset 논문에서 많이 이용됨
- IMDB (Internet Moive DataBase)
- Yelp (음식점평)
- Amazon Review (도서평)
- Crawling
- 네이버 영화 평
- yes24 도서 평
Question Answering
특정한 문단과 질문을 넣었을 때 딥러닝 모델이 답변을 주는 것
- Benchmark Dataset
- SQuAD.(1.1,2.0) 스탠퍼드 QnA
- WikiQA
- CoQA
POS
- Part-of-Speech Tagging
- 문장에서 해당 단어들이 어떤 역할을 하는지
- 주어, 목적어, 서술어 등
- Benchmark Dataset
- Penn Treebank
- UD
Process
빨간색 Input
파란색 Output
초록색 RNN, LSTM, GRU
숫자는 시점
빨간색에 문장을 넣으면
파란색에는 Postive
-
RNN
-
hideen state를 바탕으로 태깅
- 기본 RNN
- Stack RNN
- Hidden state 결과를 새로운 input으로 받음
- Hidden state 결과를 새로운 input으로 받음
- Bidirectional RNN
- forward
- backward
- 같은 시점에는 Concat 진행
- 기본 RNN
-
CNN
-
Convolutional Neural Networks for Sentence Classification(Yoon Kim et al, 2014)
-
문장에 대해서 filter size(2,3,4,5)에 대해 합성곱을 하여 진행
-
스트라이딩을 돌면서 feature maps을 만듬
-
같은 레벨의 feature map에 max pooling을 진행
-
문장특징을 뽑음
-
해당 결과값에 대해 Fully connected layer를 통해 최종 결과를 낸다