elastic search에 한글 형태소 분석기 플러그인 설치하는 방법입니다.
저는 docker로 elastic search 실행 중이기 때문에 elastic search 컨테이너에 접속하겠습니다.
bin/elasticsearch-plugin install analysis-nori
컨테이너에 접속하고 난 뒤 한글 형태소 분석기 플러그인을 설치합니다.
플러그인을 설치하기 위해서 "/usr/share/elasticsearch/bin" 디렉토리 밑에 있는 elasticsearch-plugin을 호출합니다.
현재 위치가 "/usr/share/elasticsearch/"이기 때문에 "bin/elasticsearch-plugin install analysis-nori" 명령어를 통해서 한글 형태소 분석기를 설치합니다.
설치가 완료되면 위와 같은 화면이 표출됩니다.
플러그인 설치가 끝났으면 이제 elastic search 인덱스에 한글 형태소 분석기를 추가합니다.
인덱스에 바로 추가하면 에러가 나는 경우가 있기 때문에 elastic search를 재시작하고 추가합니다.
인덱스에 한글 형태소 분석기를 추가하면 위와 같이 200 메시지가 표출됩니다.
형태소 분석이 제대로 되는지 확인하기 위해 테스트 해봅니다.
예제로 "홍길동은 서울에 살고 있습니다."라는 문장으로 테스트를 했는데 위의 화면처럼 정상적으로 되는 것을 확인했습니다.
아래는 위에서 실행한 elastic search 인덱스에 한글 형태소 분석기를 추가하는 쿼리입니다.
============================================================================================
PUT korean_analyzer
{
"settings": {
"analysis": {
"tokenizer": {
"korean_nori_tokenizer":{
"type":"nori_tokenizer",
"decompound_mode":"mixed"
}
},
"analyzer": {
"nori_analyzer":{
"type":"custom",
"tokenizer":"korean_nori_tokenizer",
"filter":["nori_posfilter"]
}
},
"filter": {
"nori_posfilter":{
"type":"nori_part_of_speech",
"stoptags":[
"E","IC","J","MAG","MM","NA","NR","SC","SE","SF","SH","SL","SN","SP","SSC","SSO","SY","UNA","UNKNOWN","VA","VCN","VCP","VSV","VV","VX","XPN","XR","XSA","XSN","XSV"
]
}
}
}
}
}
============================================================================================
'dev > ELK' 카테고리의 다른 글
Kibana Index Pattern (0) | 2023.05.26 |
---|---|
Docker ElasticSearch Cluster 구성 (0) | 2023.05.26 |
Elastic Search 파일 첨부 (0) | 2021.10.22 |
ELK 연동 (0) | 2021.01.31 |
ELK install - Kibana (0) | 2021.01.24 |