1 |
1
한국어 개체명 인식방법에 있어서, 한국어 로 텍스트를 입력받아 음절 바이그램들로 분할하고, 한국어 로 텍스트에 대한 음절 바이그램들 중 어절 어두에 위치하는 음절 바이그램에 대해 표식을 부가한 후에, 상기 한국어 로 텍스트에 대한 음절 바이그램들에 대응되는 임베딩을 생성하고, 상기 한국어 로 텍스트에 대한 음절 바이그램들 각각과 그에 대응되는 임베딩을 데이터베이스의 룩업테이블에 기록하는 제1단계; 및 질의문장이 입력되면, 질의문장을 음절 바이그램들로 분할하고, 상기 질의 문장에 대한 음절 바이그램들 중 어절 어두에 위치하는 음절 바이그램에 대해 표식을 부가한 후에, 상기 질의 문장에 대한 음절 바이그램들에 대응되는 임베딩을 상기 룩업테이블로부터 독출하여 개체명 인식을 이행하는 제2단계;를 포함하는 것을 특징으로 하는 한국어 개체명 인식방법
|
2 |
2
제1항에 있어서, 상기 제1단계가, 한국어 로 텍스트를 입력받아 음절 바이그램들로 분할하는 단계;상기 음절 바이그램들 중 어절 어두에 위치하는 음절 바이그램을 검출하여 표식한 후에, 음절 바이그램들을 인공신경망 기반 비지도 학습하여 음절 바이그램의 의미를 나타내는 고차원 벡터 표현인 임베딩을 생성하는 단계; 및 상기 음절 바이그램들 각각과 그에 대응되는 임베딩을 대응시켜 룩업테이블에 기록하는 단계;를 포함하는 것을 특징으로 하는 한국어 개체명 인식방법
|
3 |
3
제1항에 있어서, 상기 제2단계에서, 상기 개체명 인식은 기계학습기반의 딥러닝 알고리즘으로 수행됨을 특징으로 하는 한국어 개체명 인식방법
|
4 |
4
한국어 개체명 인식장치에 있어서, 한국어 로 텍스트를 입력받아 분할한 음절 바이그램들 중 어절 어두에 위치함이 표식된 음절 바이그램들과 나머지 음절 바이그램들에 대해, 상기 음절 바이그램들 각각과 그에 대응되는 임베딩을 대응시켜 기록한 룩업 테이블을 구비하는 데이터베이스;질의문장이 입력되면, 질의문장을 음절 바이그램들로 분할하여 출력하는 음절 바이그램 분할부;상기 질의문장에 대한 음절 바이그램들 중 어절 어두에 위치하는 음절 바이그램을 검출하여 표식을 부가하는 어절 어두 음절 바이그램 판별 및 표식부;상기 어절 어두 음절 바이그램 판별 및 표식부가 출력하는 음절 바이그램들에 대응되는 임베딩을 상기 룩업테이블로부터 독출하여 개체명 인식을 이행하는 개체명 인식부;를 포함하는 것을 특징으로 하는 한국어 개체명 인식장치
|
5 |
5
제4항에 있어서, 한국어 로 텍스트를 입력받아 음절 바이그램들로 분할하는 음절 바이그램 분할부;상기 음절 바이그램들 중 어절 어두에 위치하는 음절 바이그램을 검출하여 표식하는 어절 어두 음절 바이그램 판별 및 표식부; 및 상기 음절 바이그램들을 인공신경망 기반 비지도 학습하여 음절 바이그램의 의미를 나타내는 고차원 벡터 표현인 임베딩을 생성하여 상기 음절 바이그램들과 그에 대응되는 임베딩을 대응시켜 상기 룩업 테이블에 기록하는 음절 바이그램 임베딩 학습부;를 더 포함하는 것을 특징으로 하는 한국어 개체명 인식장치
|
6 |
6
제4항에 있어서, 상기 개체명 인식부는, 기계학습기반의 딥러닝 알고리즘에 따라 개체명을 인식함을 특징으로 하는 한국어 개체명 인식장치
|