1 |
1
입력 구문을 어절로 분리하는 전처리부;상기 입력 구문의 상기 어절 내의 음절을 초성, 중성 및 종성으로 분리하는 초성, 중성, 종성 분리부;상기 입력 구문의 상기 음절의 초성을 비속어 샘플의 음절의 초성과 비교하여 초성 거리를 계산하는 초성 거리 계산부;상기 입력 구문의 상기 음절의 중성을 상기 비속어 샘플의 상기 음절의 중성과 비교하여 중성 거리를 계산하는 중성 거리 계산부;상기 입력 구문의 상기 음절의 종성을 상기 비속어 샘플의 상기 음절의 종성과 비교하여 종성 거리를 계산하는 종성 거리 계산부; 및상기 초성 거리, 상기 중성 거리 및 상기 종성 거리의 평균 거리를 쓰레스홀드와 비교하여 상기 입력 구문이 비속어를 포함하는지 판단하는 비속어 판단부를 포함하는 비속어 검출 시스템
|
2 |
2
제1항에 있어서, 상기 전처리부는 상기 입력 구문의 상기 어절에서 영문자, 숫자 및 특수문자를 제거하는 것을 특징으로 하는 비속어 검출 시스템
|
3 |
3
제1항에 있어서, 상기 입력 구문의 상기 어절의 음절수가 상기 비속어 샘플의 음절수보다 클 때, 상기 입력 구문의 상기 어절을 상기 비속어 샘플의 음절수에 일치하도록 분리하는 n-gram 설정부를 더 포함하는 것을 특징으로 하는 비속어 검출 시스템
|
4 |
4
제1항에 있어서, 상기 초성 거리 계산부는 한글의 초성들 간의 유사도에 대한 정보를 포함하는 초성 유사도 행렬을 이용하여 상기 초성 거리를 계산하고, 상기 초성 유사도 행렬은 상기 초성들 간의 유사도에 따라 적어도 3개 이상의 값을 갖는 것을 특징으로 하는 비속어 검출 시스템
|
5 |
5
제4항에 있어서, 상기 입력 구문의 상기 음절의 상기 초성과 상기 비속어 샘플의 상기 음절의 상기 초성이 일치하면 상기 초성 유사도 행렬은 0의 값을 갖고, 상기 입력 구문의 상기 음절의 상기 초성과 상기 비속어 샘플의 상기 음절의 상기 초성이 불일치하면, 상기 초성 유사도 행렬은 상기 초성들 간의 유사도에 따라 0보다 크거나 같고 1보다 작거나 같은 값을 가지며, 상기 초성들 간의 유사도가 낮을수록 상기 초성 유사도 행렬은 1에 가까운 값을 갖는 것을 특징으로 하는 비속어 검출 시스템
|
6 |
6
제4항에 있어서, 상기 중성 거리 계산부는 한글의 중성들 간의 유사도에 대한 정보를 포함하는 중성 유사도 행렬을 이용하여 상기 중성 거리를 계산하고, 상기 중성 유사도 행렬은 상기 중성들 간의 유사도에 따라 적어도 3개 이상의 값을 갖는 것을 특징으로 하는 비속어 검출 시스템
|
7 |
7
제6항에 있어서, 상기 입력 구문의 상기 음절의 상기 중성과 상기 비속어 샘플의 상기 음절의 상기 중성이 일치하면 상기 중성 유사도 행렬은 0의 값을 갖고, 상기 입력 구문의 상기 음절의 상기 중성과 상기 비속어 샘플의 상기 음절의 상기 중성이 불일치하면, 상기 중성 유사도 행렬은 상기 중성들 간의 유사도에 따라 0보다 크거나 같고 1보다 작거나 같은 값을 가지며, 상기 중성들 간의 유사도가 낮을수록 상기 중성 유사도 행렬은 1에 가까운 값을 갖는 것을 특징으로 하는 비속어 검출 시스템
|
8 |
8
제6항에 있어서, 상기 종성 거리 계산부는 한글의 종성들 간의 유사도에 대한 정보를 포함하는 종성 유사도 행렬을 이용하여 상기 종성 거리를 계산하고, 상기 종성 유사도 행렬은 상기 종성들 간의 유사도에 따라 적어도 3개 이상의 값을 갖는 것을 특징으로 하는 비속어 검출 시스템
|
9 |
9
제8항에 있어서, 상기 입력 구문의 상기 음절의 상기 종성과 상기 비속어 샘플의 상기 음절의 상기 종성이 일치하면 상기 종성 유사도 행렬은 0의 값을 갖고, 상기 입력 구문의 상기 음절의 상기 종성과 상기 비속어 샘플의 상기 음절의 상기 종성이 불일치하면, 상기 종성 유사도 행렬은 상기 종성들 간의 유사도에 따라 0보다 크거나 같고 1보다 작거나 같은 값을 가지며, 상기 종성들 간의 유사도가 낮을수록 상기 종성 유사도 행렬은 1에 가까운 값을 갖는 것을 특징으로 하는 비속어 검출 시스템
|
10 |
10
제1항에 있어서, 상기 쓰레스홀드를 설정하는 쓰레스홀드 설정부를 더 포함하고, 상기 쓰레스홀드 설정부는 상기 비속어를 포함하는 클래스가 클래스 0이고 상기 비속어를 포함하지 않는 클래스가 클래스 1이라고 할 때, 상기 클래스 1의 재현율(recall)을 최대로 만드는 값을 상기 쓰레스홀드로 설정하는 것을 특징으로 하는 비속어 검출 시스템
|
11 |
11
제1항에 있어서, 상기 비속어 판단부는 상기 입력 구문이 상기 비속어를 포함할 때, 상기 입력 구문이 복수의 비속어 샘플들 중에서 어떤 비속어 샘플에 해당하는지 판단하기 위해 K-NN(K-Nearest Neighbors) 방식을 이용하고, K=1인 것을 특징으로 하는 비속어 검출 시스템
|
12 |
12
입력 구문을 어절로 분리하는 단계;상기 입력 구문의 상기 어절 내의 음절을 초성, 중성 및 종성으로 분리하는 단계;상기 입력 구문의 상기 음절의 초성을 비속어 샘플의 음절의 초성과 비교하여 초성 거리를 계산하는 단계;상기 입력 구문의 상기 음절의 중성을 상기 비속어 샘플의 상기 음절의 중성과 비교하여 중성 거리를 계산하는 단계;상기 입력 구문의 상기 음절의 종성을 상기 비속어 샘플의 상기 음절의 종성과 비교하여 종성 거리를 계산하는 단계; 및상기 초성 거리, 상기 중성 거리 및 상기 종성 거리의 평균 거리를 쓰레스홀드와 비교하여 상기 입력 구문이 비속어를 포함하는지 판단하는 단계를 포함하는 비속어 검출 방법
|
13 |
13
제12항에 있어서, 상기 입력 구문의 상기 어절의 음절수가 상기 비속어 샘플의 음절수보다 클 때, 상기 입력 구문의 상기 어절을 상기 비속어 샘플의 음절수에 일치하도록 분리하는 단계를 더 포함하는 것을 특징으로 하는 비속어 검출 방법
|