1 |
1
혐오 표현 댓글 필터링 장치로서,혐오 표현 단어들을 저장하는 혐오 표현 사전,단어 임베딩 모델을 이용하여, 수집한 댓글들에 포함된 혐오 표현 후보 단어들과 상기 혐오 표현 단어들 각각의 임베딩 벡터들을 생성하고, 벡터 간 유사도 판단 알고리즘을 이용하여 상기 혐오 표현 후보 단어들 중에서 상기 혐오 표현 사전에 저장된 단어들과 유사한 유사 단어들을 추출하고, 상기 유사 단어들 중 결정된 신규 혐오 표현 단어를 상기 혐오 표현 사전에 저장하는 사전 구축 장치,상기 혐오 표현 사전을 기초로 혐오 표현 댓글과 비혐오 표현 댓글로 라벨링된 분류 학습용 댓글들을 이용하여, 혐오 표현 분류 모델이 입력 댓글을 혐오 표현 댓글 또는 비혐오 표현 댓글을 구별하도록 학습시키는 학습 장치, 그리고판별 대상 댓글을 상기 혐오 표현 분류 모델로 입력하고, 상기 혐오 표현 분류 모델로부터 상기 판별 대상 댓글이 혐오 표현 댓글로 판별된 경우, 상기 판별 대상 댓글을 미리 설정된 텍스트로 치환되도록 설정하는 필터링기를 포함하는 혐오 표현 댓글 필터링 장치
|
2 |
2
제1항에서,상기 사전 구축 장치는상기 혐오 표현 사전에 저장된 단어들을 포함하는 댓글들을 혐오 표현 댓글들로 분류하고, 각 혐오 표현 댓글을 구성하는 형태소들을 상기 단어 임베딩 모델로 임베딩하여 각 혐오 표현 후보 단어의 임베딩 벡터를 생성하는, 혐오 표현 댓글 필터링 장치
|
3 |
3
제2항에서,상기 사전 구축 장치는상기 유사 단어들 중 상기 혐오 표현 댓글들에 일정 빈도 이상 등장하는 유사 단어를 상기 신규 혐오 표현 단어로 결정하는, 혐오 표현 댓글 필터링 장치
|
4 |
4
제1항에서,상기 사전 구축 장치는상기 혐오 표현 사전에 저장된 각 혐오 표현 단어의 임베딩 벡터와 각 혐오 표현 후보 단어의 임베딩 벡터가 형성하는 코사인 각도를 유사도로 계산하고, 두 벡터 간의 유사도를 기초로 상기 혐오 표현 후보 단어들 중에서 상기 혐오 표현 사전에 저장된 단어들과 유사한 유사 단어들을 추출하는, 혐오 표현 댓글 필터링 장치
|
5 |
5
제1항에서,상기 학습 장치는분류 학습용 댓글들을 입력받고, 상기 혐오 표현 사전에 포함된 적어도 하나의 단어를 포함하는 댓글을 혐오 표현으로 라벨링하고, 상기 혐오 표현 단어들을 포함하지 않은 댓글을 비혐오 표현으로 라벨링하는, 혐오 표현 댓글 필터링 장치
|
6 |
6
제1항에서,상기 혐오 표현 사전은혐오 표현 단어로 정의된 비속어들을 포함하고, 상기 비속어들로부터 확장된신규 혐오 표현 단어들이 업데이트되는, 혐오 표현 댓글 필터링 장치
|
7 |
7
혐오 표현 댓글 필터링 장치의 동작 방법으로서,혐오 표현 사전에 저장된 적어도 하나의 혐오 표현 단어를 포함하는 혐오 표현 댓글들을 입력받는 단계,단어 임베딩 모델을 이용하여, 상기 혐오 표현 댓글들에 포함된 혐오 표현 후보 단어들과 상기 혐오 표현 사전에 저장된 혐오 표현 단어들 각각의 임베딩 벡터들을 생성하는 단계,벡터 간 유사도 판단 알고리즘을 이용하여 상기 혐오 표현 후보 단어들 중에서 상기 혐오 표현 사전에 저장된 단어들과 유사한 유사 단어들을 추출하는 단계, 그리고상기 유사 단어들 중 결정된 신규 혐오 표현 단어를 상기 혐오 표현 사전에 저장하는 단계를 포함하는 동작 방법
|
8 |
8
제7항에서,분류 학습용 댓글들을 입력받고, 상기 혐오 표현 사전에 포함된 적어도 하나의 단어를 포함하는 댓글을 혐오 표현으로 라벨링하고, 상기 혐오 표현 단어들을 포함하지 않은 댓글을 비혐오 표현으로 라벨링하는 단계, 그리고혐오 표현 댓글과 비혐오 표현 댓글로 라벨링된 학습 데이터를 기초로, 혐오 표현 분류 모델이 입력된 텍스트를 혐오 표현 댓글 또는 비혐오 표현 댓글을 구별하도록 학습시키는 단계를 더 포함하는 동작 방법
|
9 |
9
제8항에서,판별 대상 댓글을 상기 혐오 표현 분류 모델로 입력하는 단계, 그리고상기 혐오 표현 분류 모델로부터 상기 판별 대상 댓글이 혐오 표현 댓글로 판별된 경우, 상기 판별 대상 댓글을 미리 설정된 텍스트로 치환되도록 설정하는 단계를 더 포함하는 동작 방법
|
10 |
10
제7항에서,상기 임베딩 벡터들을 생성하는 단계는각 혐오 표현 댓글을 구성하는 형태소들을 상기 단어 임베딩 모델로 임베딩하여 각 혐오 표현 후보 단어의 임베딩 벡터를 생성하는, 동작 방법
|
11 |
11
제7항에서,상기 유사 단어들을 추출하는 단계는상기 혐오 표현 사전에 저장된 각 혐오 표현 단어의 임베딩 벡터와 각 혐오 표현 후보 단어의 임베딩 벡터가 형성하는 코사인 각도를 유사도로 계산하고, 두 벡터 간의 유사도를 기초로 상기 혐오 표현 후보 단어들 중에서 상기 혐오 표현 사전에 저장된 단어들과 유사한 유사 단어들을 추출하는, 동작 방법
|
12 |
12
제7항에서,상기 혐오 표현 사전에 저장하는 단계는상기 유사 단어들 중 상기 혐오 표현 댓글들에 일정 빈도 이상 등장하는 유사 단어를 상기 신규 혐오 표현 단어로 결정하는, 동작 방법
|