1 |
1
서버가 감정어의 극성을 분류하는 방법에 있어서,(a) 전처리가 수행된 상품평 데이터로부터 상품의 속성을 나타내는 특징 명사를 선정하고, 복수의 품사 패턴에 기반하여 상기 특징 명사를 수식하는 감정어를 추출하는 단계;(b) 상기 특징 명사별로 상기 감정어의 출현 빈도에 기반하여 시드(seed) 감정어 집합을 생성하는 단계; 및(c) 상기 시드 감정어 집합과 신규 감정어의 PMI(Point-wise Mutual Information) 값을 이용하여 상기 신규 감정어의 극성을 분류하는 단계를 포함하되,상기 (b) 단계는,상기 시드 감정어를 상기 특징 명사별로 긍정 극성과 부정 극성으로 분류하여 상기 시드 감정어 집합을 생성하는 것을 특징으로 하는 극성 분류 방법
|
2 |
2
제 1 항에 있어서,상기 (a) 단계는,상기 상품평 데이터 내 보조사와 주격 조사를 이용하여 특징 명사 후보 집합을 생성하고, 상기 특징 명사 후보 집합 중 DF(Document Frequency) 방법을 이용하여 미리 정해진 상위 l개의 명사를 상기 특징 명사로 선정하는 것을 특징으로 하는 극성 분류 방법
|
3 |
3
제 2 항에 있어서,상기 (a) 단계는,명사1+명사2+조사+동사 패턴을 가지는 제 1 품사 패턴,명사+형용사+연결어미 패턴을 가지는 제 2 품사 패턴,명사+형용사+종결어미 패턴을 가지는 제 3 품사 패턴,명사+동사+연결어미 패턴을 가지는 제 4 품사 패턴,명사+동사+종결어미 패턴을 가지는 제 5 품사 패턴,명사+어근+접미사 패턴을 가지는 제 6 품사 패턴 및명사+형용사+전성어미 패턴을 가지는 제 7 품사 패턴 중 하나 이상을 포함하는 상기 품사 패턴에 기반하여 상기 감정어를 추출하는 것을 특징으로 하는 극성 분류 방법
|
4 |
4
제 1 항에 있어서,상기 (a) 단계 이전에상기 상품평 데이터에 대하여 구어체 보정, 문장 분리, 불용어 제거 및 형태소 분석 중 하나 이상을 수행하는 전처리 단계를 더 포함하되,상기 문장 분리는 한 문장 내에 두 개 이상의 특징 명사와 감정어가 출현하는 경우, 연결어미를 기준으로 두 문장으로 분리하는 것을 특징으로 하는 극성 분류 방법
|
5 |
5
제 1 항에 있어서,상기 (a) 단계는,명사 형태의 감정어가 문서 집합 내 특정 속성에 대하여 1회만 출현한 경우 상기 감정어 추출에서 제외시키며, 미리 정해진 회수인 n회 이상 출현한 경우 상기 감정어로 추출하는 것을 특징으로 하는 극성 분류 방법
|
6 |
6
제 3 항에 있어서,상기 (b) 단계는,상기 품사 패턴에 기반하여 추출된 특징 명사별 감정어의 출현 빈도가 상위 k개인 것을 상기 시드 감정어 집합으로 생성하는 것을 특징으로 하는 극성 분류 방법
|
7 |
7
제 6 항에 있어서,상기 (c) 단계는,상기 시드 감정어 집합을 이용하여,상기 특징 명사와 신규 감정어가 동시에 출현할 확률 및 상기 특징 명사와 시드 감정어가 동시에 출현할 확률을 분모로 하고,상기 특징 명사, 신규 감정어 및 시드 감정어가 동시에 출현할 확률을 분자로 하는 상기 PMI 값을 계산하되,상기 특징 명사에 대하여 극성이 긍정인 상기 k개의 시드 감정어와 상기 신규 감정어의 PMI 값들의 합에서 상기 특징 명사에 대하여 극성이 부정인 상기 k개의 시드 감정어와 신규 감정어의 PMI 값들의 합을 차감하며, 상기 차감된 결과 값이 양수이면 상기 신규 감정어의 극성을 긍정으로, 상기 차감된 결과 값이 음수이면 상기 신규 감정어의 극성을 부정으로 분류하는 것을 특징으로 하는 극성 분류 방법
|
8 |
8
청구항 8은(는) 설정등록료 납부시 포기되었습니다
|
9 |
9
청구항 9은(는) 설정등록료 납부시 포기되었습니다
|
10 |
10
청구항 10은(는) 설정등록료 납부시 포기되었습니다
|
11 |
11
감정어의 극성을 분류하는 서버에 있어서,수집된 상품평 데이터에 대한 전처리를 수행하는 전처리부;전처리가 수행된 상품평 데이터로부터 상품의 속성을 나타내는 특징 명사를 선정하고, 복수의 품사 패턴에 기반하여 상기 특징 명사를 수식하는 감정어를 추출하는 감정어 추출부; 및상기 특징 명사별로 상기 감정어의 출현 빈도에 기반하여 시드(seed) 감정어 집합을 생성하고, 상기 시드 감정어 집합과 신규 감정어의 PMI(Point-wise Mutual Information) 값을 이용하여 상기 신규 감정어의 극성을 분류하는 극성 분류부를 포함하되,상기 감정어 추출부는,상기 시드 감정어를 상기 특징 명사별로 긍정 극성과 부정 극성으로 분류하여 상기 시드 감정어 집합을 생성하는 것을 특징으로 하는 서버
|
12 |
12
제 11 항에 있어서,상기 감정어 추출부는,명사1+명사2+조사+동사 패턴을 가지는 제 1 품사 패턴,명사+형용사+연결어미 패턴을 가지는 제 2 품사 패턴,명사+형용사+종결어미 패턴을 가지는 제 3 품사 패턴,명사+동사+연결어미 패턴을 가지는 제 4 품사 패턴,명사+동사+종결어미 패턴을 가지는 제 5 품사 패턴,명사+어근+접미사 패턴을 가지는 제 6 품사 패턴 및명사+형용사+전성어미 패턴을 가지는 제 7 품사 패턴 중 하나 이상을 포함하는 상기 품사 패턴에 기반하여 상기 감정어를 추출하는 것을 특징으로 하는 서버
|
13 |
13
제 11 항에 있어서,상기 극성 분류부는,상기 시드 감정어 집합을 이용하여,상기 특징 명사와 신규 감정어가 동시에 출현할 확률 및 상기 특징 명사와 시드 감정어가 동시에 출현할 확률을 분모로 하고,상기 특징 명사, 신규 감정어 및 시드 감정어가 동시에 출현할 확률을 분자로 하는 상기 PMI 값을 계산하되,상기 특징 명사에 대하여 극성이 긍정인 k개의 시드 감정어와 상기 신규 감정어의 PMI 값들의 합에서 상기 특징 명사에 대하여 극성이 부정인 k개의 시드 감정어와 신규 감정어의 PMI 값들의 합을 차감하며, 상기 차감된 결과 값이 양수이면 상기 신규 감정어의 극성을 긍정으로, 상기 차감된 결과 값이 음수이면 상기 신규 감정어의 극성을 부정으로 분류하는 것을 특징으로 하는 서버
|