1 |
1
용어 인식 장치가 용어를 인식하는 방법에 있어서, (a) 입력문서의 각 문장을 분석하여 품사정보, 단어 원형 정보를 획득하고, 상기 획득된 품사정보 및 단어원형정보와 기 저장된 용어후보패턴을 이용하여 용어 후보들을 추출하는 단계;(b) 상기 추출된 용어 후보들에 대한 기본자질과 웹 검색 결과에 의한 웹 자질을 획득하는 단계;(c) 상기 용어 후보들의 기본자질과 웹 자질을 기계 학습에 적용하여 가중치를 할당하는 단계; 및(d) 상기 용어 후보들중에서 가중치가 할당된 값이 가장 높은 용어 후보를 용어로 인식하는 단계;를 포함하는 웹 검색 기반 용어 인식 방법
|
2 |
2
삭제
|
3 |
3
제1항에 있어서, 상기 (b) 단계는, 상기 추출된 용어 후보들에 대한 문형특징 및 사전정보를 포함하는 기본자질을 추출하는 단계; 및상기 용어 후보들에 대한 웹 검색 결과를 획득하고, 상기 웹 검색 결과에 따른 웹 빈도수를 정규화하여 웹 자질로 추출하는 단계를 포함하는 것을 특징으로 하는 웹 검색 기반 용어 인식 방법
|
4 |
4
제3항에 있어서, 상기 용어 후보들에 대한 웹 검색 결과를 획득하고, 상기 웹 검색 결과에 따른 웹 빈도수를 정규화하여 웹 자질로 추출하는 단계에서, 상기 용어후보가 두개 이상의 단어로 구성된 경우, 중심어를 선정하는 단계;상기 중심어를 기준으로 하위 용어 후보들을 추출하는 단계;상기 추출된 하위 용어 후보들에 대한 웹 검색을 수행하여 웹 검색 결과를 획득하는 단계; 및상기 웹 검색 결과에 따른 웹 빈도수를 구글정규거리, 상호정보, 로그우도비, 다이스 상관계수 중 적어도 하나에 의해 정규화하여 웹 자질로 추출하는 단계를 포함하는 것을 특징으로 하는 웹 검색 기반 용어 인식 방법
|
5 |
5
제1항에 있어서, 상기 (c) 단계는, 지지벡터기계, 결정트리, 로지스틱 회귀 분석 중 적어도 하나에 의한 기계 학습을 적용하여 각 용어후보들에 가중치를 할당하는 것을 특징으로 하는 웹 검색 기반 용어 인식 방법
|
6 |
6
입력문서의 각 문장을 분석하여 품사정보, 단어 원형 정보를 획득하고, 상기 획득된 품사정보 및 단어원형정보와 기 저장된 용어후보패턴을 이용하여 용어 후보들을 추출하는 용어 후보 추출부;상기 추출된 용어 후보들에 대한 기본자질과 웹 검색 결과에 의한 웹 자질을 획득하는 자질 추출부;상기 용어 후보들의 기본자질과 웹 자질에 기계 학습을 적용하여 가중치를 할당하고, 가중치가 할당된 값이 가장 높은 용어 후보를 용어로 인식하는 용어 인식부;를 포함하는 웹 검색 기반 용어 인식 장치
|
7 |
7
삭제
|
8 |
8
제6항에 있어서, 상기 자질 추출부는 상기 추출된 용어 후보들에 대한 문형특징 및 사전정보를 포함하는 기본자질을 추출하고, 상기 용어 후보들에 대한 웹 검색 결과를 획득하여 그 웹 검색 결과에 따른 웹 빈도수를 정규화하여 웹 자질로 추출하는 것을 특징으로 하는 웹 검색 기반 용어 인식 장치
|
9 |
9
제8항에 있어서, 상기 자질 추출부는 상기 용어후보가 두 개 이상의 단어로 구성된 경우, 중심어를 선정하고, 상기 중심어를 기준으로 하위 용어 후보들을 추출한 후, 상기 추출된 하위 용어 후보들에 대한 웹 검색을 수행하여 웹 검색 결과를 획득하고, 상기 웹 검색 결과에 따른 웹 빈도수를 정규화하여 웹 자질로 추출하는 것을 특징으로 하는 웹 검색 기반 용어 인식 장치
|
10 |
10
제6항에 있어서, 상기 용어 인식부는 지지벡터기계, 결정트리, 로지스틱 회귀 분석 중 적어도 하나에 의한 기계 학습을 적용하여 각 용어후보들에 가중치를 할당하는 것을 특징으로 하는 웹 검색 기반 용어 인식 장치
|
11 |
11
(a) 입력문서의 각 문장을 분석하여 품사정보, 단어 원형 정보를 획득하고, 상기 획득된 품사정보 및 단어원형정보와 기 저장된 용어후보패턴을 이용하여 용어 후보들을 추출하는 단계;(b) 상기 추출된 용어 후보들에 대한 기본자질과 웹 검색 결과에 의한 웹 자질을 획득하는 단계;(c) 상기 용어 후보들의 기본자질과 웹 자질에 기계 학습을 적용하여 가중치를 할당하는 단계; 및(d) 상기 용어 후보들 중에서 가중치가 할당된 값이 가장 높은 용어 후보를 용어로 인식하는 단계를 포함하는 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체
|