1 |
1
터치스크린이 적용되어 번역할 단어 및 대역어 검색실행명령을 입력하는 디스플레이부;특정 도메인 대용량 문서에서 대역어 후보 단어를 추출하고 추출된 대역어 후보 단어의 빈도수와 가중치를 계산하여 대역어 데이터베이스를 구축하는 대역어 데이터베이스부;상기 디스플레이부에 입력된 단어의 대역어 검색신호를 받아 기존 대역어 사전을 기반으로 후보 대역어를 추출한 다음 상기 대역어 데이터베이스부에서 갖는 후보 대역어의 빈도수와 가중치를 비교한 후 빈도수와 가중치가 높은 대역어 순으로 추천 대역어를 선정하고 선정된 추천 대역어에 관한 정보를 디스플레이부에 출력하는 추천 대역어 결정부를 포함하며,상기 추천 대역어에 대한 정보는 추천 대역어와, 빈도수와, 예시문을 포함하고,상기 대역어 데이터베이스부는 특정 도메인 대용량 문서에서 특수문자와 수식 및 그림을 제거하는 과정을 거쳐 대역어 후보 단어를 추출하며, 대역어 후보 단위의 출현 빈도수 및 가중치를 계산한 뒤 기 설정된 임계값 이상의 대역어 후보 단어들만 선정하여 대역어 데이터베이스를 구축한 것을 특징으로 하는 도메인 대역어 추천 시스템
|
2 |
2
삭제
|
3 |
3
삭제
|
4 |
4
삭제
|
5 |
5
삭제
|
6 |
6
제 1 항에 있어서,상기 대역어 데이터베이스부는 동사와 명사만을 대역어 대상으로 제한하여 대역어 후보 단어를 추출하는 것을 특징으로 하는 도메인 대역어 추천 시스템
|
7 |
7
삭제
|
8 |
8
번역할 단어를 입력하는 단어입력부와 입력된 단어의 대역어 검색명령신호를 입력하는 실행버튼부와 추천 대역어에 대한 정보를 출력하는 추천 대역어 출력부로 구성되는 디스플레이부;특정 도메인 대용량 문서에서 특수문자, 수식, 그림 등을 제거하는 필터링부와, 필터링된 문서에서 분석하여 대역어 후보 단어를 추출하는 단어 추출부와, 추출된 대역어 후보 단어의 빈도수를 계산하는 빈도수 추출부와, 대역어 후보 단어의 의미적 가중치를 부여하는 가중치 부여부와, 빈도수와 가중치가 기 설정된 임계값 이상인 데이터들만 선정하여 최종 데이터베이스를 구축하는 대역어 후보 단어 선정부로 구성되는 대역어 데이터베이스부;기존 대역어 사전을 검색하여 후보 대역어를 추출하는 후보 대역어 추출부와, 대역어 데이터베이스부에 구축된 후보 대역어의 빈도수와 가중치를 비교하는 비교부와, 후보 대역어 중 빈도수와 가중치가 높은 대역어 순으로 추천대역어로 선정하고, 선정된 추천대역어에 관한 정보를 출력하는 추천 대역어 선정부로 구성되는 추천 대역어 결정부를 포함하며,상기 가중치는 문서 내에서의 단어의 출현 회수(TF: Term Frequency), 문서 빈도수(DF: Document Frequency), 전체문서 중 단어가 출현한 문서의 개수의 역수(IDF: Inversed Document Frequency) 중 어느 하나 이상이 적용되어 계산된 것을 특징으로 하는 도메인 대역어 추천 시스템
|
9 |
9
삭제
|
10 |
10
삭제
|
11 |
11
제 8 항에 있어서,상기 추천 대역어에 관한 정보는 추천 대역어와, 빈도수와, 예문을 포함하는 것을 특징으로 하는 도메인 대역어 추천 시스템
|
12 |
12
삭제
|
13 |
13
제 8 항에 있어서,상기 단어 추출부는 동사와 명사만을 대역어 대상으로 제한하여 대역어 후보 단어를 추출하는 것을 특징으로 하는 도메인 대역어 추천 시스템
|
14 |
14
삭제
|
15 |
15
번역할 단어를 입력받은 후 대역어 검색을 실시하는 단계;상기 입력된 단어를 바탕으로 기존 대역어 사전을 검색하여 후보 대역어들을 추출하는 단계;특정 도메인 대용량 문서를 분석하여 대역어 후보 단어를 추출하고 이 추출된 대역어 후보 단어의 빈도수와 가중치를 계산한 다음 후보 대역어의 빈도수와 가중치가 기 설정된 임계값 이상인 데이터들만 선정하여 구축된 대역어 데이터베이스에 대해 상기 추출된 후보 대역어들이 갖는 빈도수와 가중치를 비교하는 단계; 및상기 빈도수와 가중치가 높은 대역어 순으로 추천 대역어를 선정하고, 선정된 추천대역어에 관한 정보를 출력하는 단계를 포함하며,상기 입력된 단어를 바탕으로 기존 대역어 사전을 검색하여 후보 대역어들을 추출하는 단계는특정 도메인 대용량 문서에서 특수문자와 수식 및 그림을 제거하는 과정을 거쳐 후보 대역어들을 추출하고,상기 빈도수와 가중치가 높은 대역어 순으로 추천 대역어를 선정하고, 선정된 추천대역어에 관한 정보를 출력하는 단계에서상기 추천 대역어에 관한 정보는 추천 대역어와 빈도수 및 예문을 포함하고, 상기 가중치는 문서 내에서의 단어의 출현 회수(TF: Term Frequency) 및 문서 빈도수(DF: Document Frequency) 그리고 전체문서 중 단어가 출현한 문서의 개수의 역수(IDF: Inversed Document Frequency) 중 어느 하나 이상이 적용되어 계산된 것을 특징으로 하는 도메인 대역어 추천 방법
|
16 |
16
삭제
|
17 |
17
삭제
|
18 |
18
제 15 항에 있어서,상기 대역어 후보 단어의 추출은 동사와 명사만을 대역어 대상으로 제한하여 추출하는 것을 특징으로 하는 도메인 대역어 추천 방법
|
19 |
19
삭제
|
20 |
20
삭제
|