1 |
1
문서 또는 전자 문서에 포함된 문자열 정보를 인식하고 이를 텍스트화하는 문자 인식부; 상기 문자 인식부를 통해 인식된 텍스트에 대하여 형태소 분석을 수행하여 토큰을 추출하는 형태소 분석부; 상기 형태소 분석부의 형태소 분석된 발표자료에 등장하는 어휘들을 분석하여 특수 대역어를 추출하는 특수 대역어 추출부; 상기 추출된 특수 대역어를 표시하는 특수 대역어 표시부; 및 상기 특수 대역어 표시부를 통해 표시된 상기 특수 대역어에 대하여 사용자가 직접 대역어를 결정할 수 있도록 상기 특수 대역어에 대한 사용자 대역어를 입력받는 사용자 대역어 처리부; 및 상기 사용자 대역어 처리부를 통해 입력된 사용자 대역어를 상기 번역 사전 데이터베이스에 등록하여 갱신하는 번역 지식 반영부를 포함하는 것인 발표자료 자동 분석에 기반한 실시간 강연 동시 통역 장치
|
2 |
2
제 1항에 있어서, 상기 특수 대역어 추출부는, 언어적 특성 등을 이용하여 추출된 어휘의 고유명사 여부를 파악하는 고유명사 인식부;를 더 포함하는 발표자료 자동 분석에 기반한 실시간 강연 동시 통역 장치
|
3 |
3
제 1항에 있어서, 상기 특수 대역어 추출부는, 전체 발표자료 상의 어휘들 간의 의미관계를 분석하는 어휘 의미관계 분석부;를 더 포함하는 발표자료 자동 분석에 기반한 실시간 강연 동시 통역 장치
|
4 |
4
제 3항에 있어서, 상기 어휘 의미관계 분석부는, word2vec 기술을 이용하는 것인 발표자료 자동 분석에 기반한 실시간 강연 동시 통역 장치
|
5 |
5
제 4항에 있어서, 상기 특수 대역어 추출부는 의미관계를 이용하여 대역어 선택 모호성이 있는 어휘들의 대역어를 결정하기 위한 가중치를 조정하는 가중치 조정부를 더 포함하는 발표자료 자동 분석에 기반한 실시간 강연 동시 통역 장치
|
6 |
6
제 1항에 있어서, 상기 특수 대역어 추출부는 원시어휘와 대역어휘를 동일한 의미벡터 스페이스 상에 투사하여 강연에 등장하는 어휘의 전반적인 의미관계와 도메인 정보를 의미적으로 파악함으로써, 문맥과 맞지 않는 대역어를 추출하는 것인 발표자료 자동 분석에 기반한 실시간 강연 동시 통역 장치
|
7 |
7
제 1항에 있어서, 상기 형태소 분석부에서 제공되는 토큰을 번역 사전 데이터베이스에 저장된 등록어와 비교하여 미등록어를 추출하는 미등록어 추출부; 및 상기 미등록어 추출부를 통해 추출된 미등록어를 상기 번역 사전 데이터베이스에 등록하여 갱신하는 번역 지식 반영부;를 포함하는 발표자료 자동 분석에 기반한 실시간 강연 동시 통역 장치
|
8 |
8
제 1항에 있어서, 상기 문자 인식부는, 하드카피내 문자열 정보를 인식한 후, 텍스트화하여 상기 형태소 분석부로 제공하는 OCR 문자 인식부인 것을 특징으로 하는 발표자료 자동 분석에 기반한 실시간 강연 동시 통역 장치
|
9 |
9
제 1항에 있어서, 상기 문자 인식부는, 전자파일내 문자열 정보를 인식한 후, 텍스트화하여 상기 형태소 분석부로 제공하는 전자파일 인식부인 것을 특징으로 하는 발표자료 자동 분석에 기반한 실시간 강연 동시 통역 장치
|
10 |
10
문자 인식부가 문서 또는 전자 문서에 포함된 문자열 정보를 인식하고 이를 텍스트화하는 단계; 형태소 분석부가 상기 문자 인식부를 통해 인식된 텍스트에 대하여 형태소 분석을 수행하여 토큰을 추출하는 단계; 특수 대역어 추출부가 상기 형태소 분석부의 형태소 분석된 발표자료에 등장하는 어휘들을 분석하여 특수 대역어를 추출하는 단계; 특수 대역어 표시부가 상기 추출된 특수 대역어를 표시하는 단계; 사용자 대역어 처리부가 상기 특수 대역어 표시부를 통해 표시된 상기 특수 대역어에 대하여 사용자가 직접 대역어를 결정할 수 있도록 상기 특수 대역어에 대한 사용자 대역어를 입력받는 단계; 및 상기 번역 지식 반영부가 상기 사용자 대역어 처리부를 통해 입력된 사용자 대역어를 상기 번역 사전 데이터베이스에 등록하여 갱신하는 단계;를 포함하는 발표자료 자동 분석에 기반한 실시간 강연 동시 통역 방법
|
11 |
11
제 10항에 있어서, 상기 특수 대역어를 추출하는 단계는, 고유명사 인식부가 언어적 특성 등을 이용하여 추출된 어휘의 고유명사 여부를 파악하는 단계;를 더 포함하는 발표자료 자동 분석에 기반한 실시간 강연 동시 통역 방법
|
12 |
12
제 10항에 있어서, 상기 특수 대역어를 추출하는 단계는, 어휘 의미관계 분석부가 전체 발표자료 상의 어휘들 간의 의미관계를 분석하는 단계;를 더 포함하는 발표자료 자동 분석에 기반한 실시간 강연 동시 통역 방법
|
13 |
13
제 12항에 있어서, 상기 의미관계를 분석하는 단계는, word2vec 기술을 이용하는 것인 발표자료 자동 분석에 기반한 실시간 강연 동시 통역 방법
|
14 |
14
제 13항에 있어서, 상기 의미관계를 분석하는 단계는, 가중치 조정부가 의미관계를 이용하여 대역어 선택 모호성이 있는 어휘들의 대역어를 결정하기 위한 가중치를 조정하는 단계;를 더 포함하는 발표자료 자동 분석에 기반한 실시간 강연 동시 통역 방법
|
15 |
15
제 10항에 있어서, 상기 특수 대역어를 추출하는 단계는, 원시어휘와 대역어휘를 동일한 의미벡터 스페이스 상에 투사하여 강연에 등장하는 어휘의 전반적인 의미관계와 도메인 정보를 의미적으로 파악함으로써, 문맥과 맞지 않는 대역어를 추출하는 것인 발표자료 자동 분석에 기반한 실시간 강연 동시 통역 방법
|
16 |
16
제 10항에 있어서, 미등록어 추출부가 상기 형태소 분석부에서 제공되는 토큰을 번역 사전 데이터베이스에 저장된 등록어와 비교하여 미등록어를 추출하는 단계; 및 번역 지식 반영부가 상기 미등록어 추출부를 통해 추출된 미등록어를 상기 번역 사전 데이터베이스에 등록하여 갱신하는 단계;를 포함하는 발표자료 자동 분석에 기반한 실시간 강연 동시 통역 방법
|
17 |
17
제 10항에 있어서, 상기 텍스트화하는 단계는, OCR 문자 인식부가 하드카피내 문자열 정보를 인식한 후, 텍스트화하여 상기 형태소 분석부로 제공하는 것을 특징으로 하는 발표자료 자동 분석에 기반한 실시간 강연 동시 통역 방법
|
18 |
18
제 10항에 있어서, 상기 텍스트화하는 단계는, 전자파일 인식부가 전자파일내 문자열 정보를 인식한 후, 텍스트화하여 상기 형태소 분석부로 제공하는 것을 특징으로 하는 발표자료 자동 분석에 기반한 실시간 강연 동시 통역 방법
|