맞춤기술찾기

이전대상기술

인간 가독형 형태소 접속 정보와 자종(字種) 정보를 이용한 일본어 형태소 분석 장치 및 그 방법

  • 기술번호 : KST2014006198
  • 담당센터 : 대전기술혁신센터
  • 전화번호 : 042-610-2279
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 발명은 전자화된 일본어 문서를 인간 가독형 형태소 접속 정보와 자종(字種) 정보를 이용하여 최소의 의미를 가지는 형태소 단위로 분석하는 장치 및 그 방법에 관한 것으로서, 입력된 일본어 전자 문서를 자종 정보를 이용하여 구현된 유한 상태 자동장치에 의해 플래그먼트 단위의 문장으로 분리하고, 분리된 플래그먼트 단위의 문장을 일본어 형태소에 품사 정보를 부여하는 전자화된 일본어 사전과 인간 가독형 형태소 접속 정보를 이용하여 일본어 형태소 분석을 하는 일본어 형태소 분석 장치 및 방법을 제공함으로써, 긴 문장을 여러 개의 짧은 플래그먼트로 나누어 처리하여, 보다 효율적인 형태소 분석이 가능하고, 인간 가독성(Readibility)을 극대화하고 접속 정보의 유지와 추가를 용이하게 할 수 있는 효과가 있다.
Int. CL G06F 17/28 (2006.01)
CPC G06F 17/2755(2013.01) G06F 17/2755(2013.01)
출원번호/일자 1019970066394 (1997.12.05)
출원인 한국전자통신연구원
등록번호/일자 10-0248386-0000 (1999.12.17)
공개번호/일자 10-1999-0047853 (1999.07.05) 문서열기
공고번호/일자 (20000315) 문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 소멸
심사진행상태 수리
심판사항
구분
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (1997.12.05)
심사청구항수 6

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 한국전자통신연구원 대한민국 대전광역시 유성구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 박동인 대한민국 대전광역시 유성구
2 김태완 대한민국 대전광역시 유성구
3 여상화 대한민국 대전광역시 유성구
4 정한민 대한민국 대전광역시 유성구
5 최승권 대한민국 대전광역시 유성구
6 채영숙 대한민국 대전광역시 유성구
7 김영길 대한민국 서울특별시 성동구
8 심철민 대한민국 대전광역시 서구
9 장 원 대한민국 대전광역시 유성구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 이화익 대한민국 서울시 강남구 테헤란로*길** (역삼동,청원빌딩) *층,***,***호(영인국제특허법률사무소)
2 김명섭 대한민국 서울특별시 강남구 테헤란로**길 *, 테헤란오피스빌딩 ***호 시몬국제특허법률사무소 (역삼동)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
1 한국전자통신연구원 대한민국 대전광역시 유성구
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 특허출원서
Patent Application
1997.12.05 수리 (Accepted) 1-1-1997-0208435-44
2 대리인선임신고서
Notification of assignment of agent
1997.12.05 수리 (Accepted) 1-1-1997-0208436-90
3 출원심사청구서
Request for Examination
1997.12.05 수리 (Accepted) 1-1-1997-0208437-35
4 등록사정서
Decision to grant
1999.11.26 발송처리완료 (Completion of Transmission) 9-5-1999-0353838-13
5 출원인정보변경(경정)신고서
Notification of change of applicant's information
2001.04.19 수리 (Accepted) 4-1-2001-0046046-20
6 출원인정보변경(경정)신고서
Notification of change of applicant's information
2002.08.08 수리 (Accepted) 4-1-2002-0065009-76
7 출원인정보변경(경정)신고서
Notification of change of applicant's information
2009.08.04 수리 (Accepted) 4-1-2009-5150899-36
8 출원인정보변경(경정)신고서
Notification of change of applicant's information
2015.02.02 수리 (Accepted) 4-1-2015-0006137-44
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1

중앙 처리 장치를 구비한 마이크로 컴퓨터에서 전자화된 일본어 문서를 입력받아 형태소를 분석하는 장치에 있어서,

형태소를 분석할 일본어를 입력하거나, 형태소가 분석된 결과를 출력하는 일본어 입출력 장치(10)와;

상기 입출력 장치(10)로부터 출력된 일본어 문서를 플래그먼트 단위의 문장으로 분리하는 플래그먼트 분리부(20)와;

주변 장치들을 제어하면서, 상기 플래그먼트 분리부(20)로부터 출력된 플래그먼트 단위의 문장을 형태소 분석하는 중앙처리장치(30)와;

상기 중앙처리장치(30)에서 처리되는 각종 데이터들을 저장하는 보조기억장치(40)와;

인간 가독형 접속 정보를 기계 가독형 접속 정보로 변환하는 인간 가독형 접속 정보 변환 장치(50)와;

상기 인간 가독형 형태소 접속 정보 변환 장치(50)에서 변환한 기계 가독형 접속 정보를 저장하고, 상기 중앙 처리 장치(30)에 인간 가독형 형태소 접속 정보를 공급하는 기계 가독형 접속 정보 저장부(60)와;

인간 가독형 형태소 정보가 부여된 일본어 전자 사전을 저장하고 상기 중앙 처리 장치(30)에 일본어 전자 사전을 공급하는 전자 사전 저장부(70)로 구성된 것을 특징으로 하는 인간 가독형 형태소 접속 정보와 자종(字種) 정보를 이용한 일본어 형태소 분석 장치

2 2

제 1 항에 있어서,

상기 자종 정보를 이용한 플래그먼트 분리부(20)는, 자종 정보에 의한 문장 분리 및 플래그먼트 분리 규칙을 컴파일하는 규칙 컴파일러(21)와;

상기 규칙 컴파일러(21)로부터 출력된 자종 정보에 의한 문장 분리 및 플래그먼트 분리 규칙에 따라서 입력된 일본어 문서를 플래그먼트 단위의 문장으로 분리하여 출력하는 플래그먼트 분리기(22)로 구성된 것을 특징으로 하는 인간 가독형 형태소 접속 정보와 자종(字種) 정보를 이용한 일본어 형태소 분석 장치

3 3

제 1 항에 있어서,

상기 중앙처리장치(30)는, 인간 가독형 형태소 접속 정보와 일본어 형태소에 인간 가독형 품사 정보가 부여된 전자화된 일본어 사전을 이용하여 형태소를 분석하여 출력하는 형태소 분석기(31)가 구성된 것을 특징으로 하는 인간 가독형 형태소 접속 정보와 자종(字種) 정보를 이용한 일본어 형태소 분석 장치

4 4

중앙 처리 장치를 구비한 마이크로 컴퓨터에서 전자화된 일본어 문서를 입력받아 형태소를 분석하는 방법에 있어서,

자종 정보를 이용하여 유한 상태 자동 장치로 구현된 플래그먼트 분리기(22)에 의해 입력된 일본어 전자 문서를 문장 단위 및 플래그먼트 단위로 분리하는 제 1 과정과;

상기 제 1 과정에서 분리된 플래그먼트 단위의 문장을 인간 가독형 형태소 접속 정보와 자종(字種) 정보를 사용하여 형태소를 분석하는 제 2 과정을 포함하는 것을 특징으로 하는 인간 가독형 형태소 접속 정보와 자종(字種) 정보를 이용한 일본어 형태소 분석 방법

5 5

제 3 항에 있어서,

상기 제 1 과정은, 입력된 일본어 문서가 수록된 파일을 오픈하고 현재의 플래그먼트를 널로 초기화하는 제 1 단계와;

상기 제 1 단계에서 입력된 파일이 끝인가를 판단하는 제 2 단계와;

상기 제 2 단계에서 끝일 경우에는 현재의 플래그먼트가 널(NULL)인지 아닌지를 분리하여, 널이 아닐 경우 플래그먼트를 출력 파일에 기록하고 종료하는 제 3 단계와;

상기 제 2 단계에서 끝이 아닐 경우 파일로부터 한 바이트씩을 읽고 이를 A라는 변수에 할당하는 제 4 단계와;

파일 포인터의 현재 위치에서 유한 상태 자동장치로 구성된 복합 자종 표제어를 탐색하고, 복합 자종 표제어가 발견되었는가의 여부를 판단하는 제 5 단계와;

상기 제 5 단계에서 표제어가 발견될 경우 현재의 프래그먼트를 분리하고, 발견된 복합자종표제어도 분리하여 현재 플래그먼트를 초기화하는 제 6 단계와;

상기 제 5 단계에서 표제어가 발견되지 않을 경우 동일한 자종의 문자가 반복되는지를 조사하는 제 7 단계와;

상기 제 7 단계에서 동일한 자종이 반복되어 이어질 경우 읽어 들인 문자(A)를 현재의 프래그먼트에 추가하는 제 8 단계와;

상기 제 7 단계에서 동일한 자종이 반복되지 않고 다른 자종이 나타날 경우 한자 다음에 히라가나가 나타난 것인가를 조사하는 제 9 단계와;

상기 제 9 단계에서 한자 다음에 이어지는 히라가나 문자일 경우 히라가나 문자(A)를 현재 플래그먼트에 추가하는 제 10 단계와;

상기 제 9 단계에서 한자 다음에 나타나는 히라가나가 아니면서 다른 자종의 문자가 나타날 경우 현재의 플래그먼트를 분리하고 다른 자종의 문자로 시작하는 새로운 플래그먼트를 현재의 플래그먼트로하고 상기 제 4 단계로 귀환하여 상기 단계들을 반복 수행하는 제 10 단계를 포함하는 것을 특징으로 하는 인간 가독형 형태소 접속 정보와 자종(字種) 정보를 이용한 일본어 형태소 분석 방법

6 6

제 3 항에 있어서,

상기 제 2 과정은, 전처리된 결과 파일을 오픈하고, 각종 변수를 초기화하는 제 1 단계와;

상기 제 1 단계에서 입력된 파일이 끝인가를 판단하는 제 2 단계와;

상기 제 2 단계에서 끝일 경우 파일을 닫고 종료하는 제 3 단계와;

상기 제 2 단계에서 끝이 아닐 경우 하나의 플래그먼트와 정보를 읽는 제 4 단계와;

상기 제 4 단계에서 읽은 정보가 TAG인가의 여부를 판단하는 제 5 단계와;

상기 제 5 단계에서 TAG일 경우, 상기 하나의 플래그먼트와 TAG 정보를 출력하는 제 6 단계와;

상기 제 5 단계에서 TAG가 아닐 경우 읽은 정보가 ATM인가의 여부를 판단하는 제 7 단계와;

상기 제 7 단계에서 ATM일 경우 A를 사전에서 탐색하고, 사전 정보를 출력하는 제 8 단계와;

상기 제 7 단계에서 ATM이 아닐 경우 읽은 정보가 NUM인가의 여부를 판단하는 제 9 단계와;

상기 제 9 단계에서 NUM일 경우 A와 미리 정의된 정보를 출력하는 제 10 단계와;

상기 제 9 단계에서 NUM이 아닐 경우 읽은 정보가 HUM인가의 여부를 판단하는 제 11 단계와;

상기 제 11 단계 HUM일 경우 A와 미리 정의된 정보를 출력하는 제 12 단계와;

상기 제 11 단계에서 HUM이 아닐 경우 현재의 플래그먼트를 CYK 알고리즘에 따라 분석하는 제 13 단계를 포함하는 것을 특징으로 하는 인간 가독형 형태소 접속 정보와 자종(字種) 정보를 이용한 일본어 형태소 분석 방법

지정국 정보가 없습니다
패밀리정보가 없습니다
국가 R&D 정보가 없습니다.