맞춤기술찾기

이전대상기술

품사 분포와 양방향 LSTM CRFs를 이용한 음절 단위 형태소 분석기 및 분석 방법

  • 기술번호 : KST2019001382
  • 담당센터 : 부산기술혁신센터
  • 전화번호 : 051-606-6561
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 발명은 한 어절에서 형태소 단위의 분리 과정과 형태소에 대한 품사 결정 과정을 합쳐서 딥러닝으로 최근 순차 레이블이 많은 영역에서 좋은 성능을 보이고 있는 양방향(Bidirectional) LSTM(Long Short Term Memory) CRFs(bi-LSTM-CRFs)를 사용한 음절 단위 형태소 분석기 및 분석방법을 제공하기 위한 것으로서, 입력된 문장을 음절 단위로 분리하는 음절 분리부와, 상기 음절 분리부에서 분리된 음절을 기반으로 음절에 대한 벡터를 통해 bi-LSTM-CRFs를 이용한 음절 단위 품사 태깅을 진행하여 음절이 포함된 형태소의 품사 태그를 할당하는 분류부와, 상기 분류부에서 음절 단위로 품사 태그가 결정된 결과에 대해 기분석 사전을 통해 학습 말뭉치에서 중의성이 없는 변환을 처리하여 오류를 제거하는 오류 제거부와, 상기 오류 제거부에서 오류를 제거하여 음절 단위로 품사 태그가 부착된 결과를 원형복원을 통해 형태소 단위로 변환하는 원형 복원부를 포함하여 구성되는데 있다.
Int. CL G06F 17/27 (2006.01.01)
CPC G06F 40/268(2013.01)
출원번호/일자 1020170104916 (2017.08.18)
출원인 동아대학교 산학협력단
등록번호/일자 10-1997783-0000 (2019.07.02)
공개번호/일자 10-2019-0019683 (2019.02.27) 문서열기
공고번호/일자 (20190708) 문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 등록
심사진행상태 수리
심판사항
구분 신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2017.08.18)
심사청구항수 13

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 동아대학교 산학협력단 대한민국 부산광역시 사하구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 고영중 대한민국 부산광역시 해운대구
2 김혜민 대한민국 부산광역시 서구
3 양선 대한민국 부산광역시 부산진구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 정기택 대한민국 서울특별시 서초구 강남대로**길 **, *층 (반포동, 새로나빌딩)(스카이특허법률사무소)
2 오위환 대한민국 서울특별시 서초구 강남대로**길 **, *층 (반포동, 새로나빌딩)(스카이특허법률사무소)
3 나성곤 대한민국 서울특별시 서초구 강남대로**길 **, *층 (반포동, 새로나빌딩)(스카이특허법률사무소)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
1 동아대학교 산학협력단 부산광역시 사하구
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2017.08.18 수리 (Accepted) 1-1-2017-0799692-71
2 심사처리보류(연기)보고서
Report of Deferment (Postponement) of Processing of Examination
2018.10.31 발송처리완료 (Completion of Transmission) 9-6-2018-0131595-11
3 의견제출통지서
Notification of reason for refusal
2018.12.03 발송처리완료 (Completion of Transmission) 9-5-2018-0828559-68
4 [지정기간연장]기간연장(단축, 경과구제)신청서
[Designated Period Extension] Application of Period Extension(Reduction, Progress relief)
2019.02.07 수리 (Accepted) 1-1-2019-0129347-22
5 [거절이유 등 통지에 따른 의견]의견(답변, 소명)서
[Opinion according to the Notification of Reasons for Refusal] Written Opinion(Written Reply, Written Substantiation)
2019.02.11 수리 (Accepted) 1-1-2019-0141030-47
6 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2019.02.11 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2019-0141059-60
7 등록결정서
Decision to grant
2019.06.27 발송처리완료 (Completion of Transmission) 9-5-2019-0462017-95
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
입력된 문장을 음절 단위로 분리하는 음절 분리부와,상기 음절 분리부에서 분리된 음절을 기반으로 음절에 대한 벡터를 통해 bi-LSTM-CRFs를 이용한 음절 단위 품사 태깅을 진행하여 음절이 포함된 형태소의 품사 태그를 할당하는 분류부와,상기 분류부에서 음절 단위로 품사 태그가 결정된 결과에 대해 기분석 사전을 통해 학습 말뭉치에서 중의성이 없는 변환을 처리하여 오류를 제거하는 오류 제거부와,상기 오류 제거부에서 오류를 제거하여 음절 단위로 품사 태그가 부착된 결과를 원형복원을 통해 형태소 단위로 변환하는 원형 복원부를 포함하여 구성되는 것을 특징으로 하는 품사 분포와 양방향 LSTM CRFs를 이용한 음절 단위 형태소 분석기
2 2
제 1 항에 있어서, 상기 분류부는 음절에 대한 벡터를 생성하기 위해 단어 임베딩(word embedding) 알고리즘인 word2vec를 사용하여 64차원의 음절 단위의 임베딩 벡터를 학습하여 입력 벡터로 사용하는 것을 특징으로 하는 품사 분포와 양방향 LSTM CRFs를 이용한 음절 단위 형태소 분석기
3 3
제 1 항에 있어서, 상기 오류 제거부의 기분석 사전은 어절사전과 명사사전을 사용하는 것을 특징으로 하는 품사 분포와 양방향 LSTM CRFs를 이용한 음절 단위 형태소 분석기
4 4
제 1 항에 있어서,상기 원형 복원부는 불규칙 변환이 존재하는 경우 불규칙 변환 사전을 통해 이를 보정하여 변환하는 것을 특징으로 하는 품사 분포와 양방향 LSTM CRFs를 이용한 음절 단위 형태소 분석기
5 5
(A) 입력된 문장을 음절 분리부에서 음절 단위로 분리하는 단계와,(B) 상기 음절 분리부에서 분리된 음절을 기반으로 분류부에서 음절에 대한 벡터를 통해 bi-LSTM-CRFs를 이용한 음절 단위 품사 태깅을 진행하여 음절이 포함된 형태소의 품사 태그를 할당하는 단계와,(C) 상기 음절 단위로 품사 태그가 결정된 결과에 대해 오류 제거부에서 기분석 사전을 통해 학습 말뭉치에서 중의성이 없는 변환을 처리하여 오류를 제거하는 단계와,(D) 상기 오류를 제거하여 음절 단위로 품사 태그가 부착된 결과를 원형 복원부에서 원형복원을 통해 형태소 단위로 변환하는 단계를 포함하여 이루어지는 것을 특징으로 하는 품사 분포와 양방향 LSTM CRFs를 이용한 음절 단위 형태소 분석방법
6 6
제 5 항에 있어서, 상기 음절 분리부에서 수행되는 (A) 단계는CRF 학습을 위해 음절단위 자질과 어절 단위 자질을 사용하는 것을 특징으로 하는 품사 분포와 양방향 LSTM CRFs를 이용한 음절 단위 형태소 분석방법
7 7
제 6 항에 있어서,상기 어절 단위 자질은 전체 말뭉치에서 유일한 어절들을 추출하는 단계와,상기 추출된 각 어절 별로 ID를 할당하는 단계와,상기 할당된 ID를 자질로 표현하여 사용하는 단계를 포함하여 이루어지는 것을 특징으로 하는 품사 분포와 양방향 LSTM CRFs를 이용한 음절 단위 형태소 분석방법
8 8
제 5 항에 있어서, 상기 분류부에서 수행되는 (B) 단계는상기 음절에 대한 벡터를 생성하기 위해 단어 임베딩(word embedding) 알고리즘인 word2vec를 사용하여 64차원의 음절 단위의 임베딩 벡터를 학습하여 입력 벡터로 사용하는 것을 특징으로 하는 품사 분포와 양방향 LSTM CRFs를 이용한 음절 단위 형태소 분석방법
9 9
제 5 항에 있어서, 상기 오류 제거부에서 수행되는 (C) 단계는기분석 사전을 어절사전과 명사사전을 사용하는 것을 특징으로 하는 품사 분포와 양방향 LSTM CRFs를 이용한 음절 단위 형태소 분석방법
10 10
제 9 항에 있어서,상기 명사사전은 중의적 분석이 되지 않는 명사들로 구축하는 것을 특징으로 하는 품사 분포와 양방향 LSTM CRFs를 이용한 음절 단위 형태소 분석방법
11 11
제 9 항에 있어서, 상기 어절사전은 문맥정보를 고려하지 않은 어절사전1과 문맥정보를 고려하여 모호성을 해결한 어절사전2를 구축하는 것을 특징으로 하는 품사 분포와 양방향 LSTM CRFs를 이용한 음절 단위 형태소 분석방법
12 12
제 5 항에 있어서, 상기 원형 복원부에서 수행되는 (D) 단계는 원형 복원 시에 불규칙 변환이 필요한 경우 불규칙 변환 사전을 이용하여 변환하는 것을 특징으로 하는 품사 분포와 양방향 LSTM CRFs를 이용한 음절 단위 형태소 분석방법
13 13
제 5 항에 있어서, 상기 원형 복원부에서 수행되는 (D) 단계는불규칙 변환에서 불규칙 변환 사전에 동일한 변환이 있을 시 가장 높은 빈도의 결과를 선택하는 단계와,불규칙 변환을 적용한 후 최종적으로 동일한 품사 태그를 가지는 형태소들은 결합하여 형태소 품사 태깅을 완료하는 단계를 포함하여 이루어지는 것을 특징으로 하는 품사 분포와 양방향 LSTM CRFs를 이용한 음절 단위 형태소 분석방법
지정국 정보가 없습니다
패밀리정보가 없습니다
순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번 연구부처 주관기관 연구사업 연구과제
1 교육부 동아대학교 산학협력단 일반 연구자/기본연구지원사업 [2차년도] 딥러닝 기술을 이용한 커뮤니티 질문-응답 서비스 기반의 질문 분류, 검색 및 응답 추천 시스템 구축