맞춤기술찾기

이전대상기술

담화 성분과 화행을 고려한 한국어 대화체 코퍼스 분류 방법 및 시스템

  • 기술번호 : KST2020000933
  • 담당센터 : 서울동부기술혁신센터
  • 전화번호 : 02-2155-3662
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 발명은 담화 성분과 화행을 고려한 한국어 대화체 코퍼스 분류 방법에 관한 것으로서, 보다 구체적으로는 한국어 대화체 코퍼스 분류 방법으로서, (1) 사용자가 발화한 한국어 대화체 코퍼스를 음성 신호로 입력받는 단계; (2) 상기 단계 (1)에서 입력받은 상기 음성 신호를 문자열로 변환하여 출력하는 단계; (3) 상기 단계 (2)에서 출력된 상기 문자열에 대해 담화 성분 분석 및 화행 분석을 수행하고 상기 문자열의 의도를 판단하는 단계; 및 (4) 상기 단계 (3)에서 판단된 의도대로 상기 문자열을 질문, 요구, 서술 또는 non-target 문장으로 분류하는 단계를 포함하는 것을 그 구성상의 특징으로 한다. 또한, 본 발명은 담화 성분과 화행을 고려한 한국어 대화체 코퍼스 분류 시스템(10)에 관한 것으로서, 보다 구체적으로는, 한국어 대화체 코퍼스 분류 시스템으로서, 사용자가 발화한 한국어 대화체 코퍼스를 음성 신호로 입력받는 음성 입력 모듈(100); 상기 음성 신호를 입력받아 상기 음성 신호를 문자열로 변환하여 출력하는 문자열 출력 모듈(200); 상기 문자열 출력 모듈(200)에 의해 출력된 상기 문자열에 대해 담화 성분 분석 및 화행 분석을 수행하고 상기 문자열의 의도를 판단하는 판단 모듈(300); 및 상기 판단 모듈(300)에 의해 판단된 의도대로 상기 문자열을 질문, 요구, 서술 또는 non-target 문장으로 분류하는 문장 분류 모듈(400)을 포함하는 것을 그 구성상의 특징으로 한다. 본 발명에서 제안하고 있는 담화 성분과 화행을 고려한 한국어 대화체 코퍼스 분류 방법 및 시스템에 따르면, 맥락(Context)이 주어지지 않은 한국어 대화체 문장에 대해, 통사론, 의미론, 화용론적 지식 및 용례들을 충분히 고려하여 한국어 대화체 문장을 분석하고 의도를 파악하여, 파악된 의도에 따라 질문, 요구 또는 서술로 한국어 대화체 문장을 분류할 수 있다. 또한, 본 발명에서 제안하고 있는 담화 성분과 화행을 고려한 한국어 대화체 코퍼스 분류 방법 및 시스템에 따르면, 한국어 대화체 코퍼스를 분류하는 기준을 수립함으로써, 이를 통해 추후 기계 학습을 통한 한국어 문장 의도 분석에 효과적인 데이터 셋을 제공할 수 있다.
Int. CL G06F 40/20 (2020.01.01) G10L 15/18 (2006.01.01) G10L 15/22 (2006.01.01)
CPC G06F 40/211(2013.01) G06F 40/211(2013.01) G06F 40/211(2013.01) G06F 40/211(2013.01) G06F 40/211(2013.01)
출원번호/일자 1020180093966 (2018.08.10)
출원인 서울대학교산학협력단
등록번호/일자 10-2086601-0000 (2020.03.03)
공개번호/일자 10-2020-0018121 (2020.02.19) 문서열기
공고번호/일자 (20200309) 문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 등록
심사진행상태 수리
심판사항
구분 신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2018.08.10)
심사청구항수 8

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 서울대학교산학협력단 대한민국 서울특별시 관악구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 김남수 서울특별시 서초구
2 조원익 서울특별시 광진구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 김건우 대한민국 서울특별시 금천구 가산디지털*로 ***, 에이동 ***호 특허그룹덕원 (가산동, 우림 라이온스밸리)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
1 서울대학교산학협력단 서울특별시 관악구
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2018.08.10 수리 (Accepted) 1-1-2018-0794626-41
2 출원인정보변경(경정)신고서
Notification of change of applicant's information
2019.05.13 수리 (Accepted) 4-1-2019-5093546-10
3 출원인정보변경(경정)신고서
Notification of change of applicant's information
2019.05.23 수리 (Accepted) 4-1-2019-5101798-31
4 출원인정보변경(경정)신고서
Notification of change of applicant's information
2019.08.02 수리 (Accepted) 4-1-2019-5154561-59
5 의견제출통지서
Notification of reason for refusal
2019.08.26 발송처리완료 (Completion of Transmission) 9-5-2019-0615144-29
6 [거절이유 등 통지에 따른 의견]의견(답변, 소명)서
[Opinion according to the Notification of Reasons for Refusal] Written Opinion(Written Reply, Written Substantiation)
2019.10.23 수리 (Accepted) 1-1-2019-1082430-13
7 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2019.10.23 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2019-1082411-45
8 등록결정서
Decision to grant
2020.01.29 발송처리완료 (Completion of Transmission) 9-5-2020-0069250-77
9 출원인정보변경(경정)신고서
Notification of change of applicant's information
2020.11.25 수리 (Accepted) 4-1-2020-5265458-48
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
한국어 대화체 코퍼스 분류 방법으로서,(1) 음성 입력 모듈(100)이, 사용자가 발화한 한국어 대화체 코퍼스를 음성 신호로 입력받는 단계;(2) 문자열 출력 모듈(200)이, 상기 단계 (1)에서 입력받은 상기 음성 신호를 문자열로 변환하여 출력하는 단계;(3) 판단 모듈(300)이, 상기 단계 (2)에서 출력된 상기 문자열에 대해 담화 성분 분석 및 화행 분석을 수행하고 상기 문자열의 의도를 판단하는 단계; 및(4) 문장 분류 모듈(400)이, 상기 단계 (3)에서 판단된 의도대로 상기 문자열을 질문, 요구, 서술 또는 non-target 문장으로 분류하는 단계를 포함하며,상기 단계 (3)은, 상기 판단 모듈(300)이, (3-1) 상기 단계 (2)에서 출력된 상기 문자열이, 완전한 문장인지 판단하는 단계;(3-2) 상기 단계 (3-1)의 판단 결과 상기 문자열이 완전한 문장인 경우, 억양 정보로 상기 완전한 문장의 의도 판단이 가능한지 판단하는 단계;(3-3) 상기 단계 (3-2)의 판단 결과 상기 완전한 문장의 의도 판단이 가능한 경우, 상기 억양 정보가 필요한지 판단하는 단계; 및(3-4) 상기 억양 정보가 필요하지 않은 경우, 상기 단계 (3-1)에서 판단된 완전한 문장이 질문, 요구 및 서술 중 어떠한 의도를 가지고 있는지 판단하는 단계를 포함하는 것을 특징으로 하는, 담화 성분과 화행을 고려한 한국어 대화체 코퍼스 분류 방법
2 2
제1항에 있어서, 상기 한국어 대화체 코퍼스는,단일 문장 또는 주제가 공통된 다수의 문장인 것을 특징으로 하는, 담화 성분과 화행을 고려한 한국어 대화체 코퍼스 분류 방법
3 3
삭제
4 4
제1항에 있어서, 상기 단계 (3-4)는,(3-4-1) 질문 또는 질문이 내장된 문장으로서, 청자의 답이 필요한지 여부를 판단하는 단계; 및(3-4-2) 명령 또는 금지의 문장으로서, 청자의 행동이 요구되는지 판단하는 단계를 포함하는 것을 특징으로 하는, 담화 성분과 화행을 고려한 한국어 대화체 코퍼스 분류 방법
5 5
제1항에 있어서, 상기 단계 (4)에서 상기 non-target 문장은,Fragments(FR), Context-dependent(CD), Intonation-dependent(ID), 수사의문문(RQ), 또는 관용어구(IE)인 것을 특징으로 하는, 담화 성분과 화행을 고려한 한국어 대화체 코퍼스 분류 방법
6 6
한국어 대화체 코퍼스 분류 시스템으로서,사용자가 발화한 한국어 대화체 코퍼스를 음성 신호로 입력받는 음성 입력 모듈(100);상기 음성 신호를 입력받아 상기 음성 신호를 문자열로 변환하여 출력하는 문자열 출력 모듈(200);상기 문자열 출력 모듈(200)에 의해 출력된 상기 문자열에 대해 담화 성분 분석 및 화행 분석을 수행하고 상기 문자열의 의도를 판단하는 판단 모듈(300); 및상기 판단 모듈(300)에 의해 판단된 의도대로 상기 문자열을 질문, 요구, 서술 또는 non-target 문장으로 분류하는 문장 분류 모듈(400)을 포함하며,상기 판단 모듈(300)은,상기 문자열 출력 모듈(200)에서 출력된 문장이 완전한 문장인지 판단하는 문장 판단부(310);상기 문장 판단부(310)에서 판단한 결과 상기 문자열이 완전한 문장인 경우, 억양 정보로 상기 완전한 문장의 의도 판단이 가능한지 판단하는 억양 정보 의도 판단부(320);상기 억양 정보 의도 판단부(320)에서 판단한 결과 상기 완전한 문장의 의도 판단이 가능한 경우, 상기 억양 정보가 필요한지 판단하는 억양 정보 필요 판단부(330); 및상기 억양 정보가 필요하지 않은 경우, 상기 문장 판단부(310)에서 판단된 상기 완전한 문장이 질문, 요구 및 서술 중 어떠한 의도를 가지고 있는지 판단하는 문장 의도 판단부(340)를 포함하는 것을 특징으로 하는, 담화 성분과 화행을 고려한 한국어 대화체 코퍼스 분류 시스템
7 7
제6항에 있어서, 상기 한국어 대화체 코퍼스는,단일 문장 또는 주제가 공통된 서로 다른 문장인 것을 특징으로 하는, 담화 성분과 화행을 고려한 한국어 대화체 코퍼스 분류 시스템
8 8
삭제
9 9
제6항에 있어서, 상기 문장 의도 판단부(340)는,질문 또는 질문이 내장된 문장으로서, 청자의 답이 필요한지 여부를 판단하는 질문 판단부(341); 및명령 또는 금지의 문장으로서, 청자의 행동이 요구되는지 판단하는 요구 판단부(342)를 포함하는 것을 특징으로 하는, 담화 성분과 화행을 고려한 한국어 대화체 코퍼스 분류 시스템
10 10
제6항에 있어서, 상기 non-target 문장은,Fragments(FR), Context-dependent(CD), Intonation-dependent(ID), 수사의문문(RQ), 또는 관용어구(IE)인 것을 특징으로 하는, 담화 성분과 화행을 고려한 한국어 대화체 코퍼스 분류 시스템
지정국 정보가 없습니다
패밀리정보가 없습니다
순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번 연구부처 주관기관 연구사업 연구과제
1 산업통상자원부 한양대학교산학협력단 로봇산업핵심기술개발사업(인공지능 융합 로봇시스템 기술) 로봇용 free-running 임베디드 자연어 대화음성인식을 위한 원천 기술 개발