맞춤기술찾기

이전대상기술

의미적 유사도 기반 병렬 말뭉치 정제 방법 및 장치

  • 기술번호 : KST2023009367
  • 담당센터 : 서울동부기술혁신센터
  • 전화번호 : 02-2155-3662
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 의미적 유사도에 기반한 병렬 말뭉치 정제 방법 및 장치가 개시된다. 상기 병렬 말뭉치 정제 방법은 적어도 프로세서를 포함하는 컴퓨팅 장치에 의해 수행되는 병렬 말뭉치 정제 방법으로서, 각각이 소스 문장과 타겟 문장을 포함하는 문장쌍들을 포함하는 병렬 말뭉치를 획득하는 단계, 복수의 필터링 기법들 각각에 대하여, 상기 문장쌍들 각각에 대한 스코어를 산출하는 단계, 상기 복수의 필터링 기법들 중에서 어느 하나의 필터링 기법을 선택하는 단계, 및 상기 어느 하나의 필털이 기법에 의한 스코어를 기초로 상기 문장쌍들을 샘플링하는 단계를 포함한다.
Int. CL G06F 40/58 (2020.01.01) G06F 40/237 (2020.01.01) G06F 40/279 (2020.01.01) G06F 40/205 (2020.01.01) G06N 3/08 (2023.01.01)
CPC G06F 40/58(2013.01) G06F 40/237(2013.01) G06F 40/279(2013.01) G06F 40/205(2013.01) G06N 3/08(2013.01)
출원번호/일자 1020220151593 (2022.11.14)
출원인 고려대학교 산학협력단
등록번호/일자 10-2593448-0000 (2023.10.19)
공개번호/일자
공고번호/일자 (20231024) 문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 등록
심사진행상태 수리
심판사항
구분 국내출원/신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2022.11.14)
심사청구항수 3

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 고려대학교 산학협력단 대한민국 서울특별시 성북구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 임희석 서울특별시 성북구
2 문현석 서울특별시 강남구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 김등용 대한민국 서울시 구로구 디지털로**길 **, ***호(구로동, 코오롱싸이언스밸리*차)(동진국제특허법률사무소)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
1 고려대학교 산학협력단 서울특별시 성북구
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2022.11.14 수리 (Accepted) 1-1-2022-1208716-70
2 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2022.11.24 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2022-1256800-77
3 [우선심사신청]심사청구서·우선심사신청서
2023.03.16 수리 (Accepted) 1-1-2023-0298513-52
4 [우선심사신청]선행기술조사의뢰서
[Request for Preferential Examination] Request for Prior Art Search
2023.03.22 수리 (Accepted) 9-1-9999-9999999-89
5 [우선심사신청]선행기술조사보고서
[Request for Preferential Examination] Report of Prior Art Search
2023.03.28 수리 (Accepted) 9-1-2023-0006348-53
6 의견제출통지서
Notification of reason for refusal
2023.07.03 발송처리완료 (Completion of Transmission) 9-5-2023-0600050-13
7 [지정기간연장]기간 연장신청서·기간 단축신청서·기간 경과 구제신청서·절차 계속신청서
2023.09.04 수리 (Accepted) 1-1-2023-0976620-54
8 [거절이유 등 통지에 따른 의견]의견서·답변서·소명서
2023.09.20 수리 (Accepted) 1-1-2023-1044764-94
9 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2023.09.20 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2023-1044773-05
10 등록결정서
Decision to grant
2023.10.05 발송처리완료 (Completion of Transmission) 9-5-2023-0903507-50
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
적어도 프로세서를 포함하는 컴퓨팅 장치에 의해 수행되는 병렬 말뭉치 정제 방법에 있어서,각각이 소스 문장과 타겟 문장을 포함하는 문장쌍들을 포함하는 병렬 말뭉치를 획득하는 단계;복수의 필터링 기법들 각각에 대하여, 상기 문장쌍들 각각에 대한 스코어를 산출하는 단계;상기 복수의 필터링 기법들 중에서 어느 하나의 필터링 기법을 선택하는 단계; 및상기 어느 하나의 필터링 기법에 의한 스코어를 기초로 상기 문장쌍들을 샘플링하는 단계를 포함하고,상기 복수의 필터링 기법들은 제1 필터링 기법을 포함하고, 상기 제1 필터링 기법은 NMT(Neural Machine Translation, 신경망 기계 번역) 모델을 이용하여 상기 문장쌍들 각각에 대한 스코어를 산출하고,상기 복수의 필터링 기법들은 제2 필터링 기법을 포함하고, 상기 제2 필터링 기법은 PLM(Pre-trained Language Model)을 이용하여 상기 문장쌍들 각각에 대한 스코어를 산출하고,상기 복수의 필터링 기법들은 제3 필터링 기법을 포함하고, 상기 제3 필터링 기법은 문장 임베딩(sentence embedding)을 이용하여 상기 문장쌍들 각각에 대한 스코어를 산출하고,상기 어느 하나의 필터링 기법을 선택하는 단계는,학습 대상인 기계 번역이 미리 정해져 있는 경우 상기 제1 필터링 기법을 선택하고,산출된 스코어의 평균이 미리 정해진 제1 임계값 보다 작은 경우 제2 필터링 기법을 선택하고,산출된 스코어의 평균이 미리 정해진 제2 임계값 보다 큰 경우 제3 필터링 기법을 선택하는,병렬 말뭉치 정제 방법
2 2
삭제
3 3
삭제
4 4
삭제
5 5
삭제
6 6
제1항에 있어서,상기 샘플링 하는 단계는,선택된 필터링 기법에 의한 스코어 값을 기초로, 가장 높은 스코어를 갖는 a%(a는 임의의 실수)의 문장쌍들을 제외하고, 다음으로 높은 스코어를 갖는 b%(b는 임의의 실수)의 문장쌍들을 추출하여 학습 데이터를 구축하는,병렬 말뭉치 정제 방법
7 7
제1항에 있어서,상기 샘플링 하는 단계는,선택된 필터링 기법에 의한 스코어 값을 기초로, 중간값을 갖는 문장쌍을 기준으로 상하로 c%(c는 임의의 실수)의 문장쌍들을 추출하여 학습 데이터를 구축하는,병렬 말뭉치 정제 방법
지정국 정보가 없습니다
패밀리정보가 없습니다
순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번 연구부처 주관기관 연구사업 연구과제
1 교육부 고려대학교 이공학학술연구기반구축 Human-inspired AI 연구소
2 과학기술정보통신부 고려대학교산학협력단 정보통신방송혁신인재양성 ICT명품인재양성(고려대학교)