기술이전플랫폼 Tech-Bridge-이전대상기술

맞춤기술찾기

홈으로 가기

맞춤기술찾기

이전대상기술

프린트하기

이전대상기술

문서 임베딩을 생성하는 장치 및 방법

기술번호 : KST2021002908
담당센터 : 서울동부기술혁신센터
전화번호 : 02-2155-3662

상담신청 PDF 받기

상세정보
공개전문
공고전문
등록사항
통합행정정보
기술정보
과제정보
관련기술
심판사항

서지정보
인명정보
행정처리
청구항
지정국
패밀리정보
국가R&D 연구정보

이전 슬라이드 보기 다음 슬라이드 보기

요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약	문서 임베딩(document embedding)을 생성하는 장치는, 뉴럴 네트워크(neural network)를 구현하기 위한 프로그램을 저장하는 메모리, 및 프로그램을 실행함으로써 문서 임베딩을 생성하는 프로세서를 포함하고, 프로세서는, 제1 도메인 및 제2 도메인 중 어느 하나에 포함되는 문서들 각각의 문서 임베딩 초기값, 및 문서들에 포함되는 전체 워드들 각각의 워드 임베딩 초기값을 설정하고, 뉴럴 네트워크에 대하여 제1 도메인 및 제2 도메인 간의 도메인 적응(domain adaptation)을 위한 제1 트레이닝을 수행함으로써 워드 임베딩 초기값을 워드 임베딩 최종값으로 업데이트하고, 워드 임베딩 최종값에 기초하여 뉴럴 네트워크에 대하여 도메인 적응을 위한 제2 트레이닝을 수행함으로써 문서 임베딩 초기값을 문서 임베딩 최종값으로 업데이트한다.
Int. CL	G06F 40/20 (2020.01.01) G06F 16/93 (2019.01.01) G06N 3/04 (2006.01.01) G06N 3/08 (2006.01.01)
CPC	G06F 40/284(2013.01) G06F 16/93(2013.01) G06N 3/04(2013.01) G06N 3/08(2013.01)
출원번호/일자	1020190113642 (2019.09.16)
출원인	서울대학교산학협력단
등록번호/일자
공개번호/일자	10-2021-0032612 (2021.03.25) 문서열기
공고번호/일자
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태	등록
심사진행상태
심판사항
구분
원출원번호/일자
관련 출원번호
심사청구여부/일자	Y (2019.09.16)
심사청구항수	16

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호	이름	국적	주소
1	서울대학교산학협력단	대한민국	서울특별시 관악구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호	이름	주소
1	이재욱	서울특별시 관악구
2	박새롬	충청북도 청주시 청원구
3	이우진	대전광역시 유성구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호	이름	국적	주소
1	서상덕	대한민국	서울특별시 금천구 가산디지털로 , 가산비지니스센터 **호(가산동)(도울국제특허법률사무소)
2	이창재	대한민국	서울특별시 금천구 가산디지털로 , (가산동) **호(도울국제특허법률사무소)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호	이름	국적	주소
최종권리자 정보가 없습니다

번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호	청구항
1	1 문서 임베딩(document embedding)을 생성하는 장치에 있어서,뉴럴 네트워크(neural network)를 구현하기 위한 프로그램을 저장하는 메모리; 및상기 프로그램을 실행함으로써 상기 문서 임베딩을 생성하는 프로세서를 포함하고,상기 프로세서는,제1 도메인 및 제2 도메인 중 어느 하나에 포함되는 문서들 각각의 문서 임베딩 초기값, 및 상기 문서들에 포함되는 전체 워드들 각각의 워드 임베딩 초기값을 설정하고,상기 뉴럴 네트워크에 대하여 상기 제1 도메인 및 상기 제2 도메인 간의 도메인 적응(domain adaptation)을 위한 제1 트레이닝을 수행함으로써 상기 워드 임베딩 초기값을 워드 임베딩 최종값으로 업데이트하고,상기 워드 임베딩 최종값에 기초하여 상기 뉴럴 네트워크에 대하여 상기 도메인 적응을 위한 제2 트레이닝을 수행함으로써 상기 문서 임베딩 초기값을 문서 임베딩 최종값으로 업데이트하는, 장치
2	2 제 1항에 있어서,상기 프로세서는,상기 문서들 각각을 순차적으로 학습 대상 문서로 설정하고,상기 학습 대상 문서에 포함되는 워드들 각각을 순차적으로 중심 워드로, 상기 중심 워드로부터 일정 범위 내에 위치하는 워드들을 컨텍스트 워드(context word)들로 설정하고,상기 학습 대상 문서가 어떤 도메인에 포함되는지에 따라 상기 제1 도메인 및 상기 제2 도메인 중 어느 하나로부터 네거티브 샘플(negative sample)들을 추출하고,상기 중심 워드, 상기 컨텍스트 워드들 및 상기 네거티브 샘플들 상호간의 유사도에 기초하여 상기 제1 트레이닝을 수행하는, 장치
3	3 제 2항에 있어서,상기 프로세서는,상기 학습 대상 문서가 상기 제1 도메인에 포함되는 경우 상기 제1 도메인의 워드 빈도(word frequency)에 기초하여 설정되는 노이즈 분포에 따라 상기 네거티브 샘플들을 추출하고,상기 학습 대상 문서가 상기 제2 도메인에 포함되는 경우 상기 제2 도메인의 워드 빈도에 기초하여 설정되는 노이즈 분포에 따라 상기 네거티브 샘플들을 추출하는, 장치
4	4 제 2항에 있어서,상기 프로세서는,상기 중심 워드의 워드 임베딩 및 상기 컨텍스트 워드들 각각의 워드 임베딩 간의 거리는 감소하고, 상기 중심 워드의 워드 임베딩 및 상기 네거티브 샘플들 각각의 워드 임베딩 간의 거리는 증가하도록 상기 제1 트레이닝을 수행하는, 장치
5	5 제 1항에 있어서,상기 프로세서는,상기 문서들 각각을 순차적으로 학습 대상 문서로 설정하고,상기 학습 대상 문서가 어떤 도메인에 포함되는지에 따라 상기 제1 도메인 및 상기 제2 도메인 중 어느 하나로부터 네거티브 샘플들을 추출하고,상기 학습 대상 문서에 포함되는 워드들 각각의 워드 임베딩 최종값 및 상기 네거티브 샘플들 각각의 워드 임베딩 최종값에 기초하여 상기 학습 대상 문서의 문서 임베딩을 업데이트함으로써 상기 제2 트레이닝을 수행하는, 장치
6	6 제 5항에 있어서,상기 프로세서는,상기 학습 대상 문서가 상기 제1 도메인에 포함되는 경우 상기 제1 도메인의 워드 빈도에 기초하여 설정되는 노이즈 분포에 따라 상기 네거티브 샘플들을 추출하고,상기 학습 대상 문서가 상기 제2 도메인에 포함되는 경우 상기 제2 도메인의 워드 빈도에 기초하여 설정되는 노이즈 분포에 따라 상기 네거티브 샘플들을 추출하는, 장치
7	7 제 1항에 있어서,상기 프로세서는,상기 문서들에 포함되는 전체 워드들 중 등장 횟수가 미니멈 카운트(minimum count) 이상인 워드들에 대해서만 상기 워드 임베딩 초기값을 설정하는, 장치
8	8 제 1항에 있어서,상기 뉴럴 네트워크는,중심 워드로부터 일정 범위 내에 위치하는 컨텍스트 워드들에 대한 원 핫벡터(one-hot vector)들을 출력하는 입력 레이어;상기 원 핫 벡터들 및 입력 임베딩 행렬에 대한 제1 연산의 결과를 출력하는 히든 레이어; 및상기 제1 연산의 결과 및 출력 임베딩 행렬에 대한 제2 연산의 결과로서 상기 전체 워드들 각각이 상기 중심 워드에 해당할 확률을 출력하는 출력 레이어를 포함하는, 장치
9	9 뉴럴 네트워크(neural network)를 구현하기 위한 프로그램을 실행함으로써 문서 임베딩(document embedding)을 생성하는 방법에 있어서,제1 도메인 및 제2 도메인 중 어느 하나에 포함되는 문서들 각각에 대한 문서 임베딩 초기값, 및 상기 문서들에 포함되는 전체 워드들 각각에 대한 워드 임베딩 초기값을 설정하는 단계;상기 뉴럴 네트워크에 대하여 상기 제1 도메인 및 상기 제2 도메인 간의 도메인 적응(domain adaptation)을 위한 제1 트레이닝을 수행함으로써 상기 워드 임베딩 초기값을 워드 임베딩 최종값으로 업데이트하는 단계; 및상기 워드 임베딩 최종값에 기초하여 상기 뉴럴 네트워크에 대하여 상기 도메인 적응을 위한 제2 트레이닝을 수행함으로써 상기 문서 임베딩 초기값을 문서 임베딩 최종값으로 업데이트하는 단계를 포함하는, 방법
10	10 제 9항에 있어서,상기 워드 임베딩 최종값으로 업데이트하는 단계는,상기 문서들 각각을 순차적으로 학습 대상 문서로 설정하는 단계;상기 학습 대상 문서에 포함되는 워드들 각각을 순차적으로 중심 워드로, 상기 중심 워드로부터 일정 범위 내에 위치하는 워드들을 컨텍스트 워드(context word)들로 설정하는 단계;상기 학습 대상 문서가 어떤 도메인에 포함되는지에 따라 상기 제1 도메인 및 상기 제2 도메인 중 어느 하나로부터 네거티브 샘플(negative sample)들을 추출하는 단계; 및상기 중심 워드, 상기 컨텍스트 워드들 및 상기 네거티브 샘플들 상호간의 유사도에 기초하여 상기 제1 트레이닝을 수행하는 단계를 포함하는, 방법
11	11 제 10항에 있어서,상기 네거티브 샘플들을 추출하는 단계는,상기 학습 대상 문서가 상기 제1 도메인에 포함되는 경우 상기 제1 도메인의 워드 빈도(word frequency)에 기초하여 설정되는 노이즈 분포에 따라 상기 네거티브 샘플들을 추출하는 단계; 및상기 학습 대상 문서가 상기 제2 도메인에 포함되는 경우 상기 제2 도메인의 워드 빈도에 기초하여 설정되는 노이즈 분포에 따라 상기 네거티브 샘플들을 추출하는 단계를 포함하는, 방법
12	12 제 10항에 있어서,상기 제1 트레이닝을 수행하는 단계는,상기 중심 워드의 워드 임베딩 및 상기 컨텍스트 워드들 각각의 워드 임베딩 간의 거리는 감소하고, 상기 중심 워드의 워드 임베딩 및 상기 네거티브 샘플들 각각의 워드 임베딩 간의 거리는 증가하도록 상기 제1 트레이닝을 수행하는 단계를 포함하는, 방법
13	13 제 9항에 있어서,상기 문서 임베딩 최종값으로 업데이트하는 단계는,상기 문서들 각각을 순차적으로 학습 대상 문서로 설정하는 단계;상기 학습 대상 문서가 어떤 도메인에 포함되는지에 따라 상기 제1 도메인 및 상기 제2 도메인 중 어느 하나로부터 네거티브 샘플들을 추출하는 단계; 및상기 학습 대상 문서에 포함되는 워드들 각각의 워드 임베딩 최종값 및 상기 네거티브 샘플들 각각의 워드 임베딩 최종값에 기초하여 상기 학습 대상 문서의 문서 임베딩을 업데이트함으로써 상기 제2 트레이닝을 수행하는 단계를 포함하는, 방법
14	14 제 13항에 있어서,상기 네거티브 샘플들을 추출하는 단계는,상기 학습 대상 문서가 상기 제1 도메인에 포함되는 경우 상기 제1 도메인의 워드 빈도에 기초하여 설정되는 노이즈 분포에 따라 상기 네거티브 샘플들을 추출하는 단계; 및상기 학습 대상 문서가 상기 제2 도메인에 포함되는 경우 상기 제2 도메인의 워드 빈도에 기초하여 설정되는 노이즈 분포에 따라 상기 네거티브 샘플들을 추출하는 단계를 포함하는, 방법
15	15 제 1항에 있어서,상기 워드 임베딩 초기값을 설정하는 단계는,상기 문서들에 포함되는 전체 워드들 중 등장 횟수가 미니멈 카운트(minimum count) 이상인 워드들에 대해서만 상기 워드 임베딩 초기값을 설정하는 단계를 포함하는, 방법
16	16 제 9항에 있어서,상기 뉴럴 네트워크는,중심 워드로부터 일정 범위 내에 위치하는 컨텍스트 워드들에 대한 원 핫벡터(one-hot vector)들을 출력하는 입력 레이어;상기 원 핫 벡터들 및 입력 임베딩 행렬에 대한 제1 연산의 결과를 출력하는 히든 레이어; 및상기 제1 연산의 결과 및 출력 임베딩 행렬에 대한 제2 연산의 결과로서 상기 전체 워드들 각각이 상기 중심 워드에 해당할 확률을 출력하는 출력 레이어를 포함하는, 장치


과제고유번호	1345299004
세부과제번호	2016H1A2A1909850
연구과제명	통합적 텍스트 마이닝 방법론 개발을 위한 도메인 적응 기술 적용
성과구분	출원
부처명	교육부
연구관리전문기관명
연구주관기관명	한국연구재단
성과제출연도	2019
연구기간	201603~202102
기여율	0.5
연구개발단계명	기타
6T분류명	IT(정보기술)


과제고유번호	1345311016
세부과제번호	21A20130012638
연구과제명	지속가능 산업 혁신 시스템 사업단
성과구분	출원
부처명	교육부
연구관리전문기관명
연구주관기관명	한국연구재단
성과제출연도	2019
연구기간	201309~202008
기여율	0.5
연구개발단계명	기타
6T분류명	IT(정보기술)

특허성과

[1020190113642]	문서 임베딩을 생성하는 장치 및 방법	새창보기

중요키워드

이전대상기술 뷰 페이지 관련기술 표
[KST2020011193][서울대학교]	원단의 불량 위치 자동 검출 방법 및 이를 위한 시스템	새창보기
[KST2020017350][서울대학교]	순환형 3차원 완전 합성곱망을 활용한 초분광영상의 변화탐지 방법	새창보기
[KST2019011607][서울대학교]	멀티 모달리티 데이터 복원을 위한 심층 개념망 구축 방법 및 그 시스템	새창보기
[KST2015158890][서울대학교]	ｎｃＲＮＡ 서열의 컴퓨터적 동정 방법	새창보기
[KST2023002151][서울대학교]	뉴럴 렌더링을 위한 저정밀도 하드웨어 가속기 및 그 동작 방법	새창보기
[KST2024000097][서울대학교]	차량의 충돌안전 제어로직의 작동원인을 분석하는 시스템 및 그의 동작 방법	새창보기
[KST2023008942][서울대학교]	봉제 불량 자동 검출 방법 및 시스템	새창보기
[KST2022000304][서울대학교]	맞춤형 금융상품 추천 시스템 및 방법	새창보기
[KST2021010865][서울대학교]	지능형 수출시장 정보 분석 및 제공 서비스를 위한 시스템 및 방법	새창보기
[KST2022022187][서울대학교]	합성곱 신경망 특징맵 기반 봉제 스티치 불량 자동 검출 방법 및 시스템	새창보기
[KST2024000063][서울대학교]	소화 기관의 3차원 맵을 생성하는 방법 및 상기 방법을 수행하는 3차원 맵 생성 장치	새창보기
[KST2023002025][서울대학교]	미디어 스트리밍 처리 장치 및 방법	새창보기
[KST2020007521][서울대학교]	GPU 연산 기반의 딥러닝을 이용한 선호 콘텐츠 추천 장치 및 그 방법	새창보기
[KST2015159050][서울대학교]	로봇에 지능 지수를 부여하는 방법	새창보기
[KST2019011823][서울대학교]	이미지에 포함된 객체의 상태를 분류하는 방법 및 분류 장치	새창보기
[KST2021016127][서울대학교]	가속기, 가속기의 동작 방법 및 이를 포함한 가속기 시스템	새창보기
[KST2022002930][서울대학교]	소화 기관의 3차원 맵을 생성하는 방법 및 상기 방법을 수행하는 3차원 맵 생성 장치	새창보기
[KST2022007282][서울대학교]	발화 스타일 인코딩 네트워크 이용한 스타일 음성 합성 장치 및 음성 합성 방법	새창보기
[KST2021011690][서울대학교]	라이다 및 카메라 수집정보 기반 수종탐지 시스템 및 이를 이용한 수종탐지방법, 수종탐지방법을 수행하는 프로그램이 수록된 기록매체	새창보기
[KST2021010204][서울대학교]	AI를 이용한 일회박출량 산출 장치 및 방법	새창보기
[KST2019021868][서울대학교]	출석 확인 시스템 및 방법	새창보기
[KST2021016130][서울대학교]	가속기, 가속기의 동작 방법 및 이를 포함한 가속기 시스템	새창보기
[KST2020016795][서울대학교]	무인항공체로부터 취득된 RGB영상을 이용한 2차원 하천혼합거동 계측 방법	새창보기
[KST2019020950][서울대학교]	딥-러닝을 통한 무선신호 전파 채널 해석을 이용한 실내공간의 구조를 예측하는 방법	새창보기
[KST2023002161][서울대학교]	강화 학습을 사용한 UAV BS 기반의 통신 방법 및 이러한 방법을 수행하는 장치	새창보기
[KST2022007902][서울대학교]	이미지 인식 방법, 이미지 인식 장치, 이미지 전처리 장치 및 뉴럴 네트워크의 학습 방법	새창보기
[KST2020001484][서울대학교]	딥러닝 기반의 실시간 대상 추적 방법 및 시스템	새창보기
[KST2024000128][서울대학교]	기능적 분석 장치 및 방법	새창보기
[KST2022012950][서울대학교]	사운드 기반 다중 기기 운영 모니터링 방법과 이를 위한 시스템	새창보기
[KST2023001967][서울대학교]	합성곱 신경망을 위한 부동소수점 압축이 포함된 캐시	새창보기

의뢰할 수요기술을 선택합니다

담당자명, 주소, 이메일, 연락처, 내용, 파일선택의 정보를 제공하는 도입희망기술 뷰 페이지 의뢰하기 입력표입니다.
담당자명		활동구분※필수입력항목
이메일		연락처	- -
내용
파일선택	파일선택

기술이전 상담신청 드립니다.
기업명
신청자 성명		직책
연락처	- -
이메일	@
상담희망전담센터	※ 사업장(본점) 소재지가 속한 지역의 기술혁신센터를 지정해주세요.