1 |
1
역합성 예측 모델의 학습 방법에 있어서,생성물의 제1 그래프 정보에 기초하여 상기 생성물의 제1 문자열 정보에서 제1 어텐션 정보(attention information)를 판단하고, 판단 결과에 기초하여 상기 제1 문자열 정보를 인코딩하는 단계;상기 제1 그래프 정보 및 반응물의 제2 그래프 정보에서 제2 어텐션 정보를 판단하고, 판단 결과에 기초하여 상기 반응물의 제2 문자열 정보를 디코딩하는 단계; 및상기 제2 문자열 정보의 디코딩 결과에 기초하여 상기 역합성 예측 모델을 학습시키는 단계;를 포함하는 방법
|
2 |
2
제1항에 있어서,상기 제1 문자열 정보를 인코딩하는 단계는상기 제1 문자열 정보 및 상기 제1 그래프 정보를 수신하는 단계;상기 제1 문자열 정보에 포함된 토큰들 사이의 관련 정도를 나타내는 셀프 어텐션 점수 행렬(self attention score matrix)을 생성하는 단계;상기 제1 그래프 정보에 기초하여 상기 셀프 어텐션 점수 행렬에 마스크를 적용하는 단계;상기 마스크가 적용된 셀프 어텐션 점수 행렬에 기초하여 상기 제1 문자열 정보에 포함된 토큰들 각각의 어텐션 정도를 확률로 나타내는 셀프 어텐션 행렬(self attention matrix)을 생성하는 단계; 및상기 셀프 어텐션 행렬에 기초하여 인코딩된 제1 출력 시퀀스를 출력하는 단계;를 포함하는 방법
|
3 |
3
제2항에 있어서,상기 셀프 어텐션 행렬을 생성하는 단계는상기 제1 문자열 정보로부터 쿼리(query), 키(key) 및 밸류(value)를 획득하는 단계; 및상기 쿼리, 키 및 밸류에 기초하여 상기 셀프 어텐션 행렬을 생성하는 단계;를 포함하는 방법
|
4 |
4
제2항에 있어서,상기 마스크를 적용하는 단계는상기 제1 그래프 정보 및 기 설정된 기준 거리에 기초하여 제1 마스크 행렬을 생성하는 단계; 및상기 제1 마스크 행렬에 기초하여, 상기 셀프 어텐션 점수 행렬에서 상기 제1 문자열 정보의 인코딩 시 어텐션 해야할 요소들(elements)을 판단하고, 상기 판단 결과에 기초하여 마스크가 적용된 셀프 어텐션 점수 행렬을 출력하는 단계;를 포함하는 방법
|
5 |
5
제4항에 있어서,상기 제1 마스크 행렬을 생성하는 단계는상기 제1 그래프 정보에 포함된 노드들 중에서 어느 하나의 노드를 기준 노드로 설정하는 단계; 및상기 기준 노드 및 상기 기준 노드를 중심으로 상기 기준 거리만큼 떨어진 거리에 존재하는 인접 노드들을 “1”로 표현하고, 나머지 노드들을 “0”으로 표현하는 단계;를 포함하는 방법
|
6 |
6
제1항에 있어서,상기 제2 문자열 정보를 디코딩하는 단계는상기 제2 문자열 정보 및 상기 제2 그래프 정보를 수신하는 단계;상기 제1 문자열 정보에 포함된 토큰들과 상기 제2 문자열 정보에 포함된 토큰들 사이의 관련 정도를 확률로 나타내는 교차 어텐션 행렬(cross attention matrix)을 생성하는 단계;상기 생성물에 포함된 원자와 상기 반응물에 포함된 원자 사이의 관계를 나타내는 원자 맵핑 정보(atom mapping)에 기초하여 상기 교차 어텐션 행렬에 마스크를 적용하는 단계; 및상기 마스크가 적용된 교차 어텐션 행렬에 기초하여 디코딩된 제2 출력 시퀀스를 출력하는 단계;를 포함하는 방법
|
7 |
7
제6항에 있어서,상기 교차 어텐션 행렬을 생성하는 단계는상기 제1 문자열 정보부터 키 및 밸류를 획득하는 단계;상기 제2 문자열 정보로부터 쿼리를 획득하는 단계; 및상기 쿼리, 키 및 밸류에 기초하여 상기 교차 어텐션 행렬을 생성하는 단계;를 포함하는 방법
|
8 |
8
제6항에 있어서,상기 마스크를 적용하는 단계는제1 그래프 정보 및 제2 그래프 정보에 기초하여 상기 원자 맵핑 정보를 획득하는 단계;상기 원자 맵핑 정보에 기초하여 상기 생성물에 포함된 원자들과 상기 반응물에 포함된 원자들 각각의 대응 여부를 판단하고, 상기 판단 결과에 기초하여 제2 마스크 행렬을 생성하는 단계; 및상기 제2 마스크 행렬에 기초하여 상기 교차 어텐션 행렬에서 상기 역합성 예측 모델의 어텐션 손실(attention loss) 계산 시 어텐션해야할 요소들을 판단하고, 상기 판단 결과에 기초하여 마스크가 적용된 교차 어텐션 행렬을 출력하는 단계;를 포함하는 방법
|
9 |
9
제8항에 있어서,상기 제2 마스크 행렬을 생성하는 단계는상기 제1 그래프 정보에 포함된 노드들 중에서 어느 하나의 노드를 기준 노드로 설정하는 단계; 및상기 제2 그래프 정보에 포함된 노드들 중에서 상기 기준 노드에 대응되는 노드를 “1”로 표현하고, 나머지 노드들을 “0”으로 표현하는 단계;를 포함하는 방법
|
10 |
10
제8항에 있어서,상기 역합성 예측 모델을 학습시키는 단계는상기 마스크가 적용된 교차 어텐션 행렬로부터 상기 역합성 예측 모델의 어텐션 손실을 획득하는 단계;상기 제2 출력 시퀀스로부터 상기 역합성 예측 모델의 교차 엔트로피(cross entropy) 손실을 획득하는 단계; 및상기 어텐션 손실 및 상기 교차 엔트로피 손실에 기초하여 상기 역합성 예측 모델을 학습시키는 단계;를 포함하는 방법
|
11 |
11
제10항에 있어서,상기 어텐션 손실은 매개 변수에 의해 조정 가능한 방법
|
12 |
12
제1항에 있어서,상기 제1 문자열 정보 및 상기 제2 문자열 정보는SMILES(Simplified Molecular-Input Line-Entry System) 코드 형태인 방법
|
13 |
13
제1항에 있어서,상기 제1 그래프 정보 및 상기 제2 그래프 정보는적어도 하나의 노드(node) 및 적어도 하나의 엣지(edge)를 포함하고,상기 노드는 상기 생성물 또는 상기 반응물의 원자에 대한 정보를 포함하고,상기 엣지는 상기 원자의 연결 관계에 대한 정보를 포함하는 방법
|
14 |
14
제1항의 방법을 컴퓨터에서 실행하기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체
|
15 |
15
역합성 예측 모델을 이용하여 반응 생성물을 예측하는 장치에 있어서,적어도 하나의 프로그램이 저장된 메모리; 및상기 적어도 하나의 프로그램을 실행하는 프로세서를 포함하고,상기 프로세서는생성물의 제1 그래프 정보에 기초하여 상기 생성물의 제1 문자열 정보에서 제1 어텐션 정보(attention information)를 판단하고, 판단 결과에 기초하여 상기 제1 문자열 정보를 인코딩하고,상기 제1 그래프 정보 및 반응물의 제2 그래프 정보에서 제2 어텐션 정보를 판단하고, 판단 결과에 기초하여 상기 반응물의 제2 문자열 정보를 디코딩하고,상기 제2 문자열 정보의 디코딩 결과에 기초하여 상기 역합성 예측 모델을 학습시키는 장치
|