1 |
1
고성능 컴퓨팅 시스템에서 체크포인트 빈도 조절 방법에 있어서,상기 고성능 컴퓨팅 시스템의 시스템 정보 및 오류 발생량을 측정하여 상태 정보를 획득하는 단계;상기 시스템 정보 및 상기 오류 발생량을 이용하여 체크포인트 빈도 점수를 산출하는 단계; 및상기 체크포인트 빈도 점수에 기반하여 체크포인트의 생성 빈도를 조절하는 단계를 포함하며,상기 체크포인트 빈도 점수를 산출하는 단계는 상기 시스템 정보에 관한 사용량 파라미터와 상기 오류 발생량에 관한 오류 발생량 파라미터를 곱하여 상기 체크포인트 빈도 점수를 산출하며,상기 체크포인트의 생성 빈도를 조절하는 단계는 상기 체크포인트 빈도 점수와 최소 체크포인트 생성 주기를 곱하여 상기 체크포인트의 생성 빈도를 산출하는 것을 특징으로 하는 체크포인트 빈도 조절 방법
|
2 |
2
제1항에 있어서,상기 상태 정보를 획득하는 단계는,상기 고성능 컴퓨팅 시스템의 운영체제가 수집한 상기 고성능 컴퓨팅 시스템에 연결된 장치들의 사용량을 응용 프로그램 프로그래밍 인터페이스(Application Programming Interface, API)를 통해 획득하는 것을 특징으로 하는 체크포인트 빈도 조절 방법
|
3 |
3
제1항에 있어서,상기 상태 정보를 획득하는 단계는,상기 고성능 컴퓨팅 시스템에 연결된 장치들의 오류정정 코드(Error Correction Code, ECC)의 발생 횟수를 획득하는 것을 특징으로 하는 체크포인트 빈도 조절 방법
|
4 |
4
삭제
|
5 |
5
제1항에 있어서,상기 체크포인트 빈도 점수를 산출하는 단계는,상기 사용량 파라미터를 상기 고성능 컴퓨팅 시스템에 연결된 장치들의 사용량의 평균을 구한 값을 보정하여 기 설정된 범위 내에서 자연수로 설정되도록 산출하는 것을 특징으로 하는 체크포인트 빈도 조절 방법
|
6 |
6
제1항에 있어서,상기 체크포인트 빈도 점수를 산출하는 단계는,상기 오류 발생량 파라미터를 상기 최소 체크포인트 생성 주기 동안 발생한 오류 발생량과 반비례하며 기 설정된 범위 내에서 자연수로 설정되도록 산출하는 것을 특징으로 하는 체크포인트 빈도 조절 방법
|
7 |
7
제1항에 있어서,상기 체크포인트의 생성 빈도를 조절하는 단계는,상기 고성능 컴퓨팅 시스템에서 동작하는 프로그램, 프로세스, 쓰레드, 명령어, 또는 이들의 조합으로 스코프를 설정하고, 상기 스코프의 실행이 종료되어 메모리에 결과를 저장한 상태에 체크포인트를 생성하는 것을 특징으로 하는 체크포인트 빈도 조절 방법
|
8 |
8
제1항에 있어서,상기 체크포인트의 생성 빈도를 조절하는 단계는,상기 고성능 컴퓨팅 시스템에 연결된 장치들의 사용량이 증가할수록 상기 체크포인트의 생성 빈도를 늘리고, 상기 오류 발생량이 증가할수록 상기 체크포인트의 생성 빈도를 줄이며,상기 고성능 컴퓨팅 시스템에서 중단이 발생하면, 상기 체크포인트의 생성 빈도를 상기 최소 체크포인트 생성 주기로 복원시켰다가 체크포인트를 생성할 때마다 상기 체크포인트의 생성 빈도를 조절하는 것을 특징으로 하는 체크포인트 빈도 조절 방법
|
9 |
9
고성능 컴퓨팅 시스템의 시스템 정보 및 오류 발생량을 측정하여 상태 정보를 획득하는 상태 정보 획득부;상기 시스템 정보 및 상기 오류 발생량을 이용하여 체크포인트 빈도 점수를 산출하는 점수 산출부; 및상기 체크포인트 빈도 점수에 기반하여 체크포인트의 생성 빈도를 조절하는 빈도 조절부를 포함하며,상기 점수 산출부는 상기 시스템 정보에 관한 사용량 파라미터와 상기 오류 발생량에 관한 오류 발생량 파라미터를 곱하여 상기 체크포인트 빈도 점수를 산출하며,상기 빈도 조절부는 상기 체크포인트 빈도 점수와 최소 체크포인트 생성 주기를 곱하여 상기 체크포인트의 생성 빈도를 산출하는 것을 특징으로 하는 체크포인트 빈도 조절 장치
|
10 |
10
제9항에 있어서,상기 상태 정보 획득부는,상기 고성능 컴퓨팅 시스템의 운영체제가 수집한 상기 고성능 컴퓨팅 시스템에 연결된 장치들의 사용량을 응용 프로그램 프로그래밍 인터페이스(Application Programming Interface, API)를 통해 획득하는 것을 특징으로 하는 체크포인트 빈도 조절 장치
|
11 |
11
제9항에 있어서,상기 상태 정보 획득부는,상기 고성능 컴퓨팅 시스템에 연결된 장치들의 오류정정 코드(Error Correction Code, ECC)의 발생 횟수를 획득하는 것을 특징으로 하는 체크포인트 빈도 조절 장치
|
12 |
12
삭제
|
13 |
13
제9항에 있어서,상기 점수 산출부는,상기 사용량 파라미터를 상기 고성능 컴퓨팅 시스템에 연결된 장치들의 사용량의 평균을 구한 값을 보정하여 기 설정된 범위 내에서 자연수로 설정되도록 산출하는 것을 특징으로 하는 체크포인트 빈도 조절 장치
|
14 |
14
제9항에 있어서,상기 점수 산출부는,상기 오류 발생량 파라미터를 상기 최소 체크포인트 생성 주기 동안 발생한 오류 발생량과 반비례하며 기 설정된 범위 내에서 자연수로 설정되도록 산출하는 것을 특징으로 하는 체크포인트 빈도 조절 장치
|
15 |
15
제9항에 있어서,상기 빈도 조절부는,상기 고성능 컴퓨팅 시스템에서 동작하는 프로그램, 프로세스, 쓰레드, 명령어, 또는 이들의 조합으로 스코프를 설정하고, 상기 스코프의 실행이 종료되어 메모리에 결과를 저장한 상태에 체크포인트를 생성하는 것을 특징으로 하는 체크포인트 빈도 조절 장치
|
16 |
16
제9항에 있어서,상기 빈도 조절부는,상기 고성능 컴퓨팅 시스템에 연결된 장치들의 사용량이 증가할수록 상기 체크포인트의 생성 빈도를 늘리고, 상기 오류 발생량이 증가할수록 상기 체크포인트의 생성 빈도를 줄이며,상기 고성능 컴퓨팅 시스템에서 중단이 발생하면, 상기 체크포인트의 생성 빈도를 상기 최소 체크포인트 생성 주기로 복원시켰다가 체크포인트를 생성할 때마다 상기 체크포인트의 생성 빈도를 조절하는 것을 특징으로 하는 체크포인트 빈도 조절 장치
|
17 |
17
프로세서에 의해 실행 가능한 컴퓨터 프로그램 명령어들을 포함하는 비일시적(Non-Transitory) 컴퓨터 판독 가능한 매체에 기록되어 체크포인트 빈도 조절을 위한 컴퓨터 프로그램으로서, 상기 컴퓨터 프로그램 명령어들이 고성능 컴퓨팅 시스템의 적어도 하나의 프로세서에 의해 실행되는 경우에,상기 고성능 컴퓨팅 시스템의 시스템 정보 및 오류 발생량을 측정하여 상태 정보를 획득하는 단계;상기 시스템 정보 및 상기 오류 발생량을 이용하여 체크포인트 빈도 점수를 산출하는 단계; 및상기 체크포인트 빈도 점수에 기반하여 체크포인트의 생성 빈도를 조절하는 단계를 포함한 동작들을 수행하며,상기 체크포인트 빈도 점수를 산출하는 단계는 상기 시스템 정보에 관한 사용량 파라미터와 상기 오류 발생량에 관한 오류 발생량 파라미터를 곱하여 상기 체크포인트 빈도 점수를 산출하며,상기 체크포인트의 생성 빈도를 조절하는 단계는 상기 체크포인트 빈도 점수와 최소 체크포인트 생성 주기를 곱하여 상기 체크포인트의 생성 빈도를 산출하는 것을 특징으로 하는 컴퓨터 프로그램
|