1 |
1
분산 스트림 처리 엔진에서의 데이터 스트림 파티셔닝 방법에 있어서, 각 업스트림이 주기적으로 후보 다운스트림들의 태스크 지역성 및 다운스트림 상태를 탐사하는 다운스트림 탐사 단계;각 업스트림이 후보 다운스트림들과의 탐사 소요 시간을 기반으로 각 다운스트림이 선택될 확률 가중치를 계산하는 확률 계산 단계; 및메시지 전송이 필요한 경우, 각 업스트림이 확률 가중치를 기반으로 메시지를 전송할 다운스트림을 확률적으로 선택하는 다운스트림 선택 단계를 포함하며, 상기 다운스트림 탐사 단계에서, 각 업스트림은 각 후보 다운스트림과의 RTT(round-trip time)를 측정하고, 측정한 RTT를 기반으로 각 후보 다운스트림과의 근접도를 계산하고, 상기 확률 계산 단계에서, 각 업스트림은 근접도를 내림차순으로 정렬하고, 정렬된 근접도를 정규화하고, 이를 통해 각 다운스트림이 선택될 확률 가중치를 계산하고, 상기 다운스트림 선택 단계에서, 각 업스트림은 랜덤 넘버를 생성하고, 생성된 랜덤 넘버와 각 다운스트림들의 확률 가중치에 의한 확률 범위를 비교하여, 랜덤 넘버를 포함하는 확률 범위를 갖는 다운스트림을 선택하는 것을 특징으로 하는 데이터 스트림 파티셔닝 방법
|