1 |
1
삭제
|
2 |
2
키워드 정련 장치로서,
대상 문서를 검색하여 읽어오는 데이터 입력부;
상기 문서의 구조를 분석하여, 제목 말뭉치, 본문 말뭉치, 키워드 말뭉치, 적어도 하나의 댓글 말뭉치 중 적어도 두 개의 말뭉치를 추출하는 문서 구조 분석부;
상기 추출된 말뭉치들을 구성하는 각 단어들 간에 링크를 생성하는 링크 생성부;
상기 생성된 링크를 이용해 각 단어들의 중요도를 계산하여 중요도가 낮은 단어를 상기 키워드 말뭉치에서 제거하는 단어 제거부; 및
상기 단어 제거부에 의해 수행된 키워드 정련 결과를 출력하는 결과 출력부를 포함하는 키워드 정련 장치
|
3 |
3
키워드 정련 장치로서,
대상 문서를 검색하여 읽어오는 데이터 입력부;
상기 문서의 구조를 분석하여, 제목 말뭉치, 본문 말뭉치, 키워드 말뭉치, 적어도 하나의 댓글 말뭉치 중 적어도 두 개의 말뭉치를 추출하는 문서 구조 분석부;
상기 추출된 말뭉치들을 구성하는 각 단어들 간에 링크를 생성하는 링크 생성부; 및
상기 생성된 링크를 이용해 각 단어들의 중요도를 계산하여 중요도가 낮은 단어를 상기 키워드 말뭉치에서 제거하는 단어 제거부를 포함하되,
상기 말뭉치는, 상기 제목 말뭉치, 상기 본문 말뭉치, 상기 키워드 말뭉치, 상기 적어도 하나의 댓글 말뭉치를 포함하는, 키워드 정련 장치
|
4 |
4
제3항에 있어서,
상기 키워드 말뭉치는, 평균과 표준편차에 따라 단어의 개수가 정해지는, 키워드 정련 장치
|
5 |
5
제3항에 있어서,
상기 문서 구조 분석부는, 상기 문서의 구조를 분석하여, 상기 제목 말뭉치, 상기 본문 말뭉치, 상기 키워드 키워드, 상기 적어도 하나의 댓글 말뭉치를 추출하는, 키워드 정련 장치
|
6 |
6
제5항에 있어서,
상기 링크 생성부는, 하위 댓글 말뭉치에서 상위 댓글 말뭉치로, 상하위 댓글 말뭉치에서 상기 제목 말뭉치로, 상기 상하위 댓글 말뭉치에서 상기 본문 말뭉치로, 상기 상하위 댓글 말뭉치에서 상기 키워드 말뭉치로 각각 단어의 링크를 생성하는, 키워드 정련 장치
|
7 |
7
제2항 내지 제6항 중 어느 한 항에 있어서,
상기 단어 제거부는, 하기의 TextRank 알고리즘을 이용하여 단어의 중요도를 계산하는, 키워드 정련 장치
|
8 |
8
제7항에 있어서,
상기 단어 제거부는, 중요도가 낮은 단어를 상기 키워드 말뭉치에서 제거함에 있어서, 신뢰도 구간을 설정하여 신뢰도 구간을 벗어나는 단어를 제거하는 키워드 정련 장치
|
9 |
9
제2항 내지 제6항 중 어느 한 항의 키워드 정련 장치에 의해 키워드 정련된 컨텐츠를 저장하는 검색 DB; 및
검색 요청에 따라 해당 컨텐츠를 검색하여 제공하는 컨텐츠 검색부를 포함하는 컨텐츠 검색 시스템
|
10 |
10
삭제
|
11 |
11
키워드 정련 방법으로서,
a) 대상 문서를 검색하여 읽어오는 단계;
(b) 상기 문서의 구조를 분석하여, 제목 말뭉치, 본문 말뭉치, 키워드 말뭉치, 적어도 하나의 댓글 말뭉치 중 적어도 두 개의 말뭉치를 추출하는 단계;
(c) 상기 추출된 말뭉치들을 구성하는 각 단어들 간에 링크를 생성하는 단계;
(d) 상기 생성된 링크를 이용해 각 단어들의 중요도를 계산하여 중요도가 낮은 단어를 상기 키워드 말뭉치에서 제거하는 단계; 및
(e) 상기 (d) 단계에서 수행된 키워드 정련 결과를 출력하는 단계를 포함하는 키워드 정련 방법
|
12 |
12
키워드 정련 방법으로서,
a) 대상 문서를 검색하여 읽어오는 단계;
(b) 상기 문서의 구조를 분석하여, 제목 말뭉치, 본문 말뭉치, 키워드 말뭉치, 적어도 하나의 댓글 말뭉치 중 적어도 두 개의 말뭉치를 추출하는 단계;
(c) 상기 추출된 말뭉치들을 구성하는 각 단어들 간에 링크를 생성하는 단계; 및
(d) 상기 생성된 링크를 이용해 각 단어들의 중요도를 계산하여 중요도가 낮은 단어를 상기 키워드 말뭉치에서 제거하는 단계를 포함하되,
상기 말뭉치는, 상기 제목 말뭉치, 상기 본문 말뭉치, 상기 키워드 말뭉치, 상기 적어도 하나의 댓글 말뭉치를 포함하고,
상기 키워드 말뭉치는, 평균과 표준편차에 따라 단어의 개수가 정해지는, 키워드 정련 방법
|
13 |
13
제12항에 있어서,
상기 (b) 단계에서, 상기 문서의 구조를 분석하여, 상기 제목 말뭉치, 상기 본문 말뭉치, 상기 키워드 키워드, 상기 적어도 하나의 댓글 말뭉치를 추출하는, 키워드 정련 방법
|
14 |
14
제13항에 있어서,
상기 (c) 단계에서, 하위 댓글 말뭉치에서 상위 댓글 말뭉치로, 상하위 댓글 말뭉치에서 상기 제목 말뭉치로, 상기 상하위 댓글 말뭉치에서 상기 본문 말뭉치로, 상기 상하위 댓글 말뭉치에서 상기 키워드 말뭉치로 각각 단어의 링크를 생성하는, 키워드 정련 방법
|
15 |
15
제11항 내지 제14항 중 어느 한 항에 있어서,
상기 (d) 단계에서, 하기의 TextRank 알고리즘을 이용하여 단어의 중요도를 계산하는, 키워드 정련 방법
|
16 |
16
제11항 내지 제14항 중 어느 한 항의 키워드 정련 방법에 의해 키워드 정련된 컨텐츠를 저장하는 단계; 및
검색 요청에 따라 해당 컨텐츠를 검색하여 제공하는 단계를 포함하는 컨텐츠 검색 방법
|