DFSearch
문서 인덱싱 · 고속 키워드/패턴 검색

대량의 문서에서도 필요한 키워드를 즉시 찾을 수 있도록 인덱스를 생성하고, 다중 키워드 AND 조합 및 정규식 기반 패턴 검색을 지원합니다.

핵심 가치

즉시성

사전 인덱싱으로 대량 문서에서도 검색 지연을 최소화.

정확도

여러 키워드의 AND 조합, 구문·패턴 검색으로 목표 결과 집중.

유연성

정규식(Regex)으로 복잡한 패턴도 탐지.

확장성

케이스/프로젝트 단위 인덱스 관리와 증분 업데이트 구성.

운영 편의

워치 폴더/스케줄 인덱싱(옵션)으로 운영 자동화.

리포팅

검색 결과 내보내기 및 근거 문맥 스니펫 제공.

주요 기능

  • 인덱스 생성: 문서에서 텍스트 추출 후 토큰화·색인.
  • 고급 검색: 키워드 AND 조합, 정규식 기반 패턴 검색.
  • 문맥 스니펫: 히트 주변 문맥을 함께 표시.
  • 필터: 경로/파일 유형/기간 등 메타 필터(구성 가능).
  • 대량 처리: 대규모 폴더/이미지 내 문서 일괄 색인.
  • API: 외부 사건관리/포렌식 도구 연동(옵션).

인덱싱/검색 방식

인덱싱 파이프라인

  1. 문서 수집: 지정 폴더/이미지에서 대상 파일 탐색
  2. 텍스트 추출: 포맷별 파서로 텍스트/메타데이터 추출
  3. 토큰화/정규화: 불용어 처리, 기본형 정규화(구성 가능)
  4. 색인 생성: 역색인 구조로 저장, 증분 업데이트

검색 질의

  • 단어/구문 검색: ""문자열""
  • 다중 키워드 AND: alpha AND beta
  • 정규식 패턴: /\b[A-Z]{2}\d{4}\b/
  • 필터 결합: path:.pdf AND (alpha OR beta) (예시)

권장 워크플로

1. 소스 지정

증거 이미지/폴더를 등록하고 인덱싱 규칙 선택.

2. 인덱싱

초기 색인 생성 후 주기적 증분 업데이트 구성.

3. 검색/필터

키워드·정규식 질의와 메타 필터를 조합.

4. 내보내기

히트 목록/스니펫/경로를 보고서로 출력.

FAQ

여러 키워드를 동시에 검색할 수 있나요?

가능합니다. 키워드 AND 조합을 지원합니다.

정규식(Regex) 검색을 지원하나요?

예. 패턴 기반 탐지가 가능합니다.

지원 문서 포맷은?

일반 문서·메일·PDF 등 텍스트 추출이 가능한 포맷을 대상으로 색인/검색이 가능합니다. 필요 시 대상 포맷을 확장합니다.

상담/도입 문의

데모와 PoC 환경을 통해 실제 데이터로 성능을 확인하실 수 있습니다.

전화

한국내; 042-863-6630

한국외; +82-42-863-6630

체크리스트

  • 대상 문서 위치/규모
  • 필요 검색 규칙(키워드/정규식)
  • 보고/내보내기 형식