openQuery SE
openQuery SE는 클라우드 환경에 기반한 스마트 정보 검색 솔루션으로써,
검색/색인의 Scale-out이 가능하여 파워풀한 검색성능을 자랑하는 제품으로
Plug-in package를 통한 맞춤 검색서비스를 제공합니다.
엘라스틱 기반의 특화된 기술을 활용해
전문화된 검색서비스를 구현하여
한층 편리해진 검색 환경을 제공합니다.
데이터 분산 저장
뛰어난 분산처리기술로 무중단
서버증설 및 강력한 수평적 확장
한국어 분석
한국어에 최적화된 형태소
분석기로 검색결과에 대한 품질 확보
수치 데이터 활용
별도의 추가 DB 작업 없이
수치데이터의 다양한 분석
오픈쿼리 에스이는 오픈소스를 기반으로
모듈의 추가 및 기능 개선이 빠르게 제공되어
커스터마이징이 용이하며 많은 기능을
손쉽게 업그레이드할 수 있습니다.
엘라스틱 기반의 특화된 기술과 아이브릭스만의
전문화된 검색서비스를 구현하여
사용자의 편의성을
고려한 고품질의 검색결과를 제공합니다.
정보활용 극대화를 위한 고도화된 검색
검색결과의 수치데이터에 대한 다양한 연산 기능
배치작업이 완전히 완료되지 않아도 검색 실행
자체개발 한국어형태소 분석기(KO-BRICK)
탑재(특허보유)
즉각적인 정보제공을 위한 안정적인 서비스
색인과 동시에 검색이 가능한 준실시간
(Near real-time) 색인
100억 건 이상의 대용량 데이터 처리 지원
JSON 구조로 저장되어 모든 필드로의 접근 용이 및
빠른 검색 지원
다양한 환경에서 확장가능한 유연성
필드의 추가 및 삭제가 용이한 Schema-Free 구조
자동 Scale-out으로 수평적 확장 용이
Shard&Replica를 이용한 분산 및 병렬 처리 지원
강력한 퍼포먼스를 제공하는 다양한 부가기능들의
추가/선택으로
고객사의 니즈에 부합하는
맞춤형 검색결과를 제시합니다.
색인
필드의 추가 및 삭제가 용이한 Schema-Free 구조
자동 SCALE-OUT으로 수평적 확장 용이
다양한 첨부파일(PDF, DOC, PPT, XLS, HWP 등)에 대한 텍스트 색인
검색
다국어 형태소 분석 지원 (한국어/중국어/영어/일본어)
검색 API를 통해 기본 RANK 및 커스텀 RANK 변경
검색결과 JSON/XML 지원
언어처리
검색결과의 필드에 대한 집계(Aggregation, GroupBy) 기능
사용자, 동의어, 금칙어 사전에 대한 무중단 서비스 적용
사용자 검색어에 대한 상세 통계(Top Query, Zero Query) 제공
검색어 자동추천(초성, 자소, 한영오타) 및 오타교정 추천 기능
부가기능 (테마검색, 추천/연관 키워드, 인기검색어, 내가 찾은 검색어, 결과내 재검색)
클라우드
검색/색인의 Scale-out(Scale Horizontally)이 지원(국내 유일)
검색품질을 보장하는 Localization Package 제품(한글필터, 커넥터, 통합 관리도구 등)
Annual License 체계로의 손쉬운 전환 환경
오픈쿼리 에스이의 최신 동향을 알려드립니다.
사업명 : 행정안전부 국가기록원 기록관리시스템 고도화사업기간 : 2023년 03월 ~ 2023년 08월(2024년 고도화 진행예정)고객사 : 국가기록원적용기관 : 내부시스템(기록관리시스템)사업개요기존 전자기록관리체계를 탈피한 새로운 개념의 전자기록관리 재정의를 위해 국가기록원 기록관리시스템 고도화 사업이 현재 진행중이다. 정부 업무의 클라우드 환경 전환, 빅데이터 처리업무 증가 등 공공부문 기록관리 변화로 전자기록의 생산 환경 변화를 반영한 관리체계 재정립이 필요했다. 표준 전자문서(표준전자문서, 데이터 세트, 웹기록, 소셜미디어 등)의 생산과 보존에 중점을 두고 있는 현재의 전자기록 관리체계·시스템을 다양한 유형의 전자기록을 포괄하는 관리체계·시스템으로의 전환을 위해서는 기 보유 기록물에 대한 색인 작업이 선행되어야 했다. 공공문서이기에 보존성이 높을 뿐만 아니라 현재까지 축적된 엄청난 양의 대용량 데이터에 대한 색인이 이루어져야 했던 만큼 업체선정을 위한 검증이 진행됐고, 아이브릭스가 유일하게 테스트를 완료하여 본 사업에 참여하게 되었다.현재는 1차 사업이 마무리 됐고, 내년 고도화를 위해 준비중에 있다.사업범위대용량 데이터에 대한 색인-기록물 통합검색 제공을 위한 데이터 수집·색인 프로세스 구현-전체 색인, 재색인 시 작업시간 최소화를 위한 프로세스 최적화-전자파일 1억 건에 대한 색인 48시간 소요(시간당 약 200만 건 색인)-다양한 기준(단위과제, 단위과제 카드, 부서 붙임파일 확장자 등)으로 분류통계 색인 수행검색조건 입력 및 결과 표출-DB 조회용 검색조건 입력화면 구현-로그인한 사용자가 작성한 문서, 메모보고의 검색-다양한 목록 결과(기록물 철(단위과제카드), 붙임파일 등) 확인-온나라 및 cRMS DB내에 활용 가능한 모든 데이터에 대한 결과목록 제공-상세 조회 기능(붙임파일 원본 및 PDF 제공, 열람이력 저장, 다음&이전 키보드 이동 지원 등)기대효과-신규 구축하는 '기록물 통합서비스 플랫폼'을 통해 대량 데이터 작업이 필요한 기록관리업무를 수행할 수 있어 대량 문서에 대한 신속한 검색으로 업무효율 개선 및 사용자 만족도 향상-온나라 문서 시스템에서부터 기록관리가 수행될 수 있는 환경 마련으로 업무 비효율성 제거 및 예산의 중복투자 방지-관리체계 재정립으로, 안정적인 운영체계 확보 및 공공부문 기록관리의 효율성&연속성 확보[블로그 바로가기] 행정안전부 국가기록원 기록관리시스템 고도화
사업명 : FSAR 인공지능 통합검색 시스템 개발사업기간 : 2021년 10월 ~ 2022년 10월_1차 2023년 01월 ~ 2024년 12월(진행중)_2차고객사 : 한국수력원자력적용시스템 : 한국수력원자력 FAIR 시스템사업개요원자력발전소는 운영함에 있어 운영 허가 과정에서뿐만 아니라 운영 중에도 설계변경 등의 이슈가 빈번히 발생하기 때문에 이러한 히스토리를 FSAR 문서로 작성해 둔다. FSAR(Final Safety Analysis Report)는 원자력발전소 운영 허가 신청을 위해 원자로 설계, 안전‧해석 결과 등 설계 전반에 대한 분석 내용을 기술한 보고서이다. FSAR 문서 내 내용은 관련 업무를 수행하는 내부 직원들이 해당 변경 사항을 상시 확인할 수 있도록 설계 전반 내용을 문서화하고 문서 내 운영 변경 과정, 실현 상황을 지속적으로 기록‧반영하여 현행화하는 것이 중요하다. 이에 한국수력원자력은 아이브릭스와의 1차 사업 이후 현재 확대개발을 통해 인공지능 기반 검색엔진이 도입된 FAIR 시스템을 개발, 총 14개 발전소의 FSAR 개정 사항에 대한 일관성 있고 체계적인 인허가 관리를 가능하게 하여 내부 직원들의 업무 효율성 향상을 꾀하고 있다.사업범위FSAR 맞춤형 통합검색시스템- 설비명, 설비/자재 번호, 유사 기능위치, 기타 자연어에 대한 자동완성 기능 제공- FSAR 문서 내 설계 도면, 그림의 주요 정보를 OCR을 거쳐 색인/추출한 정보를 검색 결과로 제공- 검색 이력 데이터를 발전소, 부서, 노형, 시간별로 분류한 검색 현황 제공- 원자력발전소 운영 업무에 사용되는 동의어/유사어/약어 등의 용어 사전 구축TA를 통한 문서 활용- 사용자가 문서 작성 시 참고할 수 있도록 FSAR 문서 외, 과거 문서(구매스펙문서, 설계제안서, 설계변경서 등)와 의 기능위치 간 유사도 분석을 통해 기능별 적합한 내용 추천(유사 결과 리스트 및 자동완성)- 인허가 질의서(HWP, PDF 등) 내 텍스트 데이터를 추출하여 생성된 학습모델을 기반으로 한 인허가 질의 표준 응답 분류- 완료된 설계변경 관련 문서의 데이터(정형/비정형) 정보를 목록화하여 신규 설계변경 문서의 인허가 여부에 필요한 근거 자료(과거 히스토리) 제공기대효과- 운영 중 발생하는 개정 사항에 대한 FSAR 문서를 FAIR 시스템에 지속적으로 반영‧관리하여 내부 직원의 FSAR 활용성 증대- 체계적인 FSAR 형상 관리를 통해 인허가 누락 및 법 위반 예방- FSAR 및 인허가 관련 문서 활용을 통한 검색 결과 제공으로 현재 유사 상황에 대한 해결 방안 도출[블로그 바로가기] 한국수력원자력 FSAR 인공지능 통합검색시스템 개발
사업명 : 국회도서관 국회회의록 데이터셋 검색 서비스사업기간 : 2021년 09월 ~ 2022년 12월_1차 2021년 07월 ~ 2023년 01월_2차고객사 : 국회도서관적용사이트 : 국회회의록 빅데이터 홈페이지사업개요국회회의록 빅데이터는 2021년 오픈하여 제16대에서 제21대까지의 국회회의록 원문을 각 의원별 발언 단위로 분리해 제공하고 있으며 발언 내용을 분석해 시각화된 데이터도 함께 제공한다. 하지만 형태소 분석 오류와 유지보수 이슈로 인해 양질의 회의록 데이터셋을 효과적으로 검색해 주지 못했다. 이에 2021년, 국회회의록 빅데이터 서비스의 클라우드 전환과 함께 아이브릭스의 검색 솔루션을 도입하여 공공데이터 활용에 최적화된 검색 환경을 구축, 현재까지 국회의원 의정 활동 분석 및 입법 지원을 위한 원활한 서비스를 제공하고 있다.국회회의록 빅데이터란?약 2만 건의 국회회의록 원문을 의원별 발언 단위로 구분하여 데이터셋으로 구축해 제공하고 발언자, 키워드 등으로 쉽게 검색 및 활용할 수 있도록 의원별 발언 내용을 분석하여 시각화된 데이터를 제공하는 사이트사업개요사용성에 기반한 통합 검색 서비스-카테고리별(발언자/회의록/법률‧조례/발언‧키워드) 검색어 자동완성-데이터 특성에 맞는 검색 조건(회의 명/안건/발언자/발언 내용/법률 명) 선택 및 입력을 통한 상세 검색 지원-검색 결과에 대한 재설정 범위 세분화(대수/회의 구분/위원회 구분/연도/회수/발언자)-원하는 정보 검색에 적합한 정렬 기능(정확도 순/회의일자 순/대수 순/회의구분 순/회의수 순)-발언자 선택 시 회의록 내용 중 해당 검색어 부분을 대화뷰로 제공대용량 국회회의록 데이터 분석-발언 카테고리 내 검색 키워드가 포함된 주요 발언 문장을 발췌하여 내용 미리보기 지원-발언자 카테고리 내 검색 키워드 관련 정보가 요약된 통계 데이터 가공 및 제공 (연도별 발언‧회의록 수/구분별 회의록 수)-회의록 카테고리 내 회의록 별 워드클라우드 제공을 위한 회의록 핵심 키워드 데이터 추출-검색 결과 상세페이지에서 주요 발언 관련 시각화를 위한 데이터 가공 및 제공 (전체 발언 키워드/전체 회의 구분별 발언 회의록 수/안건 내 법률 리스트)기대효과-공공데이터(국회/지방의회 회의록 데이터)의 접근성 향상으로 국민의 알 권리 보장 및 의정 활동 분석/입법지원을 위한 지식 정보 활용성 증대-지속적으로 증가하는 대량의 회의록 데이터에 대한 검색 품질 향상 및 안정적인 검색 서비스 제공으로 공공데이터에 대한 빠른 탐색 여정 확보[블로그 바로가기] 국회도서관 국회회의록 데이터셋 검색 서비스
openQuerySE V2.0 GS인증 1등급 획득