KAIST, 美보다 88배 빠른 세계 최고 'DBMS' 기술 개발

입력 2020-06-23 10:28
  • 가장작게

  • 작게

  • 기본

  • 크게

  • 가장크게

▲김민수 교수(왼쪽 위), 남윤민 박사, 한동형 박사과정(아래) (카이스트 제공)
▲김민수 교수(왼쪽 위), 남윤민 박사, 한동형 박사과정(아래) (카이스트 제공)
▲종래 DBMS들의 질의처리 방식 및이번 기술의 질의처리 방식 개념도 (카이스트 제공)
▲종래 DBMS들의 질의처리 방식 및이번 기술의 질의처리 방식 개념도 (카이스트 제공)

국내 연구진이 방대한 정보를 저장하고 목적에 맞게 검색, 관리할 수 있는 시스템을 통칭하는 데이터베이스관리시스템(DBMS)을 세계 최고 수준의 성능으로 끌어올렸다.

KAIST(한국과학기술원)는 전산학부 김민수 교수 연구팀이 데이터베이스 질의 언어 SQL(구조화 질의어) 처리 성능을 대폭 높인 세계 최고 수준의 DBMS 기술을 개발했다고 23일 밝혔다.

김 교수 연구팀은 데이터 처리를 위해 산업 표준으로 사용되는 SQL 질의를 기존 DBMS와는 전혀 다른 방법으로 처리함으로써 성능을 기존 옴니사이(OmniSci) DBMS 대비 최대 88배나 높인 신기술을 개발했다. 김 교수팀이 개발한 이 기술은 오라클·마이크로소프트 SQL서버·IBM DB2 등 타 DBMS에도 적용할 수 있어 고성능 SQL 질의 처리가 필요한 다양한 곳에 폭넓게 적용될 수 있을 것으로 기대된다.

대부분의 DBMS는 SQL 질의를 처리할 때 내부적으로 데이터 테이블들을 '왼쪽 깊은 이진 트리(left-deep binary tree)' 형태로 배치해 처리하는 방법을 사용한다. 지난 수십년간 상용화된 대부분의 DBMS는 데이터 테이블들의 배치 가능한 가지 수가 기하급수적으로 많기 때문에 이를 '왼쪽 깊은 이진 트리' 형태로 배치해 SQL 질의를 처리해 왔다.

임의의 두 테이블이 기본 키와 외래 키(FK)라 불리는 관계로 결합(조인 연산)하는 경우에는 이러한 방법으로 SQL 질의를 효과적으로 처리할 수 있다. 여기서 기본 키는 각 데이터 행(row)을 유일하게 식별할 수 있는 열(column)이고, 외래 키는 그렇지 않은 열이다.

지난 수십년간 산업에서 사용되는 DB의 구조가 점점 복잡해지면서 두 테이블은 PK-FK 관계가 아닌 FK-FK 관계, 즉 외래 키와 외래 키의 관계로 결합하는 복잡한 형태의 SQL 질의들이 많아지고 있다. 실제 DBMS의 성능을 측정하는 산업 표준 벤치마크인 TPC-DS에서 전체 벤치마크의 26%가 이런 복잡한 SQL 질의들로 구성돼 있고 기계학습(머신러닝), 생물 정보학 등 다양한 분야들서도 이러한 복잡한 SQL 질의 사용이 점차 증가하는 추세다.

이전에 나온 DBMS들은 두 테이블이 주로 PK-FK 관계로 결합한다는 가정하에 개발됐기 때문에 FK-FK 결합이 필요한 복잡한 SQL 질의를 매우 느리거나 심지어 처리하지 못하는 실패를 거듭해왔다.

김 교수팀은 문제 해결을 위해 테이블들을 하나의 커다란 '왼쪽 깊은 이진 트리' 형태가 아닌 여러 개의 작은 '왼쪽 깊은 이진 트리'를 'n항 조인 연산자'로 묶는 형태로 배치해 처리하는 기술을 개발했다. 이때 각각의 '작은 이진 트리' 안에는 FK-FK 결합 관계가 발생하지 않도록 테이블들을 배치하는 것이 핵심이다.

각각의 '작은 이진 트리' 처리 결과물을 'n항 조인 연산자'로 결합해 최종 결과물을 구하는 것도 난제로 꼽히는데 연구팀은 '최악-최적(worst-case optimal) 조인 알고리즘'이라는 방법으로 이 문제를 해결했다.

최악-최적 조인 알고리즘은 그래프 데이터를 처리할 때 이론적으로 가장 우수하다고 알려진 알고리즘이다. 김 교수 연구팀은 세계에서 가장 먼저 이 알고리즘을 SQL 질의 처리에 적용해 난제를 해결하는 데 성공했다.

김 교수 연구팀은 새로 개발한 DBMS 기술을 GPU 기반의 DBMS 개발업체인 미국 옴니사이사 제품에 적용한 결과, 성능이 최대 88배나 향상된 결과를 얻었다. 또, TPC-DS 벤치마크에서도 세계 최고 수준의 성능을 가진 기존의 상용 DBMS보다 5~20배나 더 빠른 사실을 확인했다. TPC-DS는 DBMS의 성능을 측정하기 위한 산업 표준의 최신 벤치마크다.

교신저자로 참여한 김민수 교수는 "연구팀이 개발한 새로운 기술은 대부분의 DBMS에 적용할 수 있기 때문에 산업적 측면에서 파급 효과가 매우 클 것"이라고 기대했다.

이번 연구에는 김 교수의 제자이자 미국 옴니사이사에 재직 중인 남윤민 박사가 제1저자로, 김 교수가 교신저자로 참여했으며 지난 18일 미국 오리건주 포틀랜드에서 열린 데이터베이스 분야 최고의 국제학술대회로 꼽히는 '시그모드(SIGMOD)'에서 발표됐다.

이 연구는 한국연구재단 선도연구센터 사업 및 중견연구자 지원사업, 과기정통부 IITP SW스타랩 사업의 지원을 받아 수행됐다.

  • 좋아요0
  • 화나요0
  • 슬퍼요0
  • 추가취재 원해요0

주요 뉴스

  • 더 우울해진 한국인…10명 중 7명 "정신건강에 문제" [데이터클립]
  • ‘최애의 아이 2기’ 출격…전작의 ‘비밀’ 풀릴까 [해시태그]
  • '바이든 리스크' 비트코인, 5만5000달러로 급락…4개월 만에 최저치 내려앉나 [Bit코인]
  • 현아·용준형 진짜 결혼한다…결혼식 날짜는 10월 11일
  • '우승 확률 60%' KIA, 후반기 시작부터 LG·SSG와 혈투 예고 [주간 KBO 전망대]
  • 맥북 던진 세종대왕?…‘AI 헛소리’ 잡는 이통3사
  • [기회의 땅 아! 프리카] 불꽃튀는 선점 전쟁…G2 이어 글로벌사우스도 참전
  • 국산 신약 37개…‘블록버스터’ 달성은 언제쯤? [목마른 K블록버스터]
  • 오늘의 상승종목

  • 07.08 장종료

실시간 암호화폐 시세

  • 종목
  • 현재가(원)
  • 변동률
    • 비트코인
    • 79,835,000
    • -1.96%
    • 이더리움
    • 4,263,000
    • +0.05%
    • 비트코인 캐시
    • 472,600
    • +4.1%
    • 리플
    • 611
    • +0%
    • 솔라나
    • 196,600
    • +1.13%
    • 에이다
    • 523
    • +3.16%
    • 이오스
    • 728
    • +1.82%
    • 트론
    • 178
    • -0.56%
    • 스텔라루멘
    • 121
    • -1.63%
    • 비트코인에스브이
    • 51,100
    • +0.59%
    • 체인링크
    • 18,420
    • +2.85%
    • 샌드박스
    • 413
    • -0.72%
* 24시간 변동률 기준