[약업신문][미래의학연구재단 기고10] AI 기반 정밀의료를 가능케 하는 의료 빅데이터의 힘_200522

[약업신문][미래의학연구재단 기고10] AI 기반 정밀의료를 가능케 하는 의료 빅데이터의 힘_200522

[약업신문][미래의학연구재단 기고10] AI 기반 정밀의료를 가능케 하는 의료 빅데이터의 힘_200522


전자신문 정현정 기자

코로나19를 계기로 의료 분야에서 인공지능(AI)의 필요성과 가능성이 다시 한 번 주목받았다. 캐나다 스타트업 블루닷은 항공사 데이터와 동식물 질병 흐름, 언론 보도 등 빅데이터를 분석해 지난해 12월 31일 세계보건기구(WHO) 보다 앞서 코로나19 집단 감염 위험성을 경고했다.

뷰노, 루닛, 메디컬아이피 등 국내 의료 AI 전문기업들은 딥러닝 알고리즘을 통해 흉부 엑스레이나 컴퓨터단층촬영(CT) 영상에서 코로나19 의심 소견을 몇 초 만에 판독해 환자 선별에 도움을 주는 AI 솔루션을 개발해 무료로 배포했다.

분자진단 전문기업인 씨젠은 AI를 활용해 코로나19 진단키트 개발 기간을 2주로 대폭 단축시켰다. 영국 베네볼렌트 AI는 AI를 통해 기존 치료제 가운데 코로나19에 효과가 있을 만한 잠재적 치료제로 바리시티닙을 제시했다. 국내에서도 디어젠이 AI로 코로나19에 적용할 수 있는 치료제 후보군을 발굴하고 아론티어도 AI 기반 신약 후보물질 발굴 연구를 진행 중이다.

이처럼 AI는 질병 예측뿐만 아니라 진단, 치료제와 백신 개발까지 신종 감염병 대응에서 중요한 역할을 하고 있다. 코로나19 대유행 이전부터 이미 의료 영상 판독 분야에서 AI 솔루션을 실제 활용되고 있고 제약 업계도 AI를 활용해 신약 후보 물질 개발에 소요되던 시간과 비용을 단축시키고 있다.

AI를 활용한 데이터 통합 분석 연구에 관심을 갖는 의료진들도 늘고 있다. 궁극적으로 맞춤형 정밀의료를 구현하는데 빅데이터를 기반으로 한 AI가 필수적으로 활약할 것으로 전망된다.

뛰어난 알고리즘 있어도 양질의 데이터 없이는 무용지물

의료 분야에서도 복잡한 의사 결정에 AI의 도움을 받는 사례가 늘고 있는 가운데 많은 전문가들은 가장 필요한 요소로 양질의 데이터를 꼽는다. 기본적으로 학습 데이터가 부족하면 인공지능에 우수한 성능을 기대하기 어렵다. 표준화되고 정제된 데이터가 없다면 양질의 결과물을 얻기 힘들다.

아무리 우수한 AI 딥러닝 알고리즘이 개발된다고 하더라도 양질의 임상데이터가 없으면 무용지물이나 마찬가지다. 의료 빅데이터에 대한 주목도가 더욱 높아진 이유다. 의료 빅데이터 구축과 활용은 넘어야 할 산이 많다.

상급종합병원 조차 실시간으로 생성되는 의료 데이터의 상당 부분을 제대로 활용하지 못하고 버리고 있다. 전자신문 보도에 따르면 한 달에 약 90테라바이트에 달하는 의료 데이터가 생성되지만 이 중 80%가 연구 목적이나 산업 발전 목적으로 사용되지 못하고 버려지는 것으로 나타났다.

예를 들어 중환자실에서는 혈압, 산소포화도, 심박수 등 다양한 모니터링 데이터가 실시간으로 생성되지만 병원정보시스템(HIS)에 5분 단위로만 기록한다면 자료 1개를 볼 때마다 299개 데이터는 저장되지 않고 버려지는 셈이다. 의료 영상 데이터도 병변 위치를 제외한 나머지 부분은 저장되지 않고 삭제되는 경우가 많다.

어딘가 저장되더라도 미리 정의된 데이터 모델이 없는 비정형 데이터들은 연구용으로 사용하기 부적합하다. 전자의무기록(EMR)이나 의료용영상저장전달장치(PACS) 데이터를 산업이나 연구 목적으로 사용하기 위해서는 기록 단계부터 표준화된 형태로 저장해야한다. 현재는 EMR이 표준화되지 않고 병원간 데이터 체계도 다르다보니 다기관 연구에 제약이 따른다.

정제된 데이터가 잘 축적되더라도 이를 산업적 연구를 위해 활용할 수 있는지 여부에 대해서도 아직 혼란스러운 부분이 많다. 지난 1월 국회를 통과한 ‘데이터 3법’(개인정보보호법·신용정보법·정보통신망법) 개정안에 ‘가명정보’ 개념이 도입되면서 의료 분야에서도 가명 처리된 정보를 활용해 다양한 의료 분야 신사업 혁신이 가능해질 것이라는 기대감이 커졌다.

하지만 산업적 활용 가능성이 명확하게 명시되지 않으면서 설왕설래가 이어지고 있다. 당초 수집 목적과 합리적으로 관련된 범위 내에서 정보주체 동의 없이 가명정보를 이용해도 될 지 여부에 대해서도 유권해석이 필요하다. 시행령 개정안이 입법예고된 이후에도 여전히 의료계에서는 모호한 부분이 많다는 점을 지적하고 있다. 상세 시행규칙과 가이드라인이 제시되고 의료관계법과 정리가 이뤄지기 전까지는 혼란이 불가피해보인다.

의료 빅데이터 구축과 안전한 활용 고민해야

의료 빅데이터와 AI를 접목한 정밀의료 구현을 위한 선결조건으로 의료 데이터 표준화와 개인정보를 보호하는 안전한 활용 방안 마련이 시급한 과제로 꼽힌다. 정부와 의료계에서도 의료 빅데이터 구축과 활용을 위한 다양한 노력을 시작했다.

병원 차원에서는 임상데이터, 유전체데이터, 영상데이터, 공공데이터 등 데이터 도메인별로 데이터를 수집할 수 있는 체계를 만들어야 한다. 최근 각 병원마다 빅데이터연구센터가 출범해 비정형 데이터를 정제하고 비식별화 한 후 플랫폼에 저장해 쓸모있는 의료 빅데이터로 만드는 작업을 시작하고 있다.

데이터가 생성되는 EMR 단계부터 공통데이터모델(CDM)로 구축해 표준화하려는 노력도 이뤄지고 있다. 정부는 EMR 인증제를 통해 표준화 문제에 접근하고 있다. 또 세계 80여개국에서 활용되고 있는 표준 임상용어 체계 ‘스노메드씨티’(SNOMED CT) 라이선스를 구매 예산을 확보하고 의료계에 공급할 예정이다.

국가전략프로젝트로 추진되는 병원정보시스템인 정밀의료병원정보시스템(P-HIS)이나 국립암센터 주도로 10개 병원이 참여하는 다기관 암 빅데이터 분석 플랫폼 ‘CONNECT’ 등 공동 플랫폼 구축 시도도 진행된다.

빅데이터 기반 연구가 활발해지면 데이터를 안전하게 수집, 보관하는 방법에도 관심이 높아진다. 환자 데이터를 활용하는 과정에서 개인정보보호법 등 규제에 저촉되지 않는지도 중요한 이슈다.

보건복지부는 8월 데이터 3법 개정안 시행을 앞두고 의료 부문에 특화된 가이드라인을 내놓을 예정이다. 의료계에서도 데이터 3법 개정안 시행 이후 데이터 활용과 이동이 좀 더 자유로워질 것으로 기대하며 발표될 가이드라인에 맞춰 비식별 조치를 준비하고 있다. 공공데이터를 활용한 연구가 우선적으로 활발하게 진행될 수 있을 것으로 보인다.

임상데이터와 유전체데이터가 플랫폼에 모이고 각종 사물인터넷(IoT) 기기나 웨어러블 기기를 통해 수집된 라이프로그가 결합된 통합 빅데이터가 구축되면 활용도가 더욱 높아질 것으로 보인다. 이를 기반으로 AI가 의사 결정을 돕는다면 맞춤형 정밀의료에 한 걸음 다가갈 수 있다.

법적으로 가명정보의 산업적 이용을 위한 기반이 갖춰지고 상호운용성이 전제된다면 보다 많은 활용 방향이 열릴 수 있다. 정밀의료와 AI 기술 개발을 위해 의료 데이터 표준화와 개인정보를 보호하는 안전한 활용 방안 마련이 시급하다. 데이터를 표준화하고 관리해 유의미한 데이터로 만드는 것은 각 의료기관이 해야 할 과제다.

구축된 빅데이터가 잘 활용될 수 있도록 정부에서는 구체적인 가이드라인을 만들어주는 작업이 필요하다. AI의 활용 가치를 결정하는 의료 빅데이터 품질을 높이기 위한 정부, 의료계, 산업계가 함께 관심을 기울여야 할 때다.

제공 : 재단법인 미래의학연구재단(http://medicalinnovation.or.kr/)

Share this post

댓글 남기기

이메일은 공개되지 않습니다. 필수 입력창은 * 로 표시되어 있습니다