딥러닝 모델 기반 수온 예측 어디까지 왔나
딥러닝 모델 기반 수온 예측 어디까지 왔나
  • 양현 한국해양과학기술원 해양위성센터 연구원
  • 승인 2022.01.07 08:38
  • 댓글 0
이 기사를 공유합니다

양현 한국해양과학기술원 해양위성센터 연구원
양현 한국해양과학기술원 해양위성센터 연구원

[현대해양] 양식업은 이상수온, 적조, 저염분수 등의 해양재해에 어떻게 대응하는가에 따라 성패가 좌우된다. 최근 이러한 해양재해 중에서 양식업에 가장 많은 피해를 입히고 있는 것은 단연 이상수온 현상이다. 지난 2018년에는 이상수온 현상으로 인해 600억 원이 넘는 피해가 발생한 바 있다. 대표적인 이상수온 현상으로는 고수온과 냉수대가 있다.

해양수산부에서 정의하고 있는 고수온은 28℃ 이상의 수온을 의미하며, 수온 28℃ 도달 시 주의보를 발령하고, 주의보가 3일 이상 지속될 경우 경보를 발령하고 있다. 참고로 해양폭염(Marine Heatwave)이라는 용어가 세계적으로 쓰인다. 이는 짧은 기간 동안 바다 혹은 해양의 온도가 평년 대비 비정상적으로 상승하는 것을 의미하는 것으로 해양수산부의 고수온 정의와는 일부 차이를 보인다. 고수온 현상은 산소부족, 생리기능 저하, 면역력 약화 등 어류의 성장과 생존에 영향을 줄 수 있으며, 심할 경우 집단 폐사를 발생시킬 수 있다.

냉수대는 주변 해역보다 수온이 5℃ 이상 차가운 해수가 출현하는 것을 의미하며, 해양수산부는 냉수대의 영역이 확장되거나 변동이 감지될 경우 경보를 발령한다. 우리나라 동해 연안에서 주로 발생하는 냉수대는 고수온의 경우와 마찬가지로 급격한 온도변화로 인해 어류의 성장과 생존에 영향을 줄 수 있다.

고수온 및 냉수대는 사전에 예측해 회피하는 것이 가장 효과적이지만, 매번 사후에 발견하거나 늦은 대응으로 피해가 가중되고 있다. 이와 같은 문제점을 해결하기 위해 최근 딥러닝 기술을 이용하여 수온을 예측하는 연구가 활발히 진행되고 있다.

 

딥러닝이란?

사람이 하는 일을 기계가 대신할 수 있도록 자동화하는 모든 것을 인공지능(AI)이라고 한다. 인공지능 중에서도 프로그래밍 없이 기계가 주어진 데이터로부터 패턴을 스스로 학습하여 의사결정을 하는 것을 기계학습이라고 한다. 이러한 기계학습은 다시 지도학습, 비지도학습, 강화학습으로 나누어질 수 있는데, 딥러닝은 지도학습의 한 종류로, 비정형데이터로부터 특징 추출이 가능한 인공신경망 기반의 모델을 말한다. 인공신경망은 인간의 두뇌를 모방하여 뇌 신경세포 구조를 수학적으로 모델링하여 학습하는데, 인간의 뉴런이 수상돌기를 통해 여러 개의 시그널을 받고 이 시그널이 복합적으로 계산되어 한가지의 시그널로 만들어진 후 축색돌기를 통해 다른 뉴런으로 전달되는 것을 퍼셉트론으로 구현한 것이다. 이때 퍼셉트론의 입력층과 출력층에 은닉층이 2개 이상인 신경망을 심층 신경망이라고 하며, 이러한 심층 신경망을 학습시킨다고 하여 딥러닝이라 부르게 되었다.

최근 각광받고 있는 딥러닝 기술로는 크게 합성곱신경망(Convolutional Neural Network:CNN), 생성적 적대 신경망(Generative Adversarial Network:GAN), 장단기 메모리(Long Short-Term Memory:LSTM) 등이 있다. 합성곱신경망은 2차원 영상 데이터의 공간적/지역적 특징을 학습하여 영상 내 특정 객체를 인식하는 데 활용되는 딥러닝 기술로, 해양 분야에서는 위성 혹은 항공 사진으로 획득한 2차원 영상 데이터로부터 해양재해를 검출해내는데 활용될 수 있다.

생성적 적대 신경망은 생성자(Generator)와 구분자(Dis-criminator)가 서로 경쟁하며 진짜 같은 가짜 데이터를 생성해내는 딥러닝 기술로, 해양 분야에서는 부이(Buoy) 데이터의 결측 부분 혹은 해양위성데이터의 구름으로 가려진 부분 등을 채워 넣는데 활용될 수 있다.

장단기 메모리는 순환 신경망의 한 종류로 시계열 정보를 예측하는 데 활용되는 딥러닝 기술로, 해양 분야에서는 수온 등을 예측하는 데 활용될 수 있다.

 

장단기 메모리(LSTM) 기반 수온 예측 방법

본래 장단기 메모리 딥러닝 모델은 언어처리 분야에서 많이 사용됐다. 예를 들어, 우리가 모바일로 채팅을 하거나 메시지를 보낼 때 “안녕하”까지만 입력하면 “세요”, 혹은 “십니까”를 예측하여 출력으로 추천해 주는 것이다. 이때, 앞서 예를 들었던 언어 대신에 지난 일주일 전부터 오늘까지의 수온 시계열 데이터를 입력하면 내일 혹은 모레의 수온 데이터를 출력으로 예측할 수 있지 않을까 하는 아이디어가 장단기 메모리 기반 수온 예측 연구의 시작이었다.

장단기 메모리 기반 수온 예측 모델을 만들기 위해서는 수년 이상의 수온 시계열 데이터가 필요하다. 시계열 데이터란 일정한 시간 간격으로 나열되는 데이터를 말하며, 그 시간 간격이 1시간 일수도 있고 1일 일수도 있다. 이러한 데이터를 딥러닝 분야에서는 지도학습 모델을 학습(Train)시키는데 사용된다고 하여 트레이닝(Training) 데이터라고 한다. 트레이닝 데이터는 입력-출력 쌍으로 준비되어야 한다. 이와 같은 쌍을 만드는 작업을 입력 데이터에 대한 정답(출력)을 붙여 놓는다고 하여 레이블링(Labeling)이라고 한다. 딥러닝 모델은 주어진 트레이닝 데이터를 통해서 입력 데이터가 들어왔을 때 그에 대응하는 정답으로 출력 데이터를 도출하도록 수만 번 혹은 수십만 번 이상 학습된다. 이렇게 학습이 완료된 딥러닝 모델에 트레이닝 데이터에 없는, 즉 정답을 모르는 입력 데이터를 넣으면 그에 대한 출력이 예측되는 것이다.

위와 같은 방식을 수온 예측에 적용해 보자. 먼저 주어진 수온 시계열 트레이닝 데이터에 레이블링을 한다. 예를 들면, 트레이닝 데이터의 범위가 2011년 1월 1일부터 2021년 12월 31일까지 매일 정오의 수온 데이터라고 할 때, 임의의 [입력]-[출력] 쌍을 [2007년 8월 2일부터 2007년 8월 9일까지의 수온 데이터]-[2007년 8월 10일의 수온 데이터]로 레이블링 할 수 있다. 트레이닝 데이터 범위 내에서 이러한 레이블링을 랜덤으로 수십만 개를 만들어 장단기 메모리 딥러닝 모델을 학습한다. 그럼, 1일 이후의 수온을 예측하는 모델을 만들 수 있다. 이후 학습된 모델에 [2021년 12월 24일부터 2021년 12월 31일까지의 수온 데이터]를 입력으로 넣으면 트레이닝 데이터에는 없어서 몰랐던 [2022년 1월 1일의 수온 데이터]를 예측해 낼 수 있는 것이다.

위의 방식은 1일 이후의 수온을 예측하는 것이지만, 2일, 3일, 나아가 n일 이후의 수온도 얼마든지 예측할 수 있다. 그러나 쉽게 예상할 수 있듯이 예측 기간이 길어질수록 불확실성도 함께 증가하여 예측 정확도가 낮아진다.

2021년 현재 ECMWF(European Centre for Medium-Range Weather Forecasts) 수온 데이터를 트레이닝 데이터로 학습한 장단기 메모리 기반 수온 예측 모델의 정확도(1-Mean Absolute Percentage Error)는 우리나라 남해(34N/128E) 기준으로 1일 이후 예측 시 약 98%, 7일 이후 예측 시 약 95% 정도의 성능을 보이고 있다.

최근 이루어지고 있는 연구의 방향은, 예측 기간이 지날수록 정확도가 떨어지는 것은 어쩔 수 없으므로 그 떨어지는 폭을 최대한 줄이는 것이다. 이를 달성하기 위해서 수온 데이터뿐만 아니라 바람, 해류, 조류 등 다양한 데이터를 딥러닝 모델의 트레이닝 자료로 활용하는 연구가 진행되고 있다.

 

 


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.