AI 초보도 이해할 수 있는 딥러닝과 머신러닝의 차이점 – 알고리즘부터 사례까지

AI 초보도 이해할 수 있는 머신러닝과 딥러닝의 차이점 – 알고리즘부터 사례까지

(출처 = 인공지능신문)

챗봇, 자율 주행 자동차 등 인공지능(AI)이 우리 생활의 다양한 분야에서 활용되면서 딥러닝(Deep Learning)과 머신러닝(Machine Learning)이라는 말이 자주 등장하고 있습니다. 

목적과 환경에 따라서 필요한 기술이 달라지기 때문에, 기본적인 개념을 잘 이해한다면 인공지능(AI)를 활용하는데 더욱 유용합니다.

목차

딥러닝(Deep Learning) 뜻

: 머신러닝의 한 종류로 인간의 뇌 신경망 구조를 모방한 인공신경망(Artificial Neural Network, ANN)을 이용하여 데이터를 학습하는 방식입니다. 패턴을 찾아내고 이미지, 음성, 자연어 처리와 같은 복잡하는 데이터를 분석하는데 뛰어난 능력 지녔습니다.

딥러닝의 가장 큰 특징은 여러 레이어로 구성된 신경망을 사용합니다. 레이어가 많고 깊을수록 더욱 정교하고 복잡한 문제를 해결할 수 있습니다. 그래서 DEEP 이라는 이름을 갖게됐습니다.

딥러닝을 사용하면, 컴퓨터가 많은 이미지를 학습하고 그 속에서 아기, 아저씨, 할머니 등 다양한 대상들을 구분할 수 있습니다. 딥러닝을 활용한 사례로는 자율주행 자동차의 인식 시스템, 음성 인식 기술 등이 있습니다. 대표적인 모델은 컨볼루션 신경망(CNN)과 순환 신경망(RNN) 등이 있습니다.

머신러닝(Machine Learning) 뜻

: 컴퓨터가 데이터를 학습해서 스스로 패턴을 찾아 결론을 도출하는 기술을 뜻합니다.

사람이 명령하지 않거나 별도 프로그래밍 없이도, 컴퓨터가 스스로 데이터를 분석하고 규칙을 만들어내 어떠한 결정을 하거나 예측을 할 수 있게합니다.

ZENET KOREA

머신러닝 딥러닝 차이

딥러닝과 머신러닝 두가지 다 데이터를 학습하고 결과를 도출해내는 인공지능 기술이지만, 방식과 구조에 차이가 있습니다.

두 기술의 가장 큰 차이점은 학습 방식입니다. 딥러닝은 기술을 더 깊고 정교하게 배우는 것이고 머신러닝은 컴퓨터가 스스로 배우는 기술입니다.

특징을 추출하는 방식이 다릅니다.

예를들어 사진속에 아기가 있는지 없는지를 확인할 수 있는 프로그램을 만든다고 가정해보면, 기존 방법으로는 사람이 프로그램에 아기의 특징을 직접 정해주고, 코드로 작성해야 했습니다. 하지만 머신러닝을 활용하면, 인공신경망을 활용해 수 많은 전세계 아기의 사진을 스스로 학습하고 그 중에서도 아기가 웃고 있는지 울고 있는지도 판단할 수 있습니다.  

데이터를 처리하는 방식이 다릅니다.

딥러닝은 복잡하고 정교한 대규모 데이터에 적합하며, 데이터가 많을수록 더 정교한 결과를 도출할 수 있습니다.

머신러닝은 간단한 문제 또는 적은양의 데이터에 적합하며, 데이터의 품질이 중요합니다.

연산 방식이 다릅니다.

딥러닝은 다층 신경망을 활용한 복잡한 데이터를 분석합니다. 교하고 복잡한 구조를 이용해서 더 많은 데이터를 처리할 수 있다는 큰 차이점이 있습니다. 그래서 더 많은 데이터와 강력한 컴퓨팅 파워가 필요합니다. 

머신러닝은 일반적인 알고리즘(의사결정 나무, K-최근접 이웃, 서포트 벡터머신 등)으로 패턴을 찾습니다.

응용가능성이 다릅니다.

딥러닝은 자율주행 기술, 음성 인식, 이미지 인식, 자연어 처리 등 인간의 직관적 사고와 관련한 분야에 주로 활용됩니다.

머신러닝은 주로 의료 데이터 분석, 금융, 자동화 업무 등에 활용됩니다.

딥러닝을 사용할 때

  1. 사람이 직접 정의하기 어렵고, 복잡한 패턴을 학습해야 할 때
  2. 데이터를 대량으로 활용해야 할 때 (음성, 영상, 자연어 분석)
  3. GPU 같은 강력한 연산 리소스를 사용해야 할 때

머신러닝을 사용할 때

  1. 사람이 개입하여 특정 패턴을 직접 정의할 수 있고, 데이터가 적을 때
  2. 빠른 분석과 연산이 필요할 때 (추천 시스템, 금융 리스크 분석 등)
  3. 높은 연산 능력이 필요하지 않을 떄

머신러닝 알고리즘

어떤 알고리즘을 사용할지는 문제 유형에 따라 다릅니다. 데이터가 많을수록 신경망, 랜덤 포레스트를 사용하는 것이 좋습니다. 

  1. 의사결정 나무(decision tree)
  • 유형 : 분류,회기 / 특징: 단계별 YES NO 질문(스무고개와 유사)
  1. K-최근접 이웃(K-NN)
  • 유형 : 분류, 회기 / 특징: 가장 가까운 K개 데이터를 참고(친구 추천과 유사)
  1. 서포트 벡터머신(SVM)
  • 유형 : 분류 / 특징: 가장 좋은 경계선 찾기(줄다리기와 유사)
  1. 선형 회귀
  • 유형 : 숫자 예측 / 특징 : 가장 단순한 예측 모델(자전거 페달과 거리와 유사)
  1. 로지스틱 회귀
  • 유형 : 이진 분류 / 특징 :확률 기반 분류(주사위 확률과 유사)
  1. 랜덤 포레스트
  • 유형 : 분류, 회기 / 특징 : 트리를 여러 개 합쳐 정확도를 높임(심사위원과 유사)
  1. K-평균
  • 유형 : 군집화 / 특징 : 비슷한 데이터끼리 묶기(취미 그룹 만들기와 유사)
  1. 신경망
  • 유형 : 복잡한 문제 / 특징 : 이미지, 음성, 글자에 강력함(아기 뇌와 유사)

최신 알고리즘 사례(인스타그램, 유튜브)

MONEYS

인스타그램과 유튜브에서 영상을 하나만 봐도 그와 유사한 영상 콘텐츠 들이 뜨는 경험을 한번쯤은 해봤을 겁니다. 이러한 것이 머신러닝 알고리즘입니다.

머신러닝 알고리즘이 인스타그램과 유튜브를 통해 나의 행동 패턴을 분석하고, 맞춤 콘텐츠를 추천합니다.

최근에는 단순히 클릭한 내용의 콘텐츠만 추천하는 것이 아니라, 딥러닝 기반 모델이 더 깊이 세분화해서 학습하고 있습니다.

대표적으로 Wide & Deep Learning, 임베딩(Embedding), 협업필터링(Collaborative Filtering)

이 있습니다.

Wide & Deep Learning 

주로 유튜브에서 영상 추천할 때 사용하고, 내가 시청한 영상의 특징을 분석해서 유사한 영상을 추천하는 방식입니다.

예를들어 ‘여행’ 영상을 몇 개 봤다면, 유튜브는 여행 관련 영상을 상단으로 노출시킵니다. 한 번 클릭한 영상이 끝없이 뜨는 이유입니다.

임베딩(Embedding) 모델 

인스타그램에서 주로 사용하고, 내가 디저트 사진을 자주 저장하거나 좋아요를 눌렀다면, 디저트 관련 정보를 군집화해서 계정에 계속 노출시키는 방식입니다. 한번 저장한 콘텐츠를 릴스나 피드에 계속 보여주는 이유입니다. 

협업필터링(Collaborative Filtering)

과거부터 계속 사용해오는 방식으로. 보조적인 역할을 하고 있습니다. 내가 강아지 영상을 봤다면, 유사한 취향을 가진 사람들이 시청했던 콘텐츠도 나에게 추천해주는 방식입니다. 유튜브와 인스타그램과 같이 대규모 데이터를 실시간으로 분석해야 하는 상황에서는 딥러닝 모델이 더욱 강력하기 때문에 협업 필터링은 보조적인 역할로서 쓰입니다.

이러한 방법으로 인스타그램과 유튜브는 나의 행동 데이터를 Multi-Task Multi-Label(MTML) 신경망을 통해 학습합니다. 이 모델은 내가 클릭한 콘텐츠, 저장한 콘텐츠, 시청 시간 등을 동시에 분석하며, 추천 목록을 만들어 냅니다.

인스타그램은 여행 관련 계정을 여러 번 저장하고, 친구에게 DM도 보냈다면, MTML은 이 두가지 행동 데이터를 결합해서, 여행 관련 콘텐츠를 더 많이 노출하도록 학습합니다. 

유튜브는 MTML 신경망을 통해서 클릭률과 시청시간을 주 데이터로 합니다. 여행 영상을 한편 끝까지 시청했다면, 유사한 영상을 추천 목록 상단에 배치합니다.

반면 이런 상황은 보는 사람을 피곤하게 하기도 합니다. 추천 콘텐츠를 끊어내기 위해서는 데이터를 리셋하면 됩니다. 인스타그램에서는 관심없는 콘텐츠를 선택하거나, 검색기록을 삭제합니다. 유튜브도 추천콘텐츠 관심없음을 특정해서 노출을 줄일 수 있습니다.

목차