5110행, 12개의 변수를 갖는 캐글 데이터셋을 가지고 Stoke(뇌졸증) 환자를 분류하는 기초적인 머신러닝 모델 4개를 파이썬 및 Orange3로 실행합니다. 결정 트리, 로지스틱 회귀 , 신경망, K 최근접 이웃 모델 등이 그것입니다. 머신러닝 모델을 파이썬으로 코딩하면 작업이 길어짐에 따라 중간에 방향을 잃고 헤매기 쉽습니다. 이에 내비게이션 장치로서 플로우 챠트(흐름도)를 추가하여 매 단계마다 수강하시는 분들의 쉬운 이해를 돕습니다.
아울러 파이썬 코딩으로 상세한 머신러닝 과정을 처음부터 끝까지 일괄적으로 수행함으로써 프로젝트별로 여러 머신러닝 모델을 실행할 수 있는 능력을 키워 드립니다. 기존 책자들은 프로젝트내에서 다수의 머신러닝 모델을 일괄적으로 처리하는 과정이 부족합니다. 이 강의에서는 이를 보완하여 머신러닝 프로젝트를 처음부터 끝까지 수행할 수 있게 보완해 드립니다.
또한 책에 없는 내용인 Orange3를 통해 머신러닝 모델을 매우 쉽게 실행할 수 있는 방법을 강의에 추가하였습니다. Orange3는 오픈 소스 머신러닝 그래픽 버전 툴로서 메뉴를 클릭하여 드래그하여 간단하게 머신러닝 모델을 실행할 수 있습니다. 매우 직관적이고 사용자 친화적인 툴입니다. 머신러닝 초보자가 파이썬 코딩과 함께 Orange3를 함께 사용하면 학습효과를 배가할 수 있습니다.
강의는 12편으로 구성되어 있습니다. 1~2편에서는 파이썬 및 머신러닝의 기본 개념 그리고 이 강의에서 다루는 데이터셋에 대해 설명합니다. 2편 중간부터는 그래픽으로 쉽게 머신러닝을 다루는 Orange3 사용 예를 집중적으로 다루었습니다. 3편부터 11편까지는 먼저 파이썬으로 머신러닝을 구현하고, 그 후 동일 과정을 Orange3로 구현하여 독자들의 학습을 돕습니다. 마지막으로 부록 1에서는 신경망 및 딥러닝 이론을 소개합니다. 특히 최근 가장 앞선 딥러닝 모델 중 하나인 허깅페이스 라이브러리 기반의 자동번역을 소개합니다.