본문 바로가기
데이터라벨링

머신러닝과 선형회귀, 선형회귀 예측

by 그린망고 2023. 5. 17.
반응형

이번에는 최근 빅데이터 해석 및 예측을 위한 도구로 각광받고 있는 머신러닝(또는 기계학습)에 대하여 소개하고자 합니다. 아울러, 여러 서비스에서 이것을 어떻게 활용하고 있는지 알아보겠습니다.

머신러닝
머신러닝

머신러닝

머신러닝은 인공지능의 한 분야로, 컴퓨터가 학습할 수 있도록 하는 알고리즘과 기술을 개발하는 것을 말합니다. 기존에는 컴퓨터가 입력값을 받으면 결괏값을 출력하는 방식으로 프로그램을 구성하였다면 인공지능은 기존의 입력값과 결과값을 가지고 컴퓨터가 학습을 통하여 데이터셋의 경향성 및 유의성을 파악한 다음 새로운 데이터셋이 주어졌을 때 결과를 예측할 수 있도록 합니다. 컴퓨터 학습을 위한 방법으로는 주로 통계적 방법을 활용하며, 이를 통하여 데이터에서 법칙성을 추출하고 새로운 정보에 대하여 결과를 예측, 분류합니다. 

 

지도학습
지도학습

예전에는 부족한 데이터와 컴퓨터 성능으로 인하여 머신러닝이 크게 활용되지 못했지만, 최근에는 정보통신의 발달로 인하여 급격한 데이터양 증가와 함께 컴퓨터 성능의 비약적인 발달이 이루어져 머신러닝이 크게 각광받고 있습니다. 이에 따라서, 머신러닝은 이미지 식별, 자연어 처리, 주식예측, 음성인식 및 질병 진단 등 다양한 분야에 활용될 수 있게 되었습니다.

 

선형회귀 

그렇다면 컴퓨터가 어떻게 학습을 하는지 간단한 예를 들어 보도록 하겠습니다. x = [1 2 3 4], y = [2 4 6 8] 중학교 수준의 수학교육을 받은 사람은 x와 y 사이에 약 2배의 관계가 있을 것이라고 생각할 수 있습니다. 따라서 만약 x값이 7이라면 우리는 y 값이 약 14라고 쉽게 결론을 내릴 수 있습니다. 그렇다면 컴퓨터는 이것을 어떻게 예측을 할까요? 기본적으로 선형회귀라는 방법으로 x와 y사이의 관계를 유추합니다. 선형회귀란 쉽게 말해서 어떤 현상을 그래프 상에서 직선적인 상관관계로 파악하는 것입니다. 사람들은 어떤 현상에 대한 경향성을 파악할 때 우선 직선적인(선형적인) 관계로 파악하는 경우가 많습니다. 이것을 컴퓨터에게도 적용한 것이 선형회귀입니다.

 

 

 

딥러닝은 뉴런과 시냅스의 병렬연산을 컴퓨터로 재현하는 방법

2016년, 바둑기사 이세돌과 알파고와의 바둑 대국이 세계적인 이슈가 되었고 이 대국을 통해 딥러닝이라는 단어를 처음 접하고 수많은 사람들에게 알려지게 되었습니다. 딥러닝이 대체 뭐길래

trajectory.tistory.com

선형회귀 예측

이번에는 선형회귀에 대하여 알아보겠습니다. 선형회귀는 데이터의 경향성을 일차함수인 y = a*x + b의 관계로 표현한 것입니다. 예를 들어 x의 값이 [1 2 3 4] 일 때 y 결과값이 [3 5 7 9]이라면 y = 2*x + 1로 나타낼 수 있습니다. 하지만 실제 세계에서는 x와 y의 관계가 위와 같이 정확하게 표현되지 않습니다. 그 이유로는 관측자가 측정장치로 측정값을 얻어낼 때 측정장치의 정밀도, 주변환경, 사용자의 숙련도 등에 따라서 데이터에 일정 부분 오차가 포함되게 됩니다. 따라서, 이러한 부분을 감안하여 데이터의 경향성을 파악하기 위해서는 선형회귀 알고리즘을 적용할 수 있습니다. 예를 들어 한 학원 선생님이 학생들이 공부한 시간에 따른 시험점수를 파악한 데이터를 가지고 있다고 가정해 봅시다. 데이터를 그래프로 표현해 보았더니 무질서해 보이지만 학생들의 공부시간이 많을수록 시험점수가 높아지는 경향성을 발견하였습니다. 이것을 토대로 A라는 학생이 공부한 시간에 대하여 예상시험점수를 AI로 예측하고자 합니다. 하지만 초기에 컴퓨터는 이러한 것에 대한 예측을 전혀 할 수 없습니다. 따라서 예상시험점수를 예측하기 위해서는 기존 데이터를 가지고 선형회귀에 대한 학습을 진행해야 합니다.

 

 

 

 

새로운 게임 체인저, 텍스트 생성 AI와 그 파급력

몇 달 전 MS가 ChatGPT의 OpenAI사에 100억 달러 투자를 결정하고 자사 포털 사이트 Bing에 ChatGPT 탑재를 결정하면서 두 빅테크의 동맹이 현실화되었습니다. 이에 뒤질세라 Google에서는 서둘러 자사의

trajectory.tistory.com

 

728x90
반응형

댓글