학문별 인공지능 관점)
학제적 연구로서의 인공지능, 그러니까
각 학문에서 사람처럼 생각하고 사람처럼 행동한다는 것은 학문마다 다르다.
우선, 철학, 수학, 경제학, 제어공학 측면에서 바라보겠다.
철학에서는 뇌에서 마음이 어떤 과정을 거쳐서 생성되는지
수학에서는 불확실한 정보 하에서 어떤 과정을 거쳐서 추리하는지
경제학에선 효용을 최대화 하기 위해 어떤 과정을 거쳐서 의사결정을 하는지
제어공학에선 인공물이 어떻게 스스로를 제어하는지가
사람처럼 생각하고 행동하는 바 이다.
인공지능 연구분야)
인공지능 연구분야는 세가지로 나뉘어 진다
양상, 기능, 과정(Modality, Function, Process)이다
'양상적 분류'는 인간의 시각, 언어, 동작을 기계에 옮기는 방법을 연구하는 분야이다.
'기능적 분류'는 기계에 입력된 인간의 시각, 언어 동작을 바탕으로 AI가 지각, 인지, 행동을
할 수 있게 하는 것을 연구하는 분야이다.
지각이란, 입력된 시각, 언어, 동작을 바탕으로 주변 환경을 감지 및 이해 하는 것으로
컴퓨터 비전, 음성인식이 있다.
예로, 자율주행 센서, 얼굴인식, 음성 비서가 있다.
인지란, 지각한 것을 바탕으로 정보 분석, 학습, 추론, 의사결정 등을 수행하는 것을
의미한다.
예로, GPT-4o, 금융 데이터 예측이 있다.
행동이란, 인지 단계에서 결정한 것을 실제 행동으로 옮기는 것을 의미한다.
예로, 자율로봇, 자율 주행이 있다.
'과정적 분류'는 위의 양상적 분류, 기능적 분류를 요약적이고 총체적으로 설명하는 것이다.
단순하게 AI를 탐색, 문제해결, 지식 표현 & 추론, 학습으로 나눈다.
합리적인 에이전트)
합리적인 에이전트란? 환경과 상호작용을 하며 현재까지 인식된 순서가 있는 정보를 기반으로 의사결정을 내리는
에이전트를 의미한다.
또한, 수행 성능평가가 최대가 되는 행동을 선택할 수 있는 Agent를 의미한다.
수행 성능평가 지표 4가지 : PEAS (Performance, Environment, Acuators, Sensors)
Performance는 에이전트가 얼마나 합리적으로 행동했는지 평가하는 기준이다.
예) 안전운전, 목적지까지 걸리는 시간, 운행 비용, 법 준수도, 승차감
Environment는 에이전트가 동작하는 작업 환경이다.
예 ) 주소, 교통 상황, 보행자 여부
Actuators는 에이전트가 행동을 수행하는 방식이다.
예) 스티리어링, 엑셀, 브레이크, 경적
Sensors는 에이전트가 환경을 인식하는 방식이다.
예) 녹화, 엔진 센서, 키보드, GPS, 속도계
Environment의 세부사항
Fully Observable vs Partially Observable : 환경을 완전히 관찰할 수 있는지 여부
전자 예 ) 카드게임 agent
후자 예 ) 인터넷 옷 쇼핑몰 구매 대행 agent
Deterministic vs Stochastic : 확률(환경)이 일정한지 시간의 변화에 따라 변하는지 (결정론적인지 확률적인지)
Episodic vs Sequential : 확률(환경)이 독립적인지 주변 요소(환경)에 영향을 받는지
Static vs Dynamic : 환경이 변하는지 (예 : 움직이는지 가만히 있는지)
Discrete vs Continuous : 상태와 행동이 명확하게 구분되는지 여부
(예 : 주사위, 성별, 셀 수 있는것 vs 셀 수 없거나 연속적인 것, 시간, 키, 몸무게 )
Single-agent vs Multi-agent : 에이전트가 혼자 행동하는지, 여러 에이전트와 상호작용하는지
수업 스크립트 :
교통 정리, 도시 환경 좋은 기후 변화와 관련 교육의 재설계와 민주화, 과학적인 관련 에너지 자원의 판결 같이 우리 사회가 가지고 있는 어려운 문제들이 보다 쉽게 해결되죠.
유전자 등 모든 보건 데이터를 이용해 환자 맞춤형 임상 시험이나 로봇 외과의사 운영, 방사선 자료 해독, 유전자 배열 분석 등 의료 활동이 획기적으로 달라집니다.
머신, 비전, 센서, 사물 인터넷과 같은 인간 주변의 모든 것들을 이용해 인지 능력까지 갖추고 네트워크를 통합해 인간과 상호작용을 하며 모든 시스템들을 더욱 스마트하게 변화시킬 텐데요.
이런 변화는 투명성을 높이고 기기와 정보의 상호작용을 가속화하며 모든 것을 개인화하고 사용을 더 쉽게 만들어 우리가 의사 결정을 내릴 때 이러한 센서 데이터를 활용할 수 있게 됩니다.
지식 폭발 시대로 연결되면서 교사가 사라지고 지식 암기로 능력을 평가하는 교육 과정이 소멸될 수도 있습니다.
그리고 24시간 로봇 아이리스가 보편화될 수도 있죠.
인간의 언어를 인지하고 이해하는 생각하는 기계에 의한 수지는 시대가 오고 입법, 행정, 사법 기능을 배제한 인공지능에 의해 정부나 국가의 기본 제도와 운영에 생기는 변화도 빼놓을 수 없는 미래의 모습이기도 합니다.
하지만 이렇게 인공지능 개발에 대한 기대만큼이나 우려 역시 적지 않은데요.
그 대표적인 예가 자율주행차의 딜레마입니다. 즉 사람 운전자와 달리 자율주행차는 각종 센서에서 입수한 정보를 인공지능이 순식간에 처리함으로 언제나 현재 처한 상황을 객관적으로 파악하는데요.
그런데 반대편 차선에서 갑자기 차가 중앙선을 넘어온다든지 아이가 갑자기 도로로 뛰어든다든지 하는 상황에서는 어떨까요?
이런 경우 사람 운전자는 상황을 온전히 파악하지 못한 채 사실상 반사 행동 대응을 하지만 자율주행차는 피해를 최소화하는 방향으로 결정합니다.
사람으로 치면 사고 직전의 상황이 슬로모션으로 돌아가 어떻게 사고를 내야 할지 판단하지만, 인공지능은 각 상황에 대한 프로그램의 행동 지침을 따르는 것 중에서 이러한 인공지능에 대한 우려는 영국의 우주 물리학자인 스티븐 호킹 박사가 처음으로 표현했고 테슬라 자동차의 CEO인 일론 머스크로 인공지능은 인류에게 핵무기보다 더 큰 위협이 될 수 있으므로 인류를 구하는 이로운 방향으로 발전시키는 기술만 개발하라며 인공지능 연구 기능을 매기고 있습니다.
인공일반지능으로의 발전 어쩌면 인간다운 인공지능으로의 변화를 의미하는 것은 아닐까 생각해 보게 되는데요.
그렇다면 인공 일반 지능을 인류의 동반자로 개발할 때 인류에게 호의적인 미래를 기대할 수 있겠죠 그러기 위해선 인공일반지능이 인간의 존은 점 윤리성과 도덕성 그리고 타인에 대한 공감 능력을 학습하는 것을 우선으로 할 수 있어야 하지 않을까요?
그리고 그런 발전과 함께 인간으로서 우리가 지켜 나가야 할 것은 무엇이고 인공 일반 지능에게 도태되지 않기 위해서 어떤 노력을 할 것인지에 대한 고민 역시 필요합니다.
어 그래서 인공지능은 크게 이제 강한 인공지능 일반 인공지능 약한 인공지능 슈퍼 인공지능 이렇게 세 가지로 이제 분류가 되는데 여러분들 아까 잘 봤듯이 지금 현재는 여기 좁은 인공지능이 표현돼 있지만 약한 인공지능 시대죠 그렇죠 현재는 이렇게 지금 살고 있고요.
근데 그러면 이 강한 인공지능 또는 이제 슈퍼 인공지능은 언제쯤 도달할 것이냐라는 어떤 그런 부분을 이제 요즘에 미래학자들이 좀 예측을 많이 해요.
그래서 지금 어떤 기술 수준과 이런 발전을 통해서 그러면 언제쯤 이제 강한 인공지능이 도달을 할 것이냐 또 슈퍼 인공지능에 도달할 것이냐라고 이렇게 예측을 하는데 2045년 한 20년 후라고 하면요 이 인간과 같은 어떤 수준의 지능을 가진 일반 인공지능의 시대는 오지 않을까라고 바라보는 게 이제 미래 학자들의 예측이 그다음에 2060년 정도 되면 인간 지능보다 더 뛰어난 어떤 그런 이제 시대거든요.
슈퍼 인딩 시대가 오지 않겠느냐라고 이제 이렇게 바라보고 있어요.
사실 근데 이거는 예측이지 좀 더 빨리 올 수도 있고요.
좀 더 더 늦어질 수도 있겠죠. 그렇죠 하지만 그리 멀지 않은 시대에 어 인간 수준의 인공지능이 도달하는 어떤 일반 인공지능 시대는 분명히 올 것이다라고 이렇게 보고 있어요.
다음은 우리가 살펴볼 게 인공지능의 도전과 한계예요.
그래서 어찌 보면은 인공지능 좋은 얘기만 아마 말씀을 많이 드렸던 것 같은데 인공지능 단점 또는 한계 아직까지 더 나아가야 되는 부분들에 대해서 좀 더 소개해 드리려고 합니다.
먼저 처음에 이제 봐야 되는 어떤 부분이 뭐냐면 아까 제가 설명 했어요.
그래서 강한 인공지능을 설명할 때 인간과 같은 행동을 평가하는 방법이 있다라고 얘기했죠.
그중에 하나가 튜링 테스트 라고 하는 방법이 하나 있습니다.
이 튜링 테스트는 즉 기계가 사람과 동일하게 생각하고 있는지 테스트하는 어떤 기법을 튜링 테스트라고 얘기를 해요.
이 튜링 테스트는 앨런 튜닝이라고 하는 사람이 사실은 보완을 했어요.
그래서 이 앨런 튜닝 혹시 아는 학생 있어요? 처음 들어봐요 이미테이션 게임이라고 하는 혹시 영화 본 적 있나요?
그래서 굉장히 컴퓨터 공학도라고 하면 사실 알아야 되는 인물 중에 한 명이죠.
그렇죠 그래서 영국의 수학자예요. 그래서 물론 튜링 테스트에서 이 이름을 따서 만든 테스트예요.
그렇죠 그래서 이 튜링 테스트를 만드시기도 했고요.
튜링 머신이라고 하는 컴퓨터 구조에서 지금 우리가 알고 있는 일반적인 컴퓨터라고 하면 어떤 구조여야 되느냐라고 하는 튜링 머신의 개념을 만드신 분이기도 합니다.
그렇죠 그래서 인디션 게임 안 본 학생이 있으면 굉장히 재밌어요.
생각보다 재밌습니다. 그래서 물론 이제 기술적인 부분 그 컴퓨터 공학에서 기여하는 어떤 그런 부분들도 있지만 개인의 사생활도 좀 약간 이 양반이 좀 특이하거든요.
여기서 바이섹셔이긴 한데 그래서 좀 그런 내용들도 사실 좀 담겨 있어서 영화 보도 좀 재미있어요.
그리고 이 앨런튜닝의 시대가 언제냐면 세계 2차 대전 때의 시대예요.
그래서 엘렌톤이 굉장히 유명해진 계기가 뭐냐면 독일군의 이니그마라고 하는 잠수함 유보트 혹시 들어본 적 있죠?
그래서 유보트에서 통신 이제 이런 부분들을 하기 위해서 이제 통신이 이런 부분들을 나누는데 그걸 해독하는 암호기가 있었어요.
그게 이니그마라고 하는 어떤 부분인데 그런 암호를 해독하는 어떤 그런 기계를 만들고 이런 데 기여를 했던 어떤 그런 스토리들이 영화에 나와요.
그래서 아마 재미있게 볼 수 있을 것 같아요. 그래서 이 튜닝 테스트를 만드는 사람이 앨런 튜닝인데 사실은 이 앨런 튜닝이 이 튜링 테스트를 고안했었을 때 논문을 한 편 썼어요.
역에 관련돼서 그래서 이 시대에 뭔가 인공지능이 있어서 뭐를 평가한 건 아니었고요.
인공지능이 있다라고 하면은 그러면 어떻게 평가를 해야 될 거냐라고 해서 이미테이션 게임이라고 하는 이 이름으로 논문을 하나 작성해요.
근데 그 내용이 튜링 테스트 내용이에요. 그래서 이제 가상의 이미테이션 게임처럼 뭔가 테스트를 한번 해보자라고 해서 이제 나왔던 어떤 그런 개념이라고 보시면 될 것 같고요.
튜링 테스트는 그럼 어떻게 하는 거냐면 여기 보시면 이제 컴퓨터가 하나 있고요.
사람이 이렇게 두 명이 있어요. 근데 가운데 사람은 어떤 사람이냐면 질문자예요.
휴먼 퀘스처너예요. 그죠? 그래서 양쪽에 질문을 만들어서 던질 거예요.
근데 이 휴먼 캐스처너는 자기 왼쪽에 또는 오른쪽에 사람이 있는지 컴퓨터가 있는지 몰라요.
그냥 질문만 던지는 사람이에요. 그렇죠 그래서 각각 독립된 장소에 있는 어떤 그런 상황이라고 한번 가정을 한번 해봅시다.
그래서 휴먼 캐스터나가 질문을 만들어서 양쪽에 누가 있는지 모른 채 던져주는 거예요.
그러면 컴퓨터도 그러면 휴먼 리스폰더 그러니까 응답자죠.
그죠? 그래서 사람 응답자가 그 질문을 받고 응답을 하기 시작을 해요.
그리고 그 응답지는 다시 휴먼 퀘스쳐너에서 질문했던 사람한테 다시 돌아옵니다.
그러면 휴먼 퀘스쳐너가 이걸 보고 판단을 하는 거예요.
그 이게 기계에서 응답을 한 건가 이게 사람이 응답을 한 건가 이걸 맞다 틀리다라고 볼 수도 있긴 하겠지만은 그래도 이 내용을 봤었을 때 이거 사람이 한 거 아닌 것 같아 이런 거 있잖아요.
그렇죠 그렇게 평가하겠다라고 하는 부분이 튜링 테스트예요.
그래서 응답지를 딱 봤는데 이거 사람이 한 건지 기계가 한 건지 구분을 잘 못하겠어 그러면 어떤 거예요?
인간과 비슷한 어떤 형태의 지능을 가진 컴퓨터라고 볼 수 있다라는 거죠.
하지만 딱 봤는데 아 이거 기계가 한 것 같아 컴퓨터가 한 것 같아 딱 티가 나요.
그럼 아직까지는 도달하지 못했다라고 보는 게 튜링 테스트의 방법이에요.
근데 아까도 얘기했지만 이 튜링 테스트를 통과한 인공지능 시스템이 있을까요?
내가 물어봤죠 없다고 얘기를 했죠. 그쵸 맞아요.
제가 그렇게 얘기를 했습니다. 그러면 이런 생각이 들 거예요.
그러면 여러분들이 아는 인공지능 시스템들 중에 가장 지능이 높은 인공지능 시스템이 뭐예요?
새 집 피티 그렇잖아요 왜 새지 피티 여러분들 물어보고 그 정답 어 이거 맞네 그냥 갖다 쓰잖아요.
그렇죠 그럼 챗gpt는 사람만한 재능이 있을까요?
궁금해지죠. 그렇죠 그래서 실제로 작년에 이런 논문들이 발표됐어요.
그렇죠 그래서 챗gpt는 그럼 튜링 테스트를 통과할 수 있을까?
그렇죠 그 의문을 가지고 실험을 했더니 두 편의 논문이 있어요.
이 두 편의 논문의 결과는 결국 튜닝 테스트는 통과하지 못합니다라고 하는 게 결과예요.
하지만 이 나왔던 이 결과가 약간 차이가 있어요. 왜 통과하지 못했느냐에 대한 차이가.
그래서 왼쪽 논문은 이제 사이언티픽 리포트라고 하는 굉장히 좋은 저널지에 실렸던 논문인데요.
여기에서 튜링 테스트를 통과하지 못했던 이유는 뭐였냐면 사람보다 너무나 뛰어난 답변을 줬어요.
그래서 답변을 딱 봤는데요. 맞아요. 답변 맞는데 이거 누가 봐도 사람이 적은 거 아니야 너무 자세히 잘 적은 거지 그렇죠 그러니까 사람보다 너무나 탁월한 어떤 그런 결과를 주는 거예요.
그렇죠 그래서 이게 티가 나서 못한다라고 봤던 게 왼쪽 논문이에요.
근데 오른쪽 논문 이제 비슷한 시기에 쓰렸어요. 그래서 이거는 ACL이라고 하는 네 링귀스틱 언어학 쪽 학회에 이제 틀렸던 어떤 그런 이제 내용인데요.
얘는 이제 한번 해봤어요. 해봤더니 어떤 얘기가 나왔냐면 물론 이제 GPT 4도 이제 실험해 봤지만 GPT 3.5 같은 경우에는 1960년대에 이제 엘리자라고 하는 챗봇이 하나 있어 엘리자는 이렇게 생겼어요.
터미널의 진짜 옛날 같이 얘를 한번 실험을 해보니까 야 얘보다도 지금 성능이 떨어져 그래서 GPT 4 해봐야 한 40% 60% 정도밖에는 못 맞추던데 그러니까 사람하고 딱 비교했었을 때 너무 많이 떨어지던데 그래서 이거는 비교를 해보니 사람보다도 좀 떨어진다라고 결과가 나왔던 논문이에요.
그러면 이제 여기에서 드는 생각이 있어요. 사실 튜링 테스트는요.
가장 중요한 게 뭐냐면 물론 이런 체계를 갖고 가지만 질문이 굉장히 중요해요.
그죠? 근데 이 질문이 단순하게 객관식 질문이라고 하면은 다 잘 맞추죠.
그렇죠 얘도 맞추고 얘도 맞출 거예요. 그리고 휴먼 캐스처너도 그걸 딱 봤을 때 사람 기계인지 잘 몰라요.
그렇죠 근데 이 질문이 굉장히 다양하고 그다음에 주관식 형태의 굉장히 서술형 질문이라고 하면 분말이 달라지죠.
그쵸 그래서 튜링 테스트는 굉장히 다양한 분야에서 굉장히 주관적인 어떤 그런 내용들로 작성되게끔 구성이 돼 있어요.
근데 만약 이쪽 왼쪽 같은 경우에는요. 아마 제가 봤을 때 오른쪽에 튜 테스트했던 어떤 기법의 퀘스천보다는 좀 더 쉬웠을 가능성이 높아요.
그렇죠 여기는 응답률이 떨어졌고요. 여기는 응답률은 높았고 사람보다 더 탁월한 거 그렇죠 그래서 사실 튜링 테스트의 가장 큰 문제는 뭐냐면 어떤 거 어떤 질문으로 잘 테스트를 할 거냐 사실 이런 기준은 없어요.
방법만 제시가 되어 있는 그렇죠 그래서 하지만 두 개의 논문으로 조합을 해봤을 때 아직까지 인간 정도의 수준의 인공지능은 도달하지 못했다라고 하는 결론은 맞아요.
맞죠 그렇죠 그래서 일단은 아직까지는 일반 인공지능 시대로 왔다라고 보기에는 어렵고 이런 부분들을 이제 갭들을 좀 줄여가는 게 지금 인공지능 발전 과정이라고 보시면 될 것 같아요.
그리고 두 번째 내용이에요.
그래서 인공지능 정말 인간보다 뛰어날 수 있을까 저 질문에 관련된 어떤 그런 내용인데요.
두 번째 소개해 드릴 자료는 중국어방 논증 실험이라고 하는 좀 재밌는 실험이 하나 있어요.
그렇죠 그래서 정말 인공지능이 그렇죠 지능을 가진 걸까라고 하는 어떤 의문에서 시작된 실험입니다.
그래서 1980년도에 이제 미국의 언어학자인 존설이라고 하는 사람이 있어요.
이 사람이 이 실험을 고안 는데요. 여기 방이 하나 있어요.
그래서 이쪽은 영어만 할 줄 아는 사람이에요. 그리고 여기는 중국어만 할 줄 아는 사람이 그래서 이 방은 이 영어만 할 줄 아는 사람이 뭐라고 얘기를 했었을 때 이 방을 통과해서 중국어로 번역해서 이 사람한테 전달해 주는 어떤 그런 실험이라고 보시면 돼요.
그래서 이 사람은 이제 영어로 하라 이렇게 얘기를 하죠.
그렇죠 근데 이 방 안을 봤더니 사람이 한 명 있어요.
사람인이 하나 있고요. 영어로 얘기했었을 때 무슨 책을 하나 갖고 있어요 그렇죠 책을 그래서 이런 책이 있어요.
그래서 영어로 얘기한 거를 여기 다 보고 요 단어 있잖아요.
중국어 요거로 찾았다 요거로 이렇게 건네주면 되잖아요.
그렇죠 그거 그 역할을 하는 사람이 그러면 저 인풋과 아웃풋이죠.
입력 들어갔었을 때 영어 나오는 거는 중국어일 거예요.
아 여기서 이제 드는 의식은 뭐냐면 이 방 안에 있는 사람 영어하고 중국어에 대한 지식이 있다라고 볼 수 있을까요?
여러분은 어떻게 생각해요? 그러면 이야기를 바꿔서 얘기를 해볼게요.
그렇죠 이 방이요. 인공지능 모델이에요. 그죠 사진이 하나 들어갈 거예요.
자동차 사진이요. 그렇죠 자동차 사진을 우리가 입력을 할 거예요.
사실 입력 단계에서는 이게 자동차가 있는지 모르는지 몰라요.
그냥 사진 하나 들어간 거죠. 그리고 이 출력은 그 안에 이제 객체니까 자동차라고 하는 이걸 알아 맞춰주는 거예요.
그렇죠 인공지능 모델 수많은 데이터를 가지고 학습을 한대요.
자동차도 있고 코끼리도 있고 기린도 있어요. 그렇죠 마구마구 학습을 했어요.
그래서 들어온 이미지와 비슷한 패턴을 쳐다봤더니 자동차가 많아요.
그래서 자동차라고 하는 결과를 알려줬어요. 그럼 인공지능 모델은 지능이 있을까요?
앞에서 얘기했던 사례하고 뒤에서 얘기했던 인공지능 모델이 차이가 있나요?
라는 거예요. 여러분들 생각은 어때요?
그래서 이해하지 못하고 흉내 낼 수는 있어요. 그렇죠 근데 이걸 지능적이라고 볼 수 있냐는 거죠.
그렇죠 그래서 이런 관점도 사실은 존재해요. 그래서 인공지능이라고 얘기를 했지만 실제로 이게 지능적인 행동과 이해, 인간처럼 사고하고 있느냐 그건 아닐 수도 있다라고 얘기했던 게 존설이 얘기했던 중공업 농쟁 실험입니다.
재미있죠 그렇죠 이렇게 한번 생각을 한번 해보자는 거예요.
그죠? 그래서 우리는 인공지능이라고 하지만 그게 실제 사람과 같은 지능이냐 아닐 수도 있다라는 거죠.
다음은 상황 인식 컨텍스트 레콜리션에 기반한 스토리텔링이에요.
그래서 이게 이제 말은 되게 거창하게 썼는데 쉽게 얘기하면 이런 거예요.
우리 여기 그림들이 여러 개 있어요. 그렇죠 이 그림들을 조합해서 우리 이야기를 하나 만들어 보자 그렇죠 여기 보니까 우리 두루미가 하나 있어요.
그래서 두루미 아마 여러분들 이소부아 아마 다 알 거예요.
그 두루미가 이 요 병 호리병 안에 있는 물을 먹고 싶어요.
이제 뿌리가 안다. 그래서 이제 돌멩이 넣어가지고 이거를 수위를 높여서 마시는 그런 내용 아마 기억할 거예요.
그렇죠 하지만 이거 이 그림들의 순서를 막 섞어가지고도 사실 이야기 만들어볼 수 있어요.
옆에도 마찬가지예요. 여기 장면들 그래서 여기 강둑에 개가 하나 빠졌네요.
그래서 그거를 잘 도와주는 장면들 이런 것들 이제 엮으면 스토리를 만들 수 있죠.
그죠? 제 아들이 8살이에요. 이제 초등학교 입학했는데요.
우리 아들 이거 되게 잘해요. 그래서 말도 안 되게 막 이거 이야기 만들거든요.
진짜로 그래서 우리는 1번 2번 3번 4번 같은데 4번 3번 2번 거꾸로 막 얘기를 하기도 하고요.
왜냐하면 이제 애들이니까요. 그죠 근데 이거 인공지능한테 시키면 잘 인공지능은요.
요 하나의 이미지 있잖아요. 하나의 요 사진 요 사진 안에 뭐가 있어 얘 지금 뭐 하고 있니라고 물어보면 되게 잘 두루미가 있고요.
여기 물이 담겨 있고요. 물을 먹으려고 하고 있어요.
하지만 여러 개의 사진들은 지금은 4개이지만 10개일 수도 있고 100개일 수도 있잖아요.
그렇죠 이 사진들을 쭉 쪼고 주고 야 스토리 만들어봐 라고 하면은 그거 잘못해요.
그래서 왜냐하면 이거 즉 어떤 인식을 가지고 그죠 이런 상황들을 다 인식을 해서 뭐가 앞이고 뭐가 뒤고 이런 것들을 잘 못한다는 거예요.
그래서 단일 인지 하나만 잘해준다는 거죠. 그렇죠 그래서 인식 AI 퍼셉션 AI라고 지난번에 첫 시간에 얘기했잖아요.
그래서 이거 하나는 인식 잘해요. 하지만 이게 다수라고 하면 그래서 여기에서 뭐가 있느냐 물어보면 이런 것들은 잘한다는 얘기예요.
하지만 엮어서 이야기 만들어봐요. 크리에이티브하게 창조 그러면 못한다는 거죠.
그렇죠 그래서 이 인공지능 보면 사실은 이제 문자 인식 음성 인식 영상 인식 그래서 지난 시간에도 얘기했지만 이 퍼셉션 AI라고 하는 인식 AI 분야에 대해서는 굉장히 지금 많이 올라와 있어요.
그렇죠 그래서 인공지능이 이런 부분이 굉장히 잘 돼서 다 잘될 거라고 생각을 해요.
솔직히 얘기해서 그렇죠 그래서 CCTV에 이 사람이 사람도 했던 것들이지만 사람이 이제 놓칠 수 있는 어떤 사고 장면 같은 것들 있죠.
이런 것들 그래서 누가 잘못했느냐 누가 뭐 했느냐 어디서 어떻게 부딪혔느냐 이런 것들 있죠.
삭제돼서 실제로 사용되기도 하죠. 그래서 오른쪽 예제 같은 경우에는 RPA라고 해서 에이전트 AI 제가 말씀했어요.
그래서 말씀드렸어요. 그래서 업무에 활용되는 어떤 AI 그래서 이제 챗봇으로 데이터베이스 그냥 그죠 테이블 만들어줘 너 입력해 줘 그래서 이제 스키마 만들고 여러분들 디비에서 IDB에서 이제 만들어서 SQL 구문 만들어 주고 그죠 그런 것들을 자동화해 준단 말이에요.
그래서 이런 거를 봤었을 때 인공지능이 굉장히 잘 되는 것 같이 보이지만 사실은 특정 분야에만 잘 됐고요.
전체적인 관점에서 봤었을 때는 인공지능이 서너 살 수준의 아이들의 수준이라고 사실 일반화적인 측면에서 아직까지는 가야 될 길이 굉장히 좀 멀다라고 하는 어떤 그런 부분들이 있어요.
지금 여기 보이는 영상 두 가지를 보여줄 건데요. 사실 이 영상은 좀 오래된 영상이기는 해요.
그래서 2015년도니까 지금으로부터 10년 전 영상이에요.
그래서 왼쪽은 보스턴 다이나믹스라고 하는 로봇 만드는 회사예요.
그래서 이 회사는 이제 MIT 동아리부터 시작을 했거든요.
그래서 MIT에서 나왔던 어떤 벤처 기업인데요.
최근에 우리 현대자동차에서 인수를 했죠. 그렇죠 그래서 자동차 만드는 데 이제 로봇 이런 거 활용하기 위해서 실제로 인수했던 기업이에요.
그래서 보스턴 다이벤스는 이제 뭘로 유명했냐면 이런 로봇 만드는 거 굉장히 유명했었습니다.
그래서 하지만 2015년도에 이 보스턴 다이벤스가 이제 이 로봇을 만들었는데 그때의 수준을 볼게요.
그냥 간단한 일이었어요. 그냥 선반 위에 박스 하나 놓는 어떤 그런 간단한 일이었죠.
물론 이제 이거는 몇 건의 케이스 중에 굉장히 이제 특이한 어떤 실패 사례일 수도 있어요.
근데 이게 왜 어려운 일이냐면요. 사실은 이 발 두 다리로 걷는다는 게 굉장히 어려운 일이에요.
왜냐하면 여러분들이 사실은 잘 모르지만은 체중 이동이 굉장히 많이 일어나거든요.
특히나 뭐를 들고 있잖아요. 그렇죠 그걸 놓으면 사실 이 두 다리에 이 밸런스 잡는 게 굉장히 많이 틀어진단 말이에요.
그렇죠 그래서 그런 부분들은 사실 2015년도도 사실 잘 그리고 옆에 이제 오른쪽에 영상 하나 더 보여드릴 텐데요.
이거는 이제 달파 로보틱 챌린지라고 하는 로봇 대회예요.
그래서 다 합한 로보틱 챌린지는 뭘 하는 대회냐면 재난 구조용 로봇 만드는 대회 그래서 여러분들 이제 산불이 났거나 위험한 어떤 현장에 사람이 투입되지 못할 때 로봇이 대신 투입할 수 있는 어떤 그런 로봇들을 만들어 가자 대신 우리 대회를 통해서 잘 만들게 계속 우리 만들어보자라고 했던 어떤 그런 대회라고 보시면 될 것 같아요.
근데 이게 2015년도에 달파 로보틱 챌린지의 수준이어서 쭉 치면 잘 못 벌어요.
사람 구해야 되는
문도 잘 못 열죠. 저 계단 올라가는 것도 힘들어 하고 자동차에서 내려오는 것도 사실은 쉬고 있습니다.
물론 10년 전 영상이기 때문에 이것보다는 지금 얘기하면 지금 많이 나아졌어요.
그리고 2019년도에는 우리나라 이제 카이스트에서 만들었던 휴보라고 하는 로봇이 이 달파 로보티 챌린지에서 우승하기도 해요.
근데 그때 카이스트 같은 경우에는 두 다리를 썼느냐 아니에요.
두 다리를 쓰지 않았어요. 그래서 다리를 여러분들 탱크 있잖아요.
탱크 탱크 궤도처럼 그래서 그렇게 바꿔가지고 이제 나갔어요.
소는 그대로 있긴 하지만 그렇죠 그래서 두 다리로 있는 게 굉장히 어려워서 그때는 이제 탱크 같은 어떤 궤도로 썼고 이 궤도는 사실 그냥 바퀴하고 좀 달라요.
그래서 계단 같은 것도 사실 좀 올라갈 수 있어요. 경사에 있는 데도 그래서 그렇게 이제 우승했다.
하지만 사람처럼 저렇게 걸어 다니는 어떤 로봇을 만든다는 건 쉽지는 않다라는 거죠.
그렇죠 그래서 아마 여러분들 가끔 이제 사례들이 올라오긴 하는데 이렇게 사람처럼 막 걸어 다니는 로봇을 잘 보지 못했던 이유 중에 하나가 이게 굉장히 어려워서 두 번째로 여러분들한테 보여줄 수 있는 것들은 이제 데이터 편향적인 문제 그래서 퍼셉션 AI 인식 AI는 굉장히 많이 성능이 올라왔다고 했죠.
그렇죠 그래서 얼굴 인식 같은 것들 특히나 그죠 그래서 영상 인식 이런 것들은 실제로 굉장히 정확도가 많이 올라와서 실생활에 정말 많이 써요.
그래서 실생활에 적용을 해서 쓴다는 얘기는 뭐냐면 그만큼 오류율을 많이 줄였다는 얘기죠.
그렇죠 그럼에도 불구하고 사건이 터져요. 그죠 여기 보니까 이게 2023년도 4월 1일자에 신문이에요.
그래서 얼마 안 됐어요. 한 2년 전 그죠 그죠 2년 전에 우리나라 케이스는 아니에요.
미국인데 그래서 이 미국에서 인식 AI 퍼셉션 AI로 뭘 만들었냐면 미국 같은 데 가면은 좀도둑이 굉장히 많아요.
슈퍼 가서 이제 막 이제 훔쳐가는 사람들 그래서 이제 CCTV에 그런 장면들을 포착해가지고 용의자 있잖아요.
그런 것들을 이제 확인하는 AI를 하나 만들었어요.
그래서 애매모호한 행동을 할 때 그렇죠 이게 카메라에서 잘 안 보이잖아요.
그래서 이렇게 이렇게 이제 갖고 오잖아요. 근데 그런 상황에서 이제 얼굴 보고 조금 더 범죄자에 가깝다라고 하면은 퍼센티지를 높여서 절도범인 것 같다라고 하는 어떤 결과를 주는 그런 시스템이라고 보시면 될 것 같아요.
근데 이 시스템을 한번 봤더니 멀쩡한 사람 아무 잘못도 안 했던 사람을 막 절도범이라고 얘기를 하는 거예요.
그러니까 왜 그러냐 이렇게 봤더니 그러면 이걸 학습을 했던 어떤 데이터를 살펴보기 시작했어요.
그러면 범죄자의 어떤 내용들을 가지고 학습을 시켰잖아요.
그래서 범죄자 이 사람이 범죄자라고 하면 기존의 범죄자하고 유사할 거다라고 하는 가정에서 시작을 하거든요.
근데 이 범죄자의 풀 이 데이터들을 봤더니 백인보다는 어때요?
유색 인종이나 흑인이 많은 거죠. 그죠 그래서 히스페닉이라든지 아니면 흑인들이 범인의 관성이 높고 여자보다는 남자가 많은 거예요.
그리고 나이가 엄청 많은 사람보다는 젊은 사람 그렇죠 그러다 보니 편향이 생기는 거예요.
그래서 잘못하지 않았는데 우리도 가면은 황인이잖아요.
백인이 아니잖아요. 그래서 절도범으로 누명 쓸 수도 있는 어떤 그런 상황들이 벌어지는 거죠.
실제 실제로 그래서 누명이 있어요. 그리고 오른쪽에 하나 뉴스 장면 하나 캡처했는데요.
이거는 자 여기는 그래 슈퍼마켓이니까 아티 잘 못하는 기업이니까 그럴 수도 있겠다.
그래서 누가 만들었는지 모르겠는데 참 잘못 만들었네라고 생각할 수도 있어요.
그죠 자 이제 오른쪽 사례 하나 보여드릴게요. 아마존이라고 하는 기업 물론 물류하는 기업이긴 하지만 굉장히 it에서도 비전이 있는 기업 그죠?
그래서 아마존 웹 서비스 이런 것들을 이제 운영하는 어떤 그런 업체 기업이죠.
이 기업에서 뭘 하려고 했냐면 채용의 비슷한 시스템을 쓰려고 해요.
그래서 채용 지원서가 들어왔었을 때 이 사람이 아마존이라고 하는 회사에 적절한 사람이냐라는 것들을 판단하기 위해서 사진을 보고 판단하려고 해 하지만 봤더니 사건이 터져요.
그렇죠 그래서 뉴스 한번 보고 또 이야기 이어가도록 할게요.
세계 최대 전자상거래 기업인 아마존이 인공지능을 이용한 채용 프로그램을 개발하다가 여성 차별 문제가 드러나서 자체적으로 폐기했습니다.
남성 직원이 더 많은 기업에 인적 데이터를 학습한 AI가 남성에 대해서 더 우호적인 판단을 내린 겁니다.
김준형 기자입니다.
아마존은 2014년부터 AI를 활용한 채용 프로그램을 연구했습니다.
컴퓨터 500대가 지원자 이력서를 5만여 개 키워드로 분석해 적합한 인재를 가려내는 기술입니다.
이 AI는 학습을 시작한 지 1년 만에 남녀 차별 성향을 보이기 시작했습니다.
그러다 결국 지난해 초 폐기됐습니다. 경력 10년 이상의 남성만 추천한다거나 여성 체스 동아리 등 여성 문구가 포함된 경력이 있으면 채용 대상에서 제외한 겁니다.
여대 출신 지원자들의 점수 역시 깎였다고 로이터 통신은 보도했습니다.
지난 10년간 아마존에 제출된 이력서를 학습한 AI가 산업적 특성에 따라 남성이 더 적합하다고 여겼다는 겁니다.
프로그램 개발자 등 it 기업 지원자의 남성이 많다는 요소가 작용했다는 설명입니다.
로이터는 아마존이 프로그램을 수정해 성차별 요소를 없애고자 했지만 향후 AI가 다른 방식으로 또 차별하지 않으리란 확신이 없었다고 전했습니다.
앞서 미국 매사추세츠 공대 연구팀은 부정적 데이터로만 학습시킨 사이코패스 AI 노먼을 개발해 편향된 알고리즘이 AI를 얼마나 위험하게 만드는지 알리기도 했습니다.
이런 일들도 지금 실제로 벌어지고 있는 상황인 거죠.
두 번째로는 불완전한 인식이에요. 그래서 물론 이제 인공지능에서 특히나 요즘에 딥러닝 시대에서 굉장히 기술적으로 성과가 있었던 퍼셉셔닝의 인식 그죠?
이런 부분에서도 아직 미흡한 점이 있어요. 있습니다.
그래서 여기 보니까 이 사진을 보니까 이게 대표적인 이미지예요.
그래서 분이 얘는 하나는 우리 웰시콕이라고 하는 강아지 혹시 알아요?
그죠? 그래서 이 웰시콕이라고 하는 강아지가 하나 있고요.
그다음에 10반이 있어요. 그렇죠 그래서 이 10반과 LCD를 사실은 구분해 보자라고 하는 어떤 그런 문제라고 보시면 될 것 같아요.
근데 사람으로 딱 이렇게 딱 직감적으로 봤었을 때 얘 외식 고기 얘 식빵 딱딱 보여요.
그쵸 근데 우리 딥러닝한테 시켜보면은 얘가 왜 식고인지 식빵인지 잘 못 알아봐요.
그게 왜 그럴까요? 그렇죠 그냥 잘 못 알아봐요. 해서 끝나면은 그런가 보다 하고 넘어가잖아요.
근데 이유가 있어요.
그래서 사람은 사람은 우리 이 이미지를 볼 때 얘는 대상 물체로 봐요.
식빵 웰시코기 개 이렇게 보잖아요. 근데 우리 딥러닝이라고 하는 어떤 인공지능 모델을 학습시킬 때 어떻게 학습시키냐면 이건 웰시 코기야 이건 식빵이 이렇게 보는 게 아니고요.
우리 여기 색감 있죠 그다음에 질감 이 사진의 질감이나 색감을 가지고 학습을 시켜요.
그래서 이런 색깔이고 이런 질감을 가지면은 얘는 식빵일 거야 이런 색깔을 가지고 이런 질갑이면은 얘는 개일 거야 이렇게 본단 말이에요.
그렇죠 그러면 이 색깔하고 질감 이 텍스처라고 하는 질감이 굉장히 유사해요.
그러면 이걸 잘 구분하겠냐는 거예요. 그죠? 그런 이유일 수도 있어요.
이것도 마찬가지예요. 푸들과 양념 치킨이 있어요.
그렇죠 그래서 텍스처하고 우리 색감하고 질감으로 한번 보자는 얘기예요.
둘이 굉장히 비슷해요.
그렇죠 그래서 이거를 바라보는 어떤 관점 때문에 사실 구분을 잘 못하는 이거를 잘 구분하기 위해서 또 연구를 하시는 분들이 있어요.
그게 미세 분류라고 얘기를 하거든요. 파인 레이드.
그래서 우리 색깔하고 질감만 가지고 질감만 말고 또 다른 영역을 고민해서 우리 학습을 한번 해보자 그러면 더 잘 구분할 수 있지 않겠느냐라고 하는 어떤 부분으로 바라보는 거죠.
그렇죠 여기 옆에 한번 볼게요. 여기 보면은 여기 스톱 스톱 사이판 도로 가면은 정지 표시예요.
정지 표시. 그래서 사람 딱 봤었을 때 문자 읽을 줄 아는 사람은 문자 못 읽어도 이게 무슨 의미인지 다 알아요.
그렇죠 멈춰라라고 이렇게 그래서 근데 이거를 인공지능은 학습이 잘못되면 어떻게 보냐면 스피드림이 45 45kg 이하로 스피드를 조절해 주세요라고 인식하기도 한다라는 거예요.
이런 직관적인 이 간단한 문제도 그렇죠 이 두 번째 이 사례는 뭐냐면요.
인공지능은 a한테 인공지능 이 두 가지 의미를 물어봤어.
그렇죠 그래서 그랬더니 뭐라고 얘기하냐면 제가 이미지 에셜 패턴이라고 얘기를 하는데 이걸 딱 넣었더니 얘 뭐야라고 물어보더니 킹 펭귄이에요.
그래서 펭귄 큰 펭귄 있잖아요. 황제 펭귄 그죠 그리고 요 괴라란 거 요 딱 패턴 딱 넣었더니 뭐라고 그러냐면 스타피시에 스타피시가 완전 불가살이거든요.
그렇죠 그래서 얘는 딱 그래요. 그러니까 여기 보니까 색감이 노란색 회색 검은색 있어요.
텍스처하고 색감 본다고 했죠. 그죠 근데 우리 펭귄 생각해 봐요.
노란색에 이거 황제 펭귄 그잖아요. 똑같잖아요.
그렇죠 그래서 자기가 알고 있는 범위 내에서 주는 거예요.
스타 PC 우리 불가사리 불가살 요 이렇게 이런 패턴들 갖고 있는 애들 있잖아요.
그죠 그러니까는 이런 전혀 관계없는 이런 이미지가 들어오더라도 자기가 알고 있는 아니면 그 색감과 패턴과 비슷한 거 그런 식으로 결과를 준다는 얘기 그렇죠 아직 불완전하죠.
그렇죠 그래서 이런 인식이 불완전한 인식을 가진 모델을 가지고 실제 우리 리얼 라이프에 적용을 해봤더니 어떤 문제가 터지냐면 이거 실제로 우리나라에 있었던 사건이에요.
2023년 11월 8월 8일자의 신문이에요. 그래서 로봇 암이 있어요.
그러니까 로봇 팔 있죠 그렇죠 이 로봇 센서가 고장 나서 사람을 박스로 인식하는 거예요.
그래서 경남 고성입니다. 우리 지역에서 일어난 거예요.
그렇죠 그래서 작업장에서 로봇 센서가 고장나서 사람을 박스로 인식해 갖고 사람이 죽었어요.
실제로 일어나는 일 그죠 아까 봤듯이 절도범으로 누명 씌우기도 하고 아직 한계점이 있다라는 얘기예요.
그렇죠 그다음에 두 번째예요. 그다음에 자율주행 자동차 사고예요.
그래서 아마 여러분들 아마 자율주행과 관련된 관심들도 좀 있을 것 같은데요.
사실 우리나라의 자율주행은요 크게 많이 보급되지 않았어요.
근데 미국 샌프란시스코만 가도 실제로 지금 웨이모라고 하는 회사 그래서 실제로 사람이 없이 주행합니다.
그래서 사실 기술적으로 우리가 부족해서 도입이 안 된 게 아니라 택시기사 아저씨들 엄청 반대예요.
우리 먹고 살아야 되는데 그거 들어오면 어떡합니까?
지금 그래서 반대해서 못하는 거지 사실 가능합니다.
우버나 웨이보 미국에서는 굉장히 많이 쓰고 있어요.
근데 그 자율주행 자동차 사고가 났었을 때 그러면 자동차가 문제인 거냐 사람이 문제인 거냐 사실 이거는 굉장히 논란의 여지가 있었거든요.
그래서 그래서 2018년도에 사야해요. 그래서 이 미국에서 자율주행하던 이제 차량을 탔던 사람이 있어요.
근데 이게 사고가 났네 그러면 이게 자동차 사고가 아니면 자동차가 잘못한 것과 사람이 잘못해 그러니까 첫 번째 판례로 올라가서 결정됐던 그렇죠 그런 사건이 있어요.
영상 하나 볼게요. 그럼 이 사건이 어떻게 진행이 됐는지요?
갑자기 튀어나오죠. 그렇죠
이 당시에 이제 사람이 뭘 하고 있었느냐가 중요한 거죠.
그렇죠 근데 전방을 주시했던 게 아니라 밑에 아마 핸드폰 보고 있었던 거예요.
이렇게 갑자기 나타나서 이제 중독 안 된 거죠.
사람이 직접 운전해서 피하기 쉬운 상황은 아니었거든요.
결론적으로는 이 사건에서는 판결이 어떻게 났냐면은 그래도 사람이 제어할 수 있지 않았느냐라고 봐서 사람한테 보호 관찰 3년 실제로 첫 판례예요.
그래서 자율주행 자동차와 관련된 사고 중에 이게 차가 잘못된 거냐 사람이 잘못된 거냐라고 이제 우리 법원 가서 판결한 첫 번째 사례라고 보시면 될 것 같아요.
하지만 지금은 첫 번째 사례는 사람이 잘못됐다 라고 본 거예요.
그죠 그래서 아직까지는 좀 발전이 좀 덜 되고 있죠.
그렇죠 그래서 이런 사례들도 존재한다 라고 이야기를 드립니다.
그러면 왜 인공지능이 일반 인공지능 또는 슈퍼 인공지능 가는 길이 왜 이렇게 어 이런 한계점은 왜 보일까요라는 어떤 이제 의문이 좀 들어요.
그렇죠 그래서 아직까지 가야 되는 길이 있다라고 하면은 뭔가 문제가 있다라는 얘기는 거거든요.
어렵다라는 얘기거든요.
그러면 그 어려운 요소 도대체 무엇일까라고 해서 한번 정리를 해 봤어요.
그래서 사실 이거보다도 더 많아요. 엄청 많아요.
그래서 각각 어떤 이제 관점에 따라서 사실 이 어려운 문제들을 굉장히 많이 나열할 수 있는데 그중에 그래도 공통적이고 대표적인 걸 한번 뽑아봤어요.
크게 네 가지로요. 그렇죠 첫 번째로는 학습 문제라고 봤어요.
저는요. 그래서 이 학습은 사실은 어렵기도 하고 그렇죠.
시간이 오래 걸 어렵다는 얘기는 뭐냐면 해결하고자 하는 문제가 하나가 아닐 가능성이 높잖아요.
그렇죠 여러 가지 문제를 풀려고 하면 굉장히 또 어려워져요.
그다음에 그거를 학습을 시키는 데는 뭔가 알고리즘을 만들거나 모델을 만드는 것들은 사실은 좀 오래 걸리죠.
그렇죠 그래서 최적의 학습 방법 찾는 거 쉽지 않죠.
그래서 특히나 어떤 특정한 분야에서는 굉장히 잘 돼요.
이제 새로운 도메인에서 성능이 굉장히 잘 나오는데 그거를 그 토픽 그 도메인을 바꿨을 때는 그러면 또 성능이 잘 나오느냐 잘 안 나올 수 있다라는 거예요.
쉽게 예를 예를 들어서 그런 거예요. 우리 중국집 가면 서빙 로봇 있어요.
서빙 로봇 되게 잘 돼 보이죠. 그렇죠 근데 그 서빙 로봇 a라고 하는 중국 집에서 지금 돌리는 서빙 로봇 잘 된다 그래서 이거 딱 갖고 가 b라고 하는 중국집에 갖다 놓으면 잘할까요?
잘 못해요. 왜 그러면 a라고 하는 그 중국집의 환경에 대해서 학습을 했거든요.
그 안에서 우리 테이블 있잖아요. 책상 있잖아요.
우리 먹는 식탁 있잖아요. 식탁의 위치만 바뀌어도 얘 어디 가서 부딪혀요 그렇죠 같은 일을 시켰는데도 불구하고 장소가 바뀌고 환경이 바뀌잖아요.
그러면 잘 못한다는 얘기예요. 즉 일반화가 안 된다는 거죠.
그렇죠 이런 문제 생겨요. 아까도 얘기했잖아요.
자동차 만드는 로봇 팔에다가 우리 음식 만들어보라고 시키면 잘할까요?
잘 못한다는 얘기예요.
근데 일반 인공지능이라고 얘기하면 사람과 같은 지능을 가진 인공지능이라고 하면 이거 해야죠.
사람 자동차도 만들고요. 음식도 만들고요. 그렇잖아요.
그렇죠 그게 어렵다는 거예요. 그 두 가지를 그러면 같이 학습을 시켜볼까 그런 생각이 들잖아요.
근데 그 어려워지죠. 학습이 그렇죠 같은 그런 문제예요.
두 번째는 데이터예요. 그래서 실세계의 대량의 데이터가 필요해요.
근데 이게 웃겨요. 요즘에 우리 빅데이터 시대에 살고 있다고 하잖아요.
그렇죠 그럼 데이터가 없대요. 왜 없어? 지금 많다고 하는 게 빅데이터 시대인데 그렇죠 근데 인공지능의 학습에 필요한 데이터는 어떤 데이터냐면요.
그냥 단순히 많은 데이터가 아니고요. 학습을 잘할 수 있는 고품질 데이터가 필요해요.
우리 이렇게 한번 생각을 한번 해볼까요? 여러분들 공부해요.
학습해야 돼요. 지금 뭔가 인공지능 시험 잘 봐야 돼서 a불 받아야 되는데 인공지능 세상에 있는 인공지능 모든 자료를 갖다 주면은 공부 잘할 수 있어요.
아니잖아요. 이 시험에서 이 수업에서 나오는 어떤 핵심 문제를 딱 뽑아줘야지 공부 잘할 수 있잖아.
그렇잖아요. 그게 고품질 데이터잖아요. 그렇죠 그런 거야.
그래서 학습을 잘 시키려고 하면 거기에 맞는 딱 맞는 좋은 데이터가 필요한데요.
노이즈가 너무 많이 끼어 있는 거죠. 그럼 그걸 누가 필터링하고 누가 처리를 해줘요?
사람이 해야 되는 거예요. 너무 많은 거예요. 그렇죠 그래서 이런 데이터들이 많지가 않다라는 거예요.
그래서 정부에서도 인공지능 데이터를 만들어야 되는데 부족하다 하는 얘기가 뭐냐면 진짜 데이터가 없어서 그런 게 아니고요.
인공지능 학습에 가장 잘 쓸 수 있고 효과적으로 나타낼 수 있는 데이터가 없다는 거예요.
그래서 그 데이터를 정제하거나 만들거나 이렇게 해야 되는 거죠.
그 그래서 그럼에도 불구하고 무슨 문제가 생기냐 데이터 편향 생겨요.
정제했어요. 진짜 우리 데이터 만들었어요. 아마존에서 이런 거 안 했겠어요 걔네들 바보 아니에요 바보 아니겠지 당연히 그렇죠.
그럼에도 불구하고 무슨 문제가 생기냐면 데이터 편향이 생겨 이게 왜 생기냐면 여러분들 혹시나 확률과 통계 배울 때 모집단 파퓰레이션이라고 하는 개념 배웠어요.
그죠? 아마 알 거예요. 그래서 정확히 내가 이 문제를 해결하려고 하면은 모집단에 가까운 데이터를 갖고 있어야 돼요.
모든 상황에 대해서 근데 모집단에 가까운 데이터 가는 게 쉬워요.
이런 거예요. 쉽게 예를 들어서 내가 이 세계에 있는 이 전 세계에 있는 대학생 남학생 있잖아요.
남학생의 흡연 흡연하는 남학생을 조사하고 싶어해요.
그래서 데이터를 다 모으려고 해요. 그래서 우리나라뿐만 아니라 일본 인도 파키스탄 다 해요.
그렇죠 이거 쉬운 일이에요. 그래서 그렇지 않잖아요.
그래서 어떻게 해요? 모집단에 가까운 것들을 못하죠.
우리 샘플 표본이라고 하는 어떤 데이터를 가지고 시작을 해요.
그리고 이 표본의 데이터를 모집단에 가깝게 만들려고 하죠.
그 그게 통계적인 기법이었잖아요. 그죠 결국에는 우리가 만들 수 있는 데이터는 표본 샘플 데이터예요.
그렇죠. 그렇게 만들다 보니까 한쪽에 치우치거나 이런 편향들이 일어날 수밖에 없다라는 거예요.
그죠 그래서 신뢰성이 저하될 수 있다. 두 번째 데이터 문제가 발생할 수 있다라는 거죠.
그리고 세 번째예요. 물론 사람이 잘하는 거. 그렇죠.
사람이 딱 보고 인식하고 이런 것들도 잘하는 것도 중요하지만 사람과 같은 인공지능 인간과 같은 인공지능을 만든다라고 하면 인지적인 측면 정신 세계 그죠 좀 무역인 거 되게 표현하기 어려운 거 이런 것도 잘해야 돼요.
그죠 근데 이거 어떻게 만들까요? 컴퓨터 공학과에서 이거 딱 직관적인 건 만들 수 있어요.
그렇죠 그래서 내가 딱 다가갔을 때 문 열어 그래서 자동문 같은 거 이런 거 간단하잖아요.
그렇죠 근데 마음을 어떻게 읽어 내가 지금 니네 마음도 모르겠는데 그잖아요.
그런 거 하나는 이게 정신 세계 창의성 무형 이런 거 스토리텔링 못 한다고 했잖아요.
그죠 이런 거 되게 어렵다는 거예요. 그 그래서 인간처럼 추론하고 상식을 이해하는 어떤 이런 능력을 가지게끔 우리 기계를 만든다는 거는 굉장히 어려운 부분이다라고 볼 수 있어요.
그리고 네 번째예요. 그래서 이 네 번째는 윤리적 문제예요.
그래서 어찌 보면 이제 기술적으로는 가능할 수도 있는데 개인 정보 보호 문제 이런 거 그쵸 이런 것 때문에 좀 막혀 있거나 그 부분을 할 수 없는 어떤 그런 부분들도 존재하는 것 같아요.
그래서 특히나 이제 이게 대표적인 사례가 언제였냐면 이루다라고 하는 챗봇 혹시 들어본 적 있어요?
루다 챗봇 이루다 태포 그래서 이제 이루다라고 하는 챗봇이 하나 있었는데 챗봇이다 보니까 이게 사람과 사람이 하는 게 아니라 사람이 저기 인공지능하고 대화를 하는 거야.
그래서 페르소나라고 이제 뭔가를 입혀요. 그래서 어떤 여자 캐릭터를 하나 만들어 가지고 답변을 해 주는 거예요.
근데 그 챗봇을 만들 때 이제 어떻게 만들었냐면 카카오톡에 있는 대화 로그 있잖아요.
대화 그걸 가지고 이제 학습을 시켰어요. 왜 사람처럼 답변하게끔 만들어야 되니까요.
근데 이제 그러다 보니까 이걸 이제 잘 정제해서 만들었어야 되는데 주소 계좌번호 전화번호 뭐 이런 것까지 다 들어가 있는 거야.
그래서 이제 막 대화를 하다 보면 진짜 특정인의 전화번호가 툭툭 튀어나오고요.
특정인의 집 주소가 막 날아와요. 그래서 진짜 찾아보면 있는 주소야 그죠 있는 이름이고 그래서 이제 의도치 않게 다른 사람의 정보들이 막 공개되기 시작했어요.
그래서 그 서비스 딱 열자마자 한 3일인가 4일 만에 셧다운 했어요.
못 쓰죠. 그렇게 되면 그렇죠 못 쓰는 거잖아요. 그래서 기술적으로는 있지만 사실 이런 문제들 때문에 쓸 수 없는 어떤 그런 부분들도 있을 거고요.
그렇죠 악용 가능성도 다 다시 존재해요. 그래 디페이트 작년에 굉장히 핫했어요.
그렇죠 그래서 이 디페이트 글을 잘 쓰면 좋지만 또 잘못 쓰는 어떤 경우에는 또 굉장히 사회적인 이슈가 될 수도 있죠.
그리고 여기 조그마하게 내가 적어놨는데 얼굴로 범죄자 예측하는 AI 아까 이제 비슷한 사례예요.
그래서 사실 이 얼굴로 범죄자를 예측하는 AI는 어디서부터 시작했냐면 약간 영화부터 시작했어요.
마이너리티 리포트라고 하는 영화 알아요. 톰크루즈 나오는 영화 그래서 그거 영화 보면 좀 옛날 영화예요.
그래서 아는 학생도 있고 모르는 학생이 있을 것 같아 재밌어요.
보면 그래서 그게 이제 범죄가 범죄자가 범죄를 일으켰던 장면을 잡는 게 아니라 예측하는 거예요.
이 사람이 범죄를 일으킬 것이다. 그래서 미리 가서 잡는 거야.
그래서 약간 비슷해요. 그래서 범죄자 얼굴만 딱 보고 얘 범죄 일으킬 확률이 몇 퍼센트냐 이렇게 보자는 연구였어요.
실제로 2021년도에 이 연구가 진행이 됐고 논문이 실제로 출간이 됐어요.
근데 이 출간되고 무슨 얘기가 나왔냐면 야 이거 데이터 편향이 있을 수 있어.
이거 정말 맞아 그래서 니네 자료 봤더니 유색인 쪽만 다 잤대.
이거 맞는 결과야라고 해서 실제로 이 논문이 철회됐어요.
그리고 인공지능 연구자들한테 뭐라고 했냐면 야 이런 연구 하지 마라고 해서 저도 이런 연구 못해요.
이건 윤리적인 문제가 있어서 기술적으론 가능하지만 사실 편향적인 문제들을 해결하지 못했기 때문에 그리고 직접적으로 누군가에게 타겟을 줄 수 있기 때문에 이거는 못하는 일인 거예요.
그렇죠 이런 부분도 있다는 거예요.
그래서 기술적으로 아니면 지금 주어져 있는 데이터적으로 이런 부분들도 존재하지만 기술적으로 다 준비됐지만 어떠한 이유 때문에 못하는 것들도 그래서 이런 게 있어서 일반 인공질로 가는 길은 쉽지가 않다는 거죠.
시 했고요. 그다음에 조금만 더 하고 쉬는 시간 하나 한 15분만 더 하고요.
다음은 우리 살펴볼 게 인공지능의 흐름인데요. 이제 인공지능이 어떤 관점으로 그렇죠?
이제 연구가 되었고 이제 이런 부분들을 이렇게 조금 설명하려고 해요.
그래서 여기 이제 첫 번째는 이제 인공지능 포함 단계인데요.
이 포함 관계에는 우리 제가 이걸 뭘 설명하려고 하냐면 이제 인공지능 머신러닝 딥러닝 이런 단어들 많이 들어봤죠 그렇죠 근데 어떨 때 이제 어떤 사람은 학자는 이렇게 얘기해요.
야 딥러닝 인공지능이다 머신러닝이 인공지능이지 뭐 이렇게 혼용해서 쓰기도 해요.
사실은 근데 이제 인공지능을 배우니 그러면 이 개념을 조금 더 더 잘 잡고 한번 가볼게요.
그래서 사실 인공지능이라고 하는 이 단어는 굉장히 크기가 큰 단어예요.
그래서 사람이 해야 할 일을 기계가 대신할 수 있는 어떤 프로그램이라고 하면 그걸 다 인공지능이라고 불러요.
그죠?
우리 아까 자동문 제가 얘기를 했어요. 자동문 인공지능일까요?
자동문 인공지능이 아닐까요? 인공지능이다 손 인공지능이 아니다.
뭐야 니네 손 안 든 사람 다 손 그렇죠 저는 인공지능이라고 봐요.
왜 사람이 할 일을 기계가 대신 해 주잖아요. 사람이 문을 열어주잖아요.
그렇죠 근데 기계가 대신 열어줬어요. 센서를 통해서 인식을 해서요.
근데 이 자동문 만드는데 복잡한 기술만이 필요할까요라는 거예요.
조건만 있으면 돼요. 센서를 통해서 뭔가 인지가 됐어요.
인지되면 문 열어놔 그죠? 여러분들도 만들 수 있어 간단한 프로그램 그죠?
맞아요. 그래서 이 AI라고 하는 인공지능의 영역은요.
자료 구조라고 하는 방법 알고리즘이라고 하는 방법 있잖아요.
여러 가지 방법들이 다 존재해요. 단 어떤 목적으로 사람이 해야 할 일을 기계가 대신할 수 있는 목적만 가진다고 합니다.
그걸 다 인공지능이라고 얘기를 해요. 근데 그런 여러 가지 방법들 중에요.
우리 러닝이라고 하는 방법을 쓰는 영역이 있어요.
이 러닝이라고 하는 방법은 조금 달라요. 우리 알고 있는 프로그램 코딩하고 하는 방법하고요.
그래서 우리 프로그램 코딩이라고 하는 방법은 우리 막 메서드 다 선언하잖아요.
그렇죠 메서드 안에서 데이터 들어왔을 때 어떻게 어떻게 처리해라 아웃풋 리턴 해라 해가지고 출력해라 이렇게 하잖아요.
그러면 그 얘기는 뭐냐면 이 데이터가 들어왔을 때 어떻게 처리해야 되는지 우리가 알고 짠다는 얘기예요.
그렇죠 근데 이 러닝이라고 하는 얘기는 메서드를 우리가 만들지 않아요.
데이터를 툭 던져줍니다. 그 안에서 얘가 계속 반복적으로 보면서 패턴을 찾아요.
그죠? 패턴을 하나 찾습니다. 그래서 새로운 어떤 값이 들어왔을 때 그 패턴에 맞춰봐요.
맞춰서 가지고 어떤 값을 던져주는 게 러닝이라고 하는 방법이에요.
그래서 기존에 우리가 알고 있던 방법이 약간 달라요.
그렇죠 그래서 그 영역 그 방법을 쓰는 내용을 우리는 머신러닝이라는 어떤 영역으로 바라볼게라고 하는 거예요.
그쵸 그래서 AI는 굉장히 다양한 방법들이 존재하고 그중에 하나 러닝이라고 하는 방법을 쓰는 게 머신러닝이라고 합니다.
기계 학습이라고 하는 영역이 그래서 기계 학습도 그렇게 바라보는 모델들이 굉장히 많아요.
선형 회귀도 있고 디시던 틀이라고 하는 부분도 있고 여러 가지 방법들이 있어요.
하지만 그 방법들 중에 우리 인공 신경망이라고 하는 방법이 있어요.
그래서 사람의 뇌세포를 모방해서 만든 뉴런이라고 하는 어떤 이 모델을 가지고 이제 시작했던 어떤 그 방법이 있는데 그거를 극대화하기 위해 막 늘려놔요.
딥하게 그렇죠 그래서 심층이라고 하는 어떤 이 단어를 써가면서요.
그래서 크게 만들었던 어떤 그런 이제 기술들이 딥러닝이라고 하는 거예요.
그래서 약간 차이가 있죠. 그렇죠 그래서 인공지능 굉장히 큰 개념이고 그중에 어떤 하나의 방법이 러닝이라고 하는 방법을 쓰는 게 머신러닝의 영역이에요.
하지만 이 머신러닝도 굉장히 여러 가지 방법이 있는데 딥러닝은 그중에 심층 신경망이라고 하는 신경망이라고 하는 이 모델을 쓰는 어떤 그 방법이 딥러닝이었어요.
그래서 약간 얘네들도 같이 쓰이는 것 같지만 포용 관계가 존재하는 어떤 게 상위고 어떤 게 하위 그죠?
그래서 이런 개념들이 존재한다라는 거예요. 그다음에 두 번째예요.
그래서 이제 기호주의 인공 지능 연결주의 인공지능 통계적 인공지능 이 세 가지를 좀 말씀을 드릴 텐데요.
이게 인공지능의 약간 어떻게 보면 흐름이 그러니까 연구했던 흐름 그렇죠 그래서 인공지능을 어떻게 바라보냐 이게 관점일 수도 있어요.
그죠 그 기호주의 인공지능은 뭐냐 하면 말 그대로 심볼리즘 기호나 규칙을 사용해서 룰 베이스로 접근하는 거 그래서 룰 베이스라고 하면 이제 여러분들 잘 모르는데 여러분들 알고 있는 코딩으로 접근하는 거예요.
프로그램 그래서 입력이 들어오고요. 메서드 펑션 있죠.
펑션이 이제 뭔가 처리해줘서 값을 리턴해 주는 프로그램 구조로 본 거야.
그래서 쉽게 얘기하면은 여기 룰 기반 룰 베이스라고 했잖아요.
조건은 뭐야 이프 만약에 여기에 딱 해당하면 d 뭐예요?
액션 리턴 해 주는 거예요. 그렇죠 그렇게 바라봤던 게 기호주의예요.
그래서 여러분들이 알고 있는 자료 구조나 알고리즘 그죠 좀 복잡해지면 와일문도 있을 거고요.
방복문도 있겠죠. 구조체도 있을 거고요. 그래서 그래서 그렇게 봤던 게 기호주의예요.
여러분들이 1 2학년 때 열심히 했던 프로그래밍 법을 만들 그다음에 두 번째 연결주의의 커넥션 니즘이라고 하는 건 뭐냐면 야 인공지능은 사람의 지능 아니야 그래서 사람의 뇌처럼 생각해야지라고 이제 바라봤던 거예요.
그래서 근데 사람 우리 뇌 있잖아요. 왜 뇌에 보면 뇌세포라는 게 있어요 우리 뇌파 뇌 신호 이런 얘기하잖아요.
그렇죠 전기적 신호로 뭔가 정보를 전달한다 얘기 들어본 적 있죠.
그렇죠 얘네들은 연결주의는 신호적 관점으로 바라보는 거예요.
말 그대로 뇌에 뇌세포를 이제 모방해서 뉴런이라고 하는 뇌세포를 모방해서 모델을 하나 만들어 놓고 데이터가 막 넘어가는 게 아니라 신호가 넘어가는 어떤 형태로 바 그렇죠 그게 커넥션 이자이라고 봐주시면 돼요.
마지막으로 통계주의 스테티스티카는 어떤 이 계열은 뭐냐면 90년대부터 사용하기 시작을 했는데 말 그대로 데이터적인 관점이에요.
데이터만 가지고 이 데이터 안에 뭐가 있을까 그래서 왜 통계주의라고 하냐 하면 이때 제일 먼저 시작했던 게 우리 정형 데이터라고 얘기를 하죠.
많이 그래서 엑셀에 보면 우리 표 있어요. 그래서 막 우리 숫자 넣잖아요.
그렇죠 그걸 우리가 정형 데이터라고 많이 얘기를 해요.
그래서 정적으로 딱 되어 있잖아요. 그렇죠 거기서부터 시작해서 통계주의라고 얘기를 해요.
근데 지금은 그 통계만 바라보는 게 아니라 비정형 데이터 그죠?
비정형 데이터도 바라봅니다.
그죠 그래서 이 통계주의는 이제 그 데이터 안에 뭐가 있을까 통계도 내보고 더하기도 해보고 표준 편차도 내보고 그렇죠 그렇게 시작했던 게 통계적인 주의예요.
그래서 이게 발전해서 지금 어디로 가고 있냐면 데이터 사이언스 여러분들 많이 들어보는 거죠.
데이터 사이언스 쪽으로 가고 있는 그런 상황이라고 보시면 될 것 같아요.
그래서 간단하게 아까 제가 말씀을 드렸지만 규칙 기반 그렇죠 그래서 여러분들이 알고 있는 코딩이에요.
프로그램 프로그램 코딩 방법으로 풀어보자는 얘기예요.
그래서 문제 해결에 어떤 지식을 효과적으로 표현한다고 하는데 이런 조건문 이프 앤 그쵸 그래서 어떤 조건에 걸리면 액션을 유턴해라 또는 이런 이제 논리 같은 것들로 할 수 있어요.
그렇죠. 만약에 뭐면 뭐가 참이면 뭐는 거짓이다 뭐도 참이다 이런 식으로 이렇게 논리적으로 표현해 볼 수도 있죠.
굉장히 명세해집니다.
그렇죠 그래서 여기 보니까 이 y가 참이고 d가 참이면 제 제가 참이다 이렇게 선언해가지고 우리 프로그램 만들 수 있잖아요.
그렇죠 이렇게 접근했던 게 규칙 기반 기호주의 기법이라고 보시면 될 것 같아요.
그다음에 우리 연결주의 있어요. 이 인공지능을 신호적 관점으로 바라는 거죠.
그래서 말 그대로 여기 보니까는 뇌 세포 그래서 뉴런이라고 얘기를 해요.
그래서 우리 뇌에 보면 이런 세포들이 여러 개 있거든요.
여기 이제 덴트리스라고 하는 게 이제 가지 돌기라고 얘기를 해요.
이 가지 돌기는 뭐냐 하면 입력 신호를 받아들일 수 있는 이제 인풋 창이에요.
그죠 그래서 이렇게 신호가 들어와요. 이렇게 신호가 들어오면 이 신호가 어떻게 되냐면 요 셀 바디하고 이 핵이라고 하는 부분으로 쫙 모아져요.
모아져요. 그래서 모아진다는 얘기는 뭐냐면 여기서 들어오는 신호 여기서 들어온 신호 여기서 들어온 신호를 다 더한다는 얘기예요.
그렇죠 다 더해서 다 합친 이 값을 이렇게 아 그래서 이거를 우리 모형화시켜봤더니 이렇게 그림이 나 할 수 있어요.
그렇죠 인풋 아웃풋 이렇게 나올 테죠. 그 근데 뇌세포가 이렇게 하나만 있어요.
아니잖아요. 그렇죠 이 뇌세포들이 막 연결돼 있는 게 여러분들의 뇌야 그렇잖아요.
그러면 요거 하나만 있을 거냐 아니잖아요. 그렇죠 이거를 이렇게 요렇게 요렇게 붙여서 네트워크 모델 하나 만들어보자라는 거야.
그러면 여기에 신호가 들어갔었을 때 여기에 무슨 결과가 나올 것이다라고 봤던 게 연결 주의라고 보시면 돼요.
이게 이 인공신경망으로 만들어낸 그냥 간단한 샘플이에요.
그죠? 근데 여기 봤더니 입력층 히드웨어라고 하면 수문층 그다음에 출력층이 있어요.
그래서 이렇게 보면 이제 이게 뭔지 잘 모를 텐데 여기 입력으로 들어갈 수 있는 게 우리 쌀 마늘 밀가루 이거 3개예요.
3개 근데 여기 숫자가 있어요. 그렇죠 그래서 나는 입력을 쌀을 0만큼만 입력할게 아무것도 입력 안 하겠다는 얘기예요.
쌀을 그죠 마늘은 0.5 그래서 절반만 입력할게 그리고 밀가루는 1만큼 입력해 줄게.
그렇죠. 그랬었을 때 여기 값이 한식일 거냐 양식일 거냐라는 거예요.
그죠? 그래서 숫자가 들어갔어요. 이게 신호라고 본 거예요.
그죠? 그러면 이 출력층도 사실은 뭔가 숫자 한식의 숫자 변 양식의 숫자 변 이렇게 나올 거예요.
그렇죠 근데 여기 보니까 이게 다 이어져 있네. 그죠?
근데 여기 위에 보니까 숫자들이 있어요. 이걸 우리는 가중치라고 얘기를 해요.
그래서 여기 보니까 밀가루가 1만큼 들어갔는데 여기 밥에도 이렇게 선이 있고 스파게티에도 선이 있어요.
그래서 요 밀가루는 밥으로 가는데 0.1만큼 가중치다 이렇게 이 말은 뭐냐면 요 1이 들어갔었을 때 밥으로 가는 요 선에는 1 곱하기 0.1이라고 하는 신호가 들어간다는 얘기 그렇죠 그리고 밀가루는 스파게티로 가는데 1 곱하기 0.8이라고 하는 이 값이 여기에 도착한다는 얘기예요.
그렇죠 근데 가만히 생각해 봐요. 야 밀가루로 밥 만드는 게 맞아요 아니면 밀가루로 스파게티 만드는 게 맞아요.
스파게티 맞는 게 맞죠? 그럼 가중치의 값을 보니까 하나는 0.1이고 하나는 0.8이고 당연히 여기 스파게티의 가중치가 높겠죠 그쵸?
신호가 더 많이 간다는 얘기예요. 맞잖아요. 그래서 이 신호를 한번 모아보자는 거예요.
이런 식으로 그래서 봤더니 밥으로 가는 요 0.51 이렇게 들어가잖아요.
그렇죠 그래서 요 값을 이제 다 곱해서 더해봤어요.
그래서 이 밥에는 도대체 숫자가 어떻게 되느냐 한번 볼게요.
그래서 쌀 0만큼 들어갔어요.
곱하기 1 1이라고 하지만 이 0 될 거예요. 만일 0.5 들어갔어요.
하지만 이 선을 봤더니 0.1이라고 적혀 있어요.
곱해봤더니 여기 숫자 나오겠죠. 1 곱하기 0.2 그래서 다 이거를 더해봤더니 얘는 0.15라고 하는 숫자가 나왔어요.
그러면 밀가루하고 마늘 0.51 들어갔는데 스파게티 쪽에서는 그럼 어떻게 되느냐 0 곱하기 0 0.5 곱하기 0.2 1 곱하기 0.8 하니까 0.9라고 하는 숫자가 나와요.
0.9하고 0.2로 나눠서 어디가 그다 스파게티 그냥 당연히 마늘하고 밀가루 들어갔으니 밥보다는 스파게티에 가깝지 그러면은 여기도 숫자가 분명히 있을 거예요.
그러면 어디가 높을 것 같아요 양식이 높겠죠 당연히 그렇죠 이런 신호로 우리가 뭔가를 결정해 보겠다는 거예요.
근데 여기 보면 우리가 아는 거는 우리가 입력하는 거는 이 입력층에 이 파란색 숫자 있잖아요.
이거는 우리가 넣는 거예요.
그렇죠 근데 제일 중요한 숫자는 뭐냐면 요 빨간색 숫자예요.
이 빨간색 숫자는 우리가 정하는 숫자가 아니에요.
학습이라고 하는 그죠? 여러 가지의 데이터를 보고 이 숫자들이 결정이 돼요.
그래서 이 숫자가 이 밀가루 넣었을 때 스파게티가 0.8이 된 이유는 뭐냐면 밀가루 가지고 스파게티 만들었던 데이터의 양이 더 많았기 때문에 0.8로 막 이렇게 업데이트 되면서 숫자가 여기에 커지겠죠.
다신 밥은 역이 줄어들 거예요. 그렇잖아요. 그렇잖아요.
그래서 숫자들이 처음에는 0.5부터 시작했고 0.
6대 0.7대고 0.8 대고 이런 식으로 바뀔 거잖아요.
데이터를 많이 보면 볼수록 그래서 얘네들은 다 이 빨간색은 학습이라고 하는 거를 통해서 결정이 되는 숫자예요.
그래서 이게 학습이 어느 정도 잘 되면 이 숫자들이 고정이 되겠죠.
그렇죠 그래서 이게 수렴한다라는 얘기를 해요. 그래서 어떤 숫자가 들어가도 크게 변하지 않는다.
그래서 수렴하는 단계로 크게 변하지 않는 순간이 오면은 뭐를 넣더라도 이 결과는 괜찮겠죠.
그죠 그래서 그게 학습이라고 하는 연결 주의로 바라보는 방법이다라고 보시면 될 것 같아요.
마지막으로 통계 기반의 내용이에요. 그래서 이 통계 기반은 데이터 사이언스로 이제 확장했다라고 얘기를 했죠.
그렇죠 그래서 이전에는 아까 얘기했지만 정형 데이터 엑셀에 있는 어떤 고 데이터부터 시작을 했는데 사실 이 데이터 사이언스에 관련된 사례들은 굉장히 많아요.
그리고 이 데이터 사이언스 어디다 쓰려고 하는지 아마 여러분도 알 거예요.
비즈니스 고민에서 굉장히 많이 쓰고 인사이트 얻으려고 굉장히 많이 쓰죠.
그래서 근데 그런 예제보다는 아마 여러분들이 좀 재미있어 하는 어떤 그런 내용으로 갖고 오는 게 좀 더 잘 이해가 될 것 같아서 일단 스포츠에 적용된 사례를 이제 하나 갖고 왔어요.
그래서 이 통계 기반의 인공지능은 이 스포츠 중에 어디서 제일 많이 먼저 쓰였냐면요.
야구 야구에서 제일 많이 쓰였어요. 그래서 혹시 머니볼이라고 하는 영화 본 학생 있으세요?
아니 브랜드 키트 나오는 거예요. 그래서 빌리비 오클랜드 에슬리엑티스 야구 좋아하는 학생 알 거예요.
그렇죠 그래서 이제 이 머니볼 영화 보시면 우리 영화에 굉장히 얘기 많이 하는데요.
그렇죠 세이버 매트릭스라고 하는 개념이 나와 그죠?
그래서 이 빌리빈이라고 하는 이 브랜드 피트가 주인공이에요.
근데 주인공이 이제 맡고 있던 야구팀이 오클랜드 애슬레틱스라고 하는 어떤 메이저 그 팀 중에 하나인데 그 팀이 돈이 많은 팀이 아니에요 돈이 많은 팀이 아니라 그래서 이제 우수한 선수를 돈으로 사 올 수 있는 팀이 아닌 거예요.
그래서 우리나라로 치면 어디라고 봐야 되죠? 돈 없는 팀 그렇죠 근데 좀 낮은 팀 있잖아요.
그렇죠 돈 많지 않은데 근데 이제 승리는 해야겠고 그래서 이제 통계적으로 분석해서 값어치는 이제 금액은 높지 않지만 그래도 싼 값에 효율적인 선수를 사 올 수 있는 어떤 방안들을 고민을 해요.
그래서 통계를 쫙 보죠. 보는데 통계치를 그냥 있는 그대로 보는 게 아니라 이면을 보는 거예요.
이면을 그쵸? 숨겨져 있는 통계치가 그렇죠 그런 부분들을 보는 게 세이버 매트릭스라고 얘기를 해요.
그래서 실제로 빌리빈이라고 하는 그 단장 브레드 피트가 주인공을 맡았던 오클랜드 에슬레티스가 2천년이에요.
제가 아직도 기억하는데요. 그걸로 이제 굉장히 성공을 거둬요.
그래서 정규 시즌에 거의 무패 행진을 해요. 한 몇십 승인가 하여튼 무패 행진을 하고 플레이오프를 딱 가죠.
그래서 그날 1차전에서 바로 탈락했어요. 하지만 그 성공 사례들이 있었거든요.
그쵸 근데 그걸 타 팀들이 봤어요. 특히나 보스턴 레드삭스 이런 이제 큰 팀들이 본 거예요.
그래서 실제로 빌리빈한테 보스턴 레드삭스가 딜을 해요.
너 우리 팀과 맞춰봐 근데 거절을 하기는 해요. 그렇죠 그래서 계속 오클랜드에 남기는 했지만 그 장면도 머니볼에 나옵니다.
그래서 보스턴 레드삭스는 이거를 도입해서 언제 우승 2004년도에 우승합니다.
밤비노의 저주를 푸는 거예요. 실제로 그런 성공들이 제일 먼저 일어났던 게 야구였었어요.
그래서 지금도 이 야구에서는 이런 부분에 투자를 굉장히 많이 하고 있고 그 효과도 굉장히 많이 보고 있습니다.
그래서 그 내용을 한번 조금 살펴보려고 해요.
채널a가 스포츠 현장의 빅데이터 혁신을 3회에 걸쳐 집중 조명합니다.
메이저리그는 한 경기를 위해 7 테라바이트, 즉 큰 도서관 하나에 맞먹는 방대한 데이터를 활용하는데요.
데이터 전쟁의 현장에 김유빈 기자가 다녀왔습니다.
밤이 없는 뉴욕 맨네핀 거리 가장 바쁜 곳 중 하나는 메이저리그 사무실입니다.
15개 경기장에서 쏟아지는 경기 데이터 한 경기만 해도 웬만한 국립도서관 정보량과 비슷합니다.
선수들의 움직임과 능력이 정량화돼 제시되는 메이저리그 경기장은 이미 데이터 전쟁터입니다.
뉴욕 매체의 흥부자인 시티 필드 이 9장에는 선수들의 경기력을 폭발시키는 비밀이 숨어 있습니다.
바로 중앙석 천장에 설치된 공사용 레이더입니다.
감독은 빅데이터로 판단합니다. 화면에는 이렇게 구현되죠.
휴스턴 브레그만 알리친 안타성 타구. 하지만 보스턴 베르 앤디가 잡아냅니다.
공과의 거리와 달리는 속도를 계산해 수비수의 위치를 미리 옮겨 놓은 겁니다.
타구의 각도와 이거리의 상관관계가 파악되면서 홈런도 비약적으로 늘었습니다.
영화 아바타에서 쓰인 모션 캡처 기술이 대표적 관절의 움직임을 조작해 어느 각도에서 부상이 나오는지를 분석하고 투수 검체 파등을 결정합니다.
염소의 저주에 걸린 시카고 컵스를 108년 만에 정상에 올려놓는 모습이었습니다.
빅데이터는 계속 진화하고 있습니다. 앞으로는 메이저리그 선수들이 투수별로 맞춤화된 타격 훈련을 받을 수 있습니다.
메이저리그 최고의 투수인 커슈의 공을 상대 타자의 입장에서 한번 쳐보겠습니다.
이처럼 커쇼의 투구 성향이 완벽하게 반영된 공간에서 훈련하는 건데요.
이런 VR 훈련은 3년 정도면 가능할 전망입니다.
철저한 보안 속에 이루어지는 메이저리그의 빅데이터 전쟁.
본격적인 데이터 활용이 스포츠의 패러다임을 바꾸고 있습니다.
채널a 뉴스 김유빈입니다.
네 여기까지 하고요. 10분 정도 쉬었다가 할게요.
23분이라서요. 33분에 다시 시작하도록 하겠습니다.
2시 15분쯤에 어
1956년에요 미국의 가명 대학이라고 아이비리그에 들어왔습니다.
아이비리그에 속한 이제 대학이고요. 동구에 있어요.
동구에 있는 이제 그런 대학인데요. 이 대학에서 여름에 학회를 하나 열어요.
학회 컨퍼런스 학회예요. 그래서 이 56년도에 이제 수학자 생물학자 이렇게 심리학자 여러 이제 학자들이 모여가지고 학회를 하나 만든다.
이 학교에서 뭘 했냐면은 인간을 대체할 수 있는 무슨 기계를 하나 만들어보자.
그래서 우리 그런 기계들을 만들 수가 없느냐 이런 것들을 실제로 논의를 하기 시작을 해요.
그래서 여기 이제 모였던 사람들이 누구냐면 아마 컴퓨터 공학도라고 하면 한 번씩은 들어봐야 되고 꼭 알았으면 하는 어떤 그런 인물들이 몇 명 있거든요.
그렇죠 폰 노이만 존 폰 노이만 혹시 들어본 적 있어요?
그렇죠 클라우드 제너 마빈 민스키 존 메카시 뭐 이런 사람들이 있어요.
그렇죠 그래서 당대 지금 굉장히 유명한 사람들이에요.
그렇죠 그런 사람들이 이제 여기 모였던 거예요.
그래서 그러면 인간을 대체하는 어떤 기계를 어떻게 만들까 이제 그런 논의들을 이제 막 시작하게 된 거죠.
그렇죠 그래서 근데 이제 웃긴 게 뭐냐면 여기서 보면은 수학자 생물학자 심리학자 왜 컴퓨터 공학자가 없지라는 생각이 좀 들어요.
그쵸 그러면 의심이 좀 들잖아요. 그렇죠 왜 컴퓨터 공학자는 없어라고 생각을 하는데 이 컴퓨터 공학이라고 하는 학문은 사실 56년도에는 존재하지 않았어요.
그래서 이 컴퓨터 공학이라고 하는 학문은 굉장히 최근에 만들어진 학문이에요.
최근에 만들어진 학문이고 이전까지는 사실 이제 대부분 이제 이 컴퓨터 공학의 이론들을 누가 누가 만들었냐면 수학자들이 많이 만들었어요.
그래서 혼노이만을 안다는 얘기는 뭐냐면 혼노이만이 수학의 어떤 알고리즘 그죠?
그 알고리즘을 가지고 우리 컴퓨터의 기본이 되는 어떤 이론들을 만들어냈어요.
아까 엘러트린이 있었죠 엘러트린도 수학자예요.
그죠?
그래서 그 수학자가 튜링 머신이라고 하는 개념들도 많이 그렇죠 그래서 사실 우리 이 학문은 수학에 굉장히 많이 의존을 하고 있어요.
그렇죠 근데 그런 이유가 사실은 존재합니다. 이게 왜 그러냐면 우리 컴퓨터라고 하는 단어
다 있어요. 그죠?
우리 우리 컴퓨터 컴퓨터 사이언스잖아요.
뒤에 이제 과학이니까요. 그렇죠 여기에 우리 이 알을 지우면 컴핏이라고 하는 동사가 돼요.
컴핏이라고 하는 동사 혹시 의미 아는 학생이 있어요 영어이긴 하지만 계산하다예요.
그렇죠 맞아요. 계산하다예요. 그래서 우리 컴퓨터라고 하는 학문은요.
컴퓨터 공학 하면은 계산하는 것부터 시작을 했어요.
그래서 계산기 만드는 학과로 시작을 했어요. 그래서 예전에 컴퓨터 공학과의 전신 이름이 뭐냐면 전자계산학과예요.
그래서 60년대 전자 기상학업을 시작을 했어요.
실제로 그렇죠 그래서 그게 발전해서 지금의 컴퓨터 공학과가 그래서 저희의 근간이 굉장히 수학에 많이 있어요.
그렇죠 그래서 이 당시에는 수학자가 대신에 들어갔던 이유가 우리 컴퓨터 공학을 했던 컴퓨터 공학이라고 하는 학문이 사실 존재하지 않았거든요.
그 그래서 이런 사람들이 모여서 보면 이제 인공지능이라고 하는 이런 부분들을 실제로 논의하기 시작했어요.
하지만 인공지능이라고 하는 단어조차도 없었어요.
그래서 여기에 있었던 사람 중에 한 명인 존 메카시 그러면 이거를 뭐라고 부를까 우리가 인공지능이라고 부르자라고 이 시대에 이제 이 개념을 만들기 시작하게 됩니다.
그래서 50년대 60년대 요 사이에 이제 어떤 일들이 벌어지냐 1957년에 로젠블러시라고 하는 사람이 었어요.
그래서 이 사람이 뭔가 이제 인공지능이라고 하는 어떤 개념을 탑재한 내가 시스템을 하나 만들었어.
그게 이름이 마크원 퍼셉토론이라고 하는 거 시스템이에요.
그렇죠 근데 이 시스템이 뭐 하는 시스템이냐면 여기 이제 그림이 하나 있는데 여기 조그마한 기계가 하나 있어요.
그래서 57년이니까 우리 당시를 생각을 해야 돼요.
지금은 이제 막 카메라도 있고 뭐 이렇게 되게 좋지만 이때는 카메라도 되게 좋지 않았거든요.
그래서 이게 뭐 하는 거냐면 a b c 이런 거 대문자로 되게 정자로 있잖아요.
큰 종이에다가 a 이렇게 그래가지고 이 기계에다가 갖다 대요.
갖다 대고요.
이 기계는 딱 보면은 뭐가 있냐면은 정구 같은 게 있어요.
400개의 광 센서라고 얘기했지만은 400개의 정부예요.
정부 그래서 정구가 딱 켜져요. 400개가 쫙 켜져요.
그래서 이렇게 갖다 대면은 얘가 적은 부분만 이렇게 검은색일 거잖아요.
그렇죠 거기는 빛이 통과되지 않아요. 하지만 반대는 이제 안 적은 부분은 빛이 통과가 되겠죠.
그렇죠 그 신호로 일단 입력을 주는 거예요. 그렇게 했었을 때 그러면 컴퓨터가 신호를 딱 받아들여서 얘는 a라고 적은 거네라고 해서요.
그 a를 그냥 a입니다라고 얘기한 것도 아니고요.
이집법 숫자 있어요. 그죠? 001 00 이렇게 그렇죠 그러면 a라고 하는 디지털 신호로 바꿔서 주는 거예요.
근데 여기서 보니까 그러면 b도 해보자 그러면 이제 인식해서 b에 관련된 숫자를 주네.
c도 잘 돼요. 그러면 이제 사람들이 뭘 느끼냐면 지금은 문자 하나지만 언젠가는 다운로드가 되네 그다음에 문장도 될 거네.
조금 더 더 잘 만들면 우리 책도 될 수 있지 않을까 그러면 무슨 대기망 저 희망 같은 게 있잖아요.
기대감이 막 생기잖아요. 그렇죠 그래서 이 당시에는 어떻게 되냐면 엄청 이제 인공지능 만들 수 있을 거야.
엄청나게 기대가 막 생겨요. 그렇죠 그 시기가 이 시기예요.
근데 우리 겨울에 한 번 왔어요. 겨울에 한 번 왔어요.
그죠? 그래서 이 겨울이 왔던 이유가 분명히 있겠죠.
그죠? 그래서 이 마크 언 퍼센트론이라고 하는 로젠블러이 만들었던 그래서 그걸 기반으로 좀 다른 것들도 막 이제 문자뿐만 아니라 다른 것들도 막 인식해 보자 이런 이제 분위기들이 막 형성이 돼요.
그래서 이제 막 실험을 하게 됐는데 그런데 이 로젠블럿이 얘기했던 이 이론에는 가장 결정적인 오류가 하나 있어요.
그래서 이 결정적인 오류는 뭐냐면 로젠블럿은 아까 우리 a b c 이런 것들을 구분하기 위해서 어떤 방법을 취했냐면은 선 선을 하나 그렸어요.
그렇죠 그래서 우리 좌표에다가 들어온 입력 데이터를 쫙 뿌려놓고요.
선을 하나 쫙 그거예요. 그렇죠 그래서 이 선 위는 뭐고 아래는 뭐다 이런 식이에요.
그렇죠 그래서 예를 들어서 이 강아지와 관련된 어떤 자료들이 있다라고 치게요.
좌표에 막 뿌려요. 고양이와 관련된 이 내용들이 있어요.
좌표에 뿌려요. 왜냐하면 고양이는 고양이 비슷한 데 묶일 거잖아요.
그렇죠 개는 개 위에 비슷할 거예요. 그렇죠 그래서 이걸 딱 선으로 고아요.
그러면 위는 개고요. 아래는 고양이야 그냥 이런 식인 거예요.
그래서 선형 분류라고 얘기를 하거든요. 그렇죠 그래서 이렇게 선을 그어서 이렇게 불고 그 아래로 그렇죠 이렇게 보니까 위로 하고 아래로 분류할 수 있어요.
근데 이 선형 분류는 우리 가만히 생각해 보면 우리 앤드 로직 오어 로직 그죠 게이트 뭐 오어 게이트 엔드 게이트 이런 거 아마 들어본 적 있을 거예요.
그렇죠 그래서 00일 때 0 0 1일 때 0 그렇죠 엔드는 그죠 1 0일 때 0이고 1 1 서로 같을 때 그 1 그래서 앤드 함수 또는 5 함수 있잖아요.
0 1 1 0일 때 다 1이 그래서 이 두 가지 문제는 풀 수 있어요.
봤더니 이거를 우리 좌표에다 한번 뿌려볼게요. 그래서 그래서 0 콤마 0 0 콤마 1 뭐 이렇게 볼 수 있잖아요.
그렇죠 0 콤마 0 0 콤마 1 1 콤마 0 이런 식으로 이렇게 뿌려봤어요.
그래서 여기에서 선을 딱 그어보니까 1이 되는 어떤 지점은 여기네 그렇죠 5 같은 경우에도 0 콤마 0은 0이지만 선을 구해봤더니 1이 되는 지점은 0이고 0이 되는 지점은 이렇게 할 수 있어요.
그래서 엔드나 오어라고 하는 어떤 이런 로직으로 풀 수 있는 어떤 그런 문제라고 하면 사실 로젠블럿이 제공했던 이 이론으로는 좀 분류가 가능해요.
하지만 근데 여러 가지 문제를 풀다가 어떤 문제에 봉착했냐면 익스클루시브 어 XO어라고 하는 게이트가 있어요.
그렇죠 아마 여러분들 한 번씩 들어봤을 텐데 얘는 01일 때 1 1 0일 때 1이고요.
서로 같을 때는 0이에요. 그렇죠 그래서 좌표에 뿌려봤더니 이런 형태가 되는 거예요.
그래서 선을 아무리 그어도요. 두 개가 명확하게 구분이 안 되는 거예요.
즉 이제 선이 아니라요. 비선형 그죠? 선이 아니라 비선형으로 풀어야 되는 문제들이 사실 일상생활에 더 많았던 거예요.
그러면 이거 이 문제 어떻게 풀어라는 거죠? 그렇죠 그러면 인공지능 모든 문제를 다 풀 수 있을 것 같았는데 우리 이지 센 생활에는 비선형으로 풀어야 되는 문제들도 더 많은데 야 이런 거 안 되네라고 하면 어떻게 어떤 생각이 들까요?
야 그래도 얘 할 수 없는 일들이 존재하는구나 그렇죠 그래서 기대감이 조금씩 무너지기 시작을 해요.
하지만 인공지능을 연구하는 연구자들은 어때요?
그냥 이런 문제 생겼다 그러면 인공지능 연구 포기해요.
그렇지 않죠 당연히 이거에 대한 대안을 찾기 시작을 해요.
이 문제는 한번 이렇게 풀어보자 그래서 어떻게 풀어보자고요?
규칙 기반으로요 선으로 푸는 문제는 선으로 풀고요.
이거 선으로 못 푸니까 이런 상황이 발생되면은 요렇게 풀어라고 하는 컨디션을 만드는 거죠.
그렇죠 규칙 기반으로 가기 시작을 해요. 하지만 그때 규칙 기반의 가장 큰 단점이 있어요.
규칙 기반은 뭐라고 했었어요? 여러분들이 짜는 프로그램하고 같다고 했었어요.
그렇죠 모든 상황을 내가 다 알고 있어야지 메서드를 만들 수가 있어요.
규칙을 만들 수 있어요.
있죠 그렇죠 근데 모든 상황에 대해서 규칙을 다 알고 명시한다는 게 쉬워요.
아니죠. 그러다 보니까 이 규칙 기반의 시스템은 어떻게 되냐면 되게 제한적일 수밖에 없는 거예요.
어떤 특정한 분야에 굉장히 작은 부분. 그래서 얘는 대안은 나왔지만 할 수 있는 부분이 굉장히 제약적이구나라고 하는 어떤 그런 위기감이 생기는 거죠.
당연히 그러면 어때요? 관심이 줄어들 수밖에 없겠죠.
그렇죠 근데 다시 발전하는 어떤 계기가 와요? 이 발전하는 계기는 뭐냐면 일단 선형으로 풀어줬던 문제를 저렇게 규칙 기반 말고요.
비선형으로 풀어야 되는 문제를 규칙 기반 말고요.
그럼 비선형을 풀 수 있는 원초적인 방법은 없을까?
그렇죠 그걸 풀기 시작해요. 그게 풀었던 게 뭐냐면 단층 포셉톤 다층 포셉톤으로 바꿨다고 하는 건데 그런 거예요.
이런 거예요. 그러니까 이제 우리 아까 앤드하고 오어 게이트 된다고 했잖아요.
그래서 아까 퍼셉트론 모델은 오어냐 엔드냐 이거 하나만 봤어요.
근데 소원은 이걸 표현할 수가 없었잖아요. 그러면 이거를 우리가 여러 개 조합해서 같이 놓으면 풀 수 있는 거 아니야라는 거죠.
그렇죠 그래서 엔드하고 o하고 낫하고 엔드 이렇게 같이 조합하면은 우리 XO 표현해 볼 수 있어요.
그래서 여기 들어갈 때 00일 때 한번 볼게요. 00일 때 5 어떻게 돼요?
0 되죠 엔드도 0 될 거예요. 근데 n이라고 하는 게이트가 있네.
그러면 0 값이 1로 변하죠 1 0 어때요? 엔드는 0 이렇게 나와요.
그래서 같을 때 0 그죠? 1 1 1 1로 넣어볼까요?
1 1 여기 여기 1 그다음에 0 되죠. 그럼 0도 나와요.
그렇죠 그러면 0 1 넣어볼까요? 여기처럼 그래서 0 1 그래서 이렇게 들어가면 여기 1 될 거고 여기다 한쪽이 0이니까 0이 될 거예요.
면 1 그러니까 1 1 1 들어가니 당연히 1 나오죠.
그죠 그러면 이런 게이트의 조합으로 XO 풀 수 있는 거 아니야 그죠?
근데 이거 굉장히 춥잖아요. 근데 이것 때문에 겨울이 왔을까요?
좀 합리적인 의심이 들죠. 그죠? 자 이렇게 풀 수 있어요.
근데 이렇게 푸는데 이렇게 풀면은 무슨 문제가 생기냐면 아까는 이거 오어 게이트 하나였어요.
게이트 하나였단 말이에요. 근데 이제 이거를 막 갖다 붙여야 돼 그러면 어떻게 돼요?
선이 많아져요. 이 선 위에 뭐가 생긴다고 했죠? 아까 내가 학습을 통해서 무슨 빨간색 숫자가 생긴다고 했었어요.
그렇죠 그게 많아지면 많아질수록 학습량이 어때요?
많아져요 그죠? 그리고 이 선이 많아질수록 여기까지 가는데 내가 입력해서 이 결과를 원하는데 여기에서 정보가 막 잃어버려요.
그러니까 오류가 많아지는 거죠. 그럼 이거 어떻게 보완할 거야?
거의 계상형도 많아지고 여기까지 가봤더니 오류도 많아지더라.
그렇죠 의도치 않은 계산 값들이 여기서 막 나오기 시작을 해요.
그냥 단순하게 게이트만 붙였다고 해결할 수 있는 문제가 아니에요.
그러면 이 문제를 어떻게 해결할 거냐라고 해서 이제 봤던 게 런메라트 그다음에 제프리 힌트 제프 힌튼 교수는 굉장히 유명합니다.
그죠? 이따가 한 번 더 소개할 건데 이 두 분에 의해서 백 프로파게이션이라고 하는 역전파 알고리즘을 하나 만들어져요.
역전파는 기존까지는 입력이 들어가서 이렇게 봐서 여기에서 나오는 값을 봤어요.
그러면 그 값이 내가 원하는 값하고의 차이 오차가 얼마냐 라고 이렇게 봤던 거예요.
그래서 그 값이 사실은 적어야 괜찮겠죠 그죠? 근데 실제로 해보니까 여기에 오차가 엄청 큰 거예요.
그래서 반대로도 한번 계산을 해서 여기에 있는 값들을 업데이트하자 라고 했던 게 이제 백프로퍼게이션이의 주요 이론이에요.
그냥 그걸로 해보니 오차가 크면 좀 주네. 그래서 한쪽으로만 바라보는 게 아니라 양쪽으로 한번 자라보자라고 해서 이론을 정립하기 시작한 거예요.
그래서 이론을 정립을 해서 순방향 역방향 양방향으로 우리가 한번 왔다 갔다 가면서 이제 오차를 줄이기 시작을 합니다.
그렇죠 그래서 비선형 문제를 조금씩 풀기 시작해요.
그러니 이제 다시 관심을 받겠죠. 그죠? 그게 인공지능의 발전기예요.
하지만 다시 또 겨울이 오는 이유가 생기는데 우리 역전파 알고리즘을 통해서 뭔가 이 비선형 문제를 풀 수 있는 이론은 적립을 했어요.
근데 그걸 실제로 풀 수 있는 하드웨어 하드웨어 그래서 그 모델을 올려서 실제로 뭔가 해볼 수 있는 하드웨어는 그 당시에는 미국이라고 하는 국가만 갖고 있었어요.
국가에 갖고 있는 슈퍼 컴퓨터 같은 거. 그렇죠 기업도 못 갖고 있었어요.
IBM 있었어요. IBM도 저기 뭐냐 그 당시에 있던 기업이에요.
그 IBM조차도 이거를 해결할 수 있는 슈퍼 컴퓨터를 갖고 있지 않았어요.
그렇죠 그러면 어떻게 될까요?
인공지능 연구가 하이라이트를 받고 기금을 받고 굉장히 관심을 많이 받으려면 결국에는 소비자한테 뭔가 돌아갈 수 있는 어떤 그런 제품들을 많이 만들어야 관심을 많이 받잖아요.
그렇죠 근데 이거는 국가만 해볼 수 있는 어떤 그런 영역인 거예요.
관심이 있겠어요 이런 얘기예요. 이렇게 생각을 한번 해봅시다.
여러분들이 컴퓨터 프로그램이 있어요. 지금 앉아 있잖아요.
PC에서 내가 프로그램을 하나 딱 켰어. 그래서 내가 입력하라서 입력을 했어.
엔터를 딱 쳤네. 근데 이제 무슨 결과를 나오길 기다리잖아요.
1년 반 뒤에 그 결과가 나와요. 그 프로그램을 쓸 수 있어요.
이런 거예요. 그렇죠 못 쓰는 거예요. 그렇죠 그래서 다층 신경만 느려요.
너무 느린 거예요. 컴퓨터 속도 지금 가지고 있는 이 PC나 여러분들이 갖고 있는 어떤 이런 이제 하드웨어로 할 수가 없는 정보인 거예요.
그래서 누가 여기다 투자를 하겠어요? 그렇죠 그래서 관심이 줄어들기 시작을 해요.
하지만 또 인공지능 연구사는 가만히 있지 않아요.
그렇죠 그래서 그러면 이거 어떻게 해야 되냐라는 거예요.
그래서 그러면 이런 큰 모델 말고 다른 방법 없어라고 막 살펴봤던 게 그때 당시에 나왔던 방법이 뭐였냐면 확률 기반의 방법들이에요.
확률 기반 이제 계산하자 그래서 정확하지는 않더라도 우리 확률적으로 한번 접근을 해보자라고 했던 게 이제 이 이후에 이제 90년대 초반까지 정말 많이 나옵니다.
그래서 90년대는 우리 이제 확률 기반의 베이지 네트워크 히든 마코 모델이라고 이제 확률 기반의 모델들이 있죠.
이런 부분들이 굉장히 많이 연구가 돼요. 그래서 우리도 살펴볼 거예요.
그래서 이런 연구들이 막 시작이 되고요. 하지만 이 시대는 하드웨어도 같이 발전하기 시작합니다.
그래서 이제 90년대 넘어오면은 95년도 제가 아직도 기억하는데 이제 286 3 8 6 4 8 6 쓰다가 막 펜 시험이 나오던 시절이에요.
그래서 여러분들 아마 들어본 적이 없을 거예요.
그죠 그래서 이제 지금은 핵사코 막 이렇게 얘기를 하는데 이때 이제 하드웨어가 갑자기 이제 막 발전하기 시작을 해요.
그래서 97년도쯤 되면은 이때가 제가 고등학교 때 고등학교 1학년 때예요.
그래서 이제 아직도 기억이 나는데 여러분들은 알파고 세대라 아마 알파고만 기억을 하겠지만 저는 이제 저 때는 이제 빅블루에요.
그 그래서 실제로 이 IBM에서 만든 이 디플로라고 하는 시스템이 실제 체스 세계 챔피언하고 겪어서 이때 승리를 해요.
그래서 알파고 때 여러분들 봤잖아요. 그거 이세돌 이겼었을 때 그렇죠 그래서 이 알파고가 엄청나게 맨날 뉴스 보면 인공지능 세상을 지배할 것처럼 그랬죠.
이때도 그랬어요. 똑같이 그래서 진짜 무슨 인공지능 금방 나올 줄 알았어요.
저는 그렇죠 아직도 기억나요 온갖 뉴스에 그냥 인공지능 얘기밖에 없었거든요.
그렇죠 그래서 곧 인공지능이 곧 실현될 거야 체스 이겼다 야 그러면 이제 사람마다 인공지능 나오는 건 시간 문제 아니냐 이런 얘기 막 그때 막 나왔었거든요.
그렇죠 그래서 이때 엄청나게 이제 기금도 많이 들어가고 투자도 많이 이루어지고 그렇죠 그래서 이런 사이인데 이제 우리 2004년에 보면 아까 나왔던 애플 오페이션 만들었던 제프리 힌튼 교수님 이 제프리 힌트 교수 작년에 노벨상 받았습니다.
그죠? 그래서 여러 가지 이론들을 정립하기 시작해요.
그래서 딥러닝에 관심 있는 학생들은 아마 진짜 이 교수님 아마 알고 있어야 될 거예요.
이 교수님이 이 딥러닝에 들어가는 테크닉들을 이 시기에 다 만들어요.
그래서 진짜 어서 배치 노멀라이제이션이라든지 오토 인코더라든지 이런 부분들을 이때 다 제안합니다.
그리고 그거 우리 지금도 쓰고 있어요.
그렇죠 그래서 이런 것들을 이제 만들어낸 상황이었고 2011년도에 또 IBM에서 왓슨이라고 하는 어떤 프로그램으로 그래서 이 퀴즈 쇼 제퍼디라고 하는 이제 미국의 퀴즈 쇼가 있어요.
그래서 인간하고 이렇게 같이 나가서 퀴즈 쇼에서 우승도 하는 어떤 그런 성과들을 보이죠.
그렇죠 그래서 이때 이제 많은 어떤 관심들을 많이 받게 되죠.
그죠? 제프리 힌튼 교수님은 요즘에 저기 노벨상 받고 나서는 또 굉장히 매스컴에서 그렇죠 TV에서 뉴스에서 굉장히 많이 얘기를 해요.
그죠 그래서 이분이 지금 미국 사람은 아니에요. 이제 뭐냐 지금 캐나다의 토론토 대학에 아마 이제 대학 교수고 아마 이제 은퇴하신 걸로 알고 있는데요.
그래서 한 번쯤은 이 교수에 대해서 한번 좀 찾아보면 재미있을 것 같아요.
그래서 유명하신 분이고 인공지능의 한 획을 그으셨던 분이라고 보시면 됩니다.
다음 볼 영상은 이제 90년대 초기예요. 그래서 이제 숫자 인식 인공지능과 관련된 어떤 그 영상을 하나 보여드릴 건데 혹시 딥러닝 약간 알고 있는 학생 있어요?
CNN 모델 혹시 들어봤다 있어요? 그래서 관심 있게 나중에 한번 이렇게 이제 인공지능 공부하는 친구들이면 저기에 꼭 봐야 되는 모델 중에 하나예요.
그래서 이제 이미지 인식하는 모델이라고 보시면 될 것 같아요.
그래서 그 모델을 이제 굉장히 유명한 모델인데 만든 사람이 얀 미콘이라고 하는 사람이에요.
그래서 지금은 뉴욕대 교수시거든요. 그렇죠 그래서 이분이 93년도에 이제 만들었던 어떤 요 숫자 인식 인공지능인데 지금 보면 약간 허접해 보일 수도 있지만 이 당시에는 굉장히 획기적이었어요.
이게 이제 어떤 거냐면 여기 숫자를 적어놨잖아요.
사람이 이제 적는 필기체 그죠? 필기한 어떤 그런 숫자를 인식하는 프로그램이에요.
그래서 2 0 이게 이제 정자일 수도 있고요. 프린트하는 어떤 정자일 수도 있고 근데 이게 웃긴 게요.
사람이 숫자를 다 똑같이 쓰지 않더라고요. 굉장히 느끼게 그래서 딱 알아볼 수 있게 쓰면 좋은데 이 숫자를 적는 패턴들이 좀 다양해요.
그래서 여기 일 일 2 3 4 5 7 8 9 그렇죠 근데 4 6 8 7 보여요.
4 6 8 7을 4하고 6을 저렇게 쓰는 사람도 있어요.
그렇죠 굉장히 다양한 폰트로 그렇죠 그래서 이 다양한 폰트로 적혀진 숫자를 인식하는 최초의 인공지능을 만들었던 거예요.
이게 90년대 초반이에요. 그래서 이걸 기반으로 이제 우리 이미지 인식이라든지 이런 부분들이 만들어졌어요.
그래서 저 얄리쿤이라고 하시는 분이 만든 모델의 구조가 계속 확장이 돼서 르넷 같은 어떤 모델도 만들어내고 지난 시간에 얘기했던 이미지대의 근간이 됐던 어떤 그런 모델이라고 보시면 될 것 같아요.
이런 부분들이 이제 90년대 초반에 만들어졌어요.
그리고 2011년도부터 지금까지예요. 그래서 물론 지금 생성형 AI다 피지컬 AI다 뭐 이런 얘기도 했지만 그거는 지난 시간에 제가 말씀드려서 좀 생략은 할게요.
그래서 이제 알파고 때까지만 이렇게 정리를 했는데 먼저 보니까 2012년도에 우리 구글하고요.
스탠포드 대학 들어왔죠. 그렇죠 그래서 스탠포드 캘리포니아에 있는 스탠포드 대학에 앤드리 응이라고 하시는 교수님이 계 이분도 굉장히 유명하신 인공지능에서 굉장히 유명하신 분인데요.
앤드리옹이 코세라 코세라 혹시 들어본 적 있어요?
학습 플랫폼입니다. 그렇죠 그래서 코세라라고 하는 동영상 강의 플랫폼이 있어요.
그래서 그것도 만드신 분인데 요 앤드이라고 하는 스탠보드 대학의 교수하고 구글하고 손을 잡아서 큰 진짜 정말 큰 심층 신경망 딥 뉴럴 네트워크라고 있거든요.
큰 인공지능 모델을 하나 만들어요. 그래놓고 1만 6천 개 1만 6천 개의 컴퓨터를 가지고 이제 뭔가를 하기 시작해요.
그때 했던 게 뭐였냐면요.
개하고 고양이 둘리를 그래서 개하고 고양이 분류한 거 하면 되게 시시해 보이죠.
그렇죠 그래서 딱 봤을 때 이게 개고 이게 고양이다라고 딱 보이는 그런 종도 있어요.
하지만 어떤 거 보면요. 얘가 고양인지 개인지 굉장히 헷갈리는 종도 있습니다.
그렇죠 그래서 이 세상의 모든 종의 개와 고양이를 분석한 거예요.
그렇게 얘기하면 좀 다르죠. 그렇죠 그래서 그걸 가지고 이제 이미지가 들어갔었을 때 얘가 고양이냐 개냐 이런 걸 해보기 위해서 이렇게 했어요.
근데 여기 딱 보면은 야 그거 하는데 1만 6천 개의 컴퓨터가 필요해 라는 생각이 좀 들죠.
그렇죠 일반형 저게 컴퓨터 칩이나 필요한 건가 근데 이때 이제 왜 1만 6천 개의 컴퓨터를 썼냐면요.
혹시 여러분들 인공지능 요즘 딥러닝 하려고 하면 그래픽 카드가 필요하다 GPU가 필요하다 이런 얘기 들어본 적 있어요.
들어봤죠 그렇죠 기사에도 막 이렇게 그래픽 카드의 값이 비 그렇죠 그래서 그래픽 카드 즉 GPU를 쓰는 이유가 뭐냐면 이 GPU는 우리 이제 인공지능 모델을 처리할 때 병렬 처리를 가능하게 해줘요.
근데 이 당시에는 병렬 처리하는 어떤 기법 있잖아요.
그 그래픽 카드 가지고 병렬 처리하는 기법 자체가 없어졌어요.
지금은 텐서 플로우나 파일 터치나 이런 프레임웍들이 굉장히 잘 나와서 그걸 잘 쓸 수 있는 어떤 그런 이제 기술들이 많이 올라왔지만 쿠다나 이런 것들은 그죠?
이 당시에 그런 게 없었다고요. 그러면 어떻게 해야 돼요?
병렬 처리를 하려면 어떻게 해야 돼요? 우리가 알고 있는 CPU는 어떤 처리죠?
시퀀셜 순차 처리하는 거예요. 그렇죠 CPU는 순차 처리예요.
그렇죠 근데 이 순차 처리하는 것들을 여러 개 묶으면 어떻게 돼요?
패럴의 병렬 처리가 되는 거예요. 그래서 1만 6천 개의 컴퓨터가 필요했던 이유는 뭐냐면 이 당시에 병렬 처리하는 게 없어요.
그래서 하드웨어 물리적으로 컴퓨터를 묶었어요.
이렇게 한꺼번에 처리하려고 그렇죠 병렬 처리하게끔 그렇죠 그래서 많이 필요했던 거예요.
그렇죠 그렇게 해서 걔하고 보행기를 했습니다. 그죠?
근데 굉장히 큰 성과가 있었죠. 그렇죠 그리고 나서 한 2014년도에는 뭐가 나왔냐면 페이스북에서 디 페이크 여러분들 알고 있는 딥페이크가 나왔어요.
그죠? 그래서 여기 영상 보시면 우리 슈퍼맨 영화 맨오브 스틸 영화인데요.
그렇죠 그래서 슈퍼맨과 그 여자친구인 노이스가 대화하는 장면인데 얼굴은 보면 미스터 빗이에요.
그죠? 그래서 미스터 빗 얼굴을 양쪽에 합성을 했죠.
되게 자연스럽죠 그쵸
근데 페이스북이 이 딥페이크 기술을 사실은 어떤 의도로 만들었냐면요.
페이스북은 사실은 영상이나 이미지를 올려서 이제 공유하는 어떤 그런 플랫폼이었어요.
그래서 이미지 올렸었을 때 얼굴 좀 이쁘게 하는 그 있잖아요.
사실은 얼굴 영상 편집 프로그램을 사실 기획을 했었어요.
그래서 내가 지우고 싶은 사람도 있을 거고요. 내 얼굴을 보정하고 싶은 수도 있어요.
그렇죠 그래서 그러기 위해서 하지만 나랑 같이 찍고 싶었던 사람이 있었는데 거기에 지금 빠져 있어요.
그러면 그 사람도 이제 합성해 줄 수 있잖아요. 그렇죠 그런 것들을 원해서 이제 만들었던 게 이 기술이었는데 사실은 지금 의도와 다르게 쓰이고 있죠.
그렇죠 그래서 지금 굉장히 좋은 분야에서도 쓰이지만 또 안 좋은 분야에서도 굉장히 많이 쓰이는 것 같습니다.
그리고 2015년 이제 알파고 프로토타입이 개발이 돼요.
그래서 처음에 이제 데미스 하사비스라고 하는 거랑 구글 딥마인드 들어본 적 있을 거예요.
그렇죠 그래서 구글 딥마인드의 데미스 하사비스가 이제 프로토타입을 만들고요.
이때 이거를 가지고 여러 사람들 그래서 유로피안 챔피언한테 가가지고 테스트도 하고요.
16년도에 여러분들 아시겠지만 우리나라에 와서 월드 챔피언이 그렇죠 그래서 이세도하고 붙어서 이기게 되죠.
그렇죠 그래서 이런 사건들이 이제 존재하게 그 이유는 아마 여러분들 아시는 것처럼 이렇게 보셔야 다음 볼 영상은요.
사실은 이 알파고 와 관련된 영상이에요. 그래서 알파고와 관련된 영상이고 이 영상이 어떤 영상이냐면 구글 딥마인드의 데미 데미스 서비스 수가 아마 들어봤을 거예요.
그렇죠 그 알파고 만두 사람 해서 엄청 많이 나왔었거든요.
그렇죠 그래서 이 사람이 프로토 타입을 만들어가지고요.
이제 이제 테스트를 하기 시작을 해요. 그렇죠 그래서 실제로 여러 번 시뮬레이션도 해봤을 거고요.
그다음에 실제 사람하고도 한번 해봤겠죠.
그렇죠 그래서 이제 유로피언 챔피언이라고 하는 판구이라고 하는 중국 사람이에요.
그래서 중국 사람은 이기고 그러면 세계 챔피언하고 한번 이제 붙어보자.
어찌 보면은 이 구글 딥마인드 데미사사비스가 던지는 출사표 같은 영상이에요.
그래서 사실 근데 이 영상을 보면서 저는 좀 많은 걸 느꼈거든요.
그래서 사실 모르겠어요. 이 영상을 바라보는 관점들이 사실 좀 다를 수 있어서 여러분들이 봤었을 때 어떤 느낌을 가질지 모르겠는데 저는 개미 사사비스가 바둑만을 목표로 이걸 만든 건 아니었구나 라는 것들을 느꼈어요.
실제로 지금 데비스 서비스가 뭐 하고 있냐면요. 지금 계속 가속하는 거 아니에요 그래서 구글 딥마인드는 뭐 하냐면요.
의료 AI 그다음에 기후 변화 이런 걸로 확장을 했어요.
그렇죠 그래서 그거는 내가 조금 더 이거 영상을 한번 보고 추가적으로 한번 여러분들한테 좀 이야기를 해 주고 싶어요.
그렇죠 한번 영상 보고 다시
이 영상에서 제일 마지막에 하는 단어가 있어요. 그래서 인공지능이 이제 발전의 한 단계 스텝업을 하기 위한 어떤 그런 부분이라고 보 이제 얘기가 하나 있는데 지난 시간에 제가 그런 얘기를 했어요.
인공지능의 최종 목표가 뭘까요? 베터라이프라고 얘기를 했었어요.
그죠? 그래서 과연 그러면 데미스사비스는 가족 자라는 인공지능 이거 하나 만들기 위해서 했을까요?
그래서 사실 데미스 하사비스는 체스 천재였었어요.
5세 때 5살 때부터 체스를 굉장히 잘 뒀거든요. 그래서 서 이 양반 엄청 똑똑해요.
옥스포드 나왔거든요. 캠브리지 옥스포드 나왔어요.
진짜로 그래서 똑똑한 사람이었는데 이 사람이 과연 그러면 바둑 잘하는 인공지능 이거 하나 만들려고 했다 했는 건가 한 번 고민해 볼 수 있어요.
근데 제가 봤었을 때는 저하고 같은 목표인 것 같아요.
인공지능의 어떤 한 단계 배터 라이프라고 하는 어떤 그런 걸 추구하기 위해서 자기가 제일 잘하는 것부터 시작한 것 같아요.
그죠? 체스 하지만 체스는 우리 디플루가 있었었어요.
그죠? 근데 그러면 조금 더 어려운 비슷한 거 그 바둑이네 그죠?
근데 이 바둑을 봤더니 경우의 수가 너무 많아요. 그다음에 어떤 패턴에 의해서 듣는 게 아니고 사람의 직관에 의해서 듣는 것 같아요.
이 문제 한번 풀어볼까 내가 잘하는 분이 있네. 그래서 하나의 프로토 타입을 만들어 보고요.
이거 정말 잘해 우리 한번 이제 내부에서 엄청 많이 테스트하고 실패도 했겠죠.
그렇죠 그래서 정말 만들어서 유럽편 챔피언도 만들었고 그래서 겨뤄보고요.
그렇죠 더 잘하나 정말 이게 인류 최강인가 월드 챔피언도 이게 우리나라 문이다.
그리고 성과를 얻었죠. 그리고 그 데미스 하사비스는 지금 아까 뭐 한다고 했죠?
의료 AI 그렇죠 기후 변화 데미스 하사비스도 작년에 노벨상 받았어요.
뭘로 노벨 화학상 받았어요 컴퓨터가 아니라 왜 제너럴한 인공지능 만들어요 그렇죠 근데 이런 게 있어요.
근데 제가 여러분들한테 드리고 싶은 말이 이런 얘기예요.
우리 인공지능 과목을 여러분들은 어떻게 바라보느냐 데미스 하사비스가 바둑을 바라봤던 거죠.
그렇죠 그래서 인공지능 과목 사실 에이플 그죠? 학점 받기 위해서 우리 이 과목 바라볼 수도 있어요.
그렇죠 근데 여러분들 언젠가 학교 졸업하고요. 이 학교 울타리 벗어나야 돼요.
그죠? 그때도 인공지능이라고 하는 키워드 안 가져갈 수 학생도 있겠지만 가져갈 학생이 있거든요.
그렇죠 그래서 저는 좀 더 큰 목표를 바라봤으면 좋겠어요.
그래서 이걸 단순하게 우리 학점 받고 시험 잘 보고 그런 과목으로 보는 게 아니라요.
그렇죠 이거를 미래까지 가져갈 수 있는 하지만 지금 여러분이 할 수 있는 건 뭐예요?
작은 것부터 하는 거예요. 데미스 안스베스가 했던 것처럼 자기가 잘할 수 있는 작은 것부터 해요.
하나씩 하나씩 잘 만들어가면 언젠가는 그게 커질 수 있고 궁극적인 최종 목표에 도달할 수 있지 않을까 저는 이 영상을 그렇게 봤어요.
그렇죠 그래서 사실 바라보는 관점은 다를 수 있을 것 같아요.
저는 이제 데미스 하사비스라고 하는 사람의 백그라운드도 조금 알고 있거든요.
여러분들 나이보다 많으니까 그렇죠 그런 부분들을 알고 있어서 이 영상을 이제 바라보는 관점이 좀 다를 수 있는데 우리 이렇게 한번 생각을 해보자는 거예요.
그렇죠 그래서 이 영상은 사실 그런 얘기를 해주고 싶어서 준비했던 영상이라고 보시면 될 그리고 다음에 우리 살펴볼 메뉴는 사실 이게 딱히 중요한 건 아닌데요.
혹시 궁금해할까 봐 사실 준비를 했어요. 그래서 알파고의 이제 알고리즘에 과도기 표 어떻게 어떻게 얘를 잘 두게 만들었냐 그렇죠 이런 것도 좀 궁금할 것 같아가지고 제가 좀 준비를 했어요.
그래서 얘는 결국에는 이제 이 구글 딥마인드에서 데이비스 서비스가 집중했던 건 뭐냐면 바둑은 굉장히 어려웠던 게 뭐냐면 경우의 수가 너무 많은 거예요.
내가 둬야 되는 수가 너무 많은 거예요. 체스에 비해서요.
그죠?
그래서 그러면 이거를 잘할 수 있는 방법이 뭘까 이제 고민하다가 데미스 하사일 때 이렇게 봐요.
그러면 경우의 수를 좀 줄여야지 복잡 가 줄어들잖아요.
그렇죠 그래서 이 경우의 수를 좀 잘 줄여가지고 우리 좀 좋은 수를 찾아보는 어떤 그런 알고리즘을 만들자라고 했던 게 몬테카를로 트리 서치 그래서 MCTS라고 하는 알고리즘을 하나 만들어요.
그래서 이 알고리즘은 크게 4단계로 구성이 돼 있어요.
그래서 셀렉션 선택이에요. 그래서 뭔가 최적의 수를 선택하는 게 아니라요.
지금 상대방이 여기 딱 뒀어요. 그렇죠 보면은 이걸로 갈 수 있는 길들이 엄청 많은 거예요.
그렇죠 이걸 다 볼 거예요. 다 볼 수가 없어요. 그죠?
그러면 이 중에 가장 중요한 그렇죠 가장 좋은 가능성을 가진 게 뭐야 그러면 이제 여기서 선택을 하는 거예요.
거기에 이제 우리 딥러닝 강화 학습이 쓰여요. 그렇죠 그래서 여기 일단 선택을 합니다.
셀렉션 그럼 여기 보자 그래서 만약에 그러면 내가 이제 여기서부터 수를 둘 거예요.
가상으로 이제 시뮬레이션을 돌리겠죠. 그렇죠 그래서 이걸 한 수 두 수 이렇게 앞에 보는 게 아니고 굉장히 여러 수 앞을 보겠죠.
그렇죠 그래서 여기에서 내가 만약에 두면 어떤 경우의 수가 발생할 때 익스펜션 즉 확장이 막 일어나요.
이런 상황에서 우리 여기 둘 거야 시뮬레이션 해 봐 그러면 끝에 이겨라고 하는 시뮬레이션 그죠 하나하나씩 탐색해 나가는 거죠.
그러면 승률이 몇 퍼센트 이상입니다. 그럼 여기 괜찮은 거야 여기 둬라라고 나오겠죠.
하지만 이게 또 학습이에요. 그래서 아까 학습이다 보니까 우리 역전파 8 프로피게이션이라고 하는 거죠.
그래서 우리 결국엔 가중치 이런 것들 그렇죠 이런 거 학습을 해야 되니까 숫자를 막 바꿔줘요.
이런 것들이 순차적으로 일어나는 거예요.
이런 과정으로 그래서 결국에는 이 포커스는 뭐였냐면 여러 개의 경우 수 중에 중요한 부분을 바라봤고요.
그 중요한 부분을 가지고 탐색해 나갔던 거죠. 그래서 이런 부분으로 이제 알파고가 만들어졌다라고 보시면 될 것 같습니다.
여기까지가 인공지능 역사 이었어요. 다음은 이제 지능형 에이전트인데요.
우리 5분 정도 쉬었다 할까요? 그렇죠 그래서 한 번 더 쉬었다가 그래서 11분이니깐요 16분에.
인공지능 1주차 - 김건우 2
2025.03.13 목 오후 4:16 ・ 19분 42초
김진남
이전까지는 이런 내용은 사실 일반적인 내용이라 여러분들 크게 공부하지 않아도 내용 아는데 여기서부터 공부하셔야 돼요.
아시겠죠? 그래서 실질적인 이제 이론이라고 보시면 될 것 같습니다.
우리 지능형에 있는데 인텔리전트 에이전트라고 얘기하는데 여기 에이전트라고 하는 어떤 단어가 하나 적혀 있어요.
그죠? 그래서 이 에이전트라고 하는 단어는 사실 인공지능이에요.
그래서 인공지능 그죠? 근데 이 인공지능은 사람은 이제 인간을 묘사하는 어떤 기계를 만든다고 했잖아요.
그러면 우리 이 기계를 우리 기계라고 얘기하지 말고 우리 에이전트라고 얘기를 할게요.
그래서 이 에이전트는 그러면 이제 정의를 해야겠죠.
그러면 이 에이전트는 도대체 뭐냐라고 이제 정의를 하기 시작하는데요.
이 에이전트는 어떤 거냐면 이 환경이라는 곳이 있어요.
외부 환경 같은 거 그렇죠 이 환경에서 어떤 정보들이 막 있을 거예요?
그렇죠 이 정보들을 우리 센서라고 하는 그 감각 기관이라고 표현을 센서를 통해서 이 환경에 있는 어떤 이 내용들을 우리가 받아들여요.
그렇죠 우리 받아들이고 인지해서 받아들이고 이 물음표를 통해서 이거 처리할 거예요.
그리고 나면 우리 어떤 결과들이 나오죠? 그래서 이 결과를 액추에이터 작동이라고 하는데 모터라고 생각하시면 돼요.
그렇죠 모터라고 생각하시면 이런 부분을 통해서 이제 실제 액션이 진행이 되는 이런 구조를 가진 거를 우리는 에이전트라고 부르고 즉 인공지능에서 인간을 닮은 기계 즉 에이전트라고 부른다.
그걸 이제 진영 에이전트 인텔리전트 에이전트라고 되겠다라는 것들 얘기예요.
이렇게 얘기하니까 조금 어렵죠. 그렇죠 그래서 쉽게 얘기하면 이런 거예요.
그러니까 외부 환경 그죠 환경에 우리 이렇게 얘기하면 좀 약간 노봇스럽긴 한데 서빙 로봇 생각을 한번 해볼 그렇죠 근데 이 서빙 로봇이 이제 여기서부터 저기까지 가야 되는 거예요.
그렇죠 그래서 이 환경사에서 지금 보는 게 있을 거잖아요.
그런 신호들이 쭉 들어오겠죠. 이게 카메라든 아니면 센서든 그렇죠 우선 그런 데이터들을 이렇게 쭉 받아들여요.
센서가 그래서 그걸 인지한다라고 해요. 지금 상황에 아무것도 장애물이 없어 이런 것들에 대한 어떤 데이터들이 쭉 넘어오죠.
그렇죠 그리고 이 물음표 얘는 펑션 그죠? 펑션이라고 볼게요.
여기 펑션에서 이런 데이터가 들어왔었을 때 그러면 이렇게 액션을 해라 이런 것들이 나오겠죠.
그쵸 그리고 그 결과를 우리 모터에다 보내면 이제 움직이기 시작할 거예요.
맞죠? 그렇죠 그런 게 우리 에이전트라고 이렇게 바라보자는 거예요.
그래서 우리 휴먼 사람이라고 하면 그렇죠 그러면 이 센서는 뭐에 해당할까요?
눈 귀 코 이런 거 있잖아요. 우리가 인지할 수 있는 것들 이게 이제 우리 환경으로부터 받아들일 수 있는 거잖아요.
그렇죠 보거나 듣거나 느끼거나 그렇죠 또는 액추에이터 즉 모터라고 해서 움직이는 액션을 직접 행하는 혹은 손 다리 이런 것들이겠죠.
그죠? 근데 이거를 우리가 인공지능 에이전트로 만든다.
쉽게 로봇으로 만든다 하면 센서는 외부로부터 우리 신호 데이터를 받으니까 카메라일 수도 있고 적외선 파인더일 수도 있고 그래서 여러 가지일 수도 있겠죠.
그렇죠 그리고 액츄에이터는 모터 이렇게 되는 거죠.
그러면 여기에서 이 지능형 에이전트라고 하는 에이전트 구조에서 가장 중요한 건 뭘까요?
우리가 해야 되는 건 도대체 뭘까요? 여러분 센서 만드는 게 우리의 역할일까요?
모터 만드는 게 우리의 역할입니다. 우리의 역할은요.
여기에서 물음표예요. 그렇죠 외부 환경에서 어떠한 데이터 어떤 정보들이 막 넘어올 거예요?
그 센서를 통해서 막 인식이 될 거란 말이에요. 그 인식된 데이터가 어디로 넘어가요?
이 물음표로 와요. 그죠? 그러면 이 물음표에서는 도대체 어떤 어떻게 처리를 할 거냐라고 해서 뭔가 결괏값이 나오겠죠.
그 결괏값은 어디로 가요? 액추에이터라고 하는 작동기 그리고 실제로 액션 이어지고 그렇죠 그래서 이 물음표는 우리 f라고 할게요.
f는 펑션이에요. 그죠? 함수입니다. 그래서 퍼셉트된 인지되어 있던 어떤 센서를 통해서 들어왔던 정보들이 이렇게 들어와요.
이게 한 번 들어올 수도 있고요. 여러 번 들어올 수도 있겠죠.
순차적으로 그렇죠 그럴 때 이 f는 어떤 결과를 줄 거냐 이거 우리가 만들어야겠죠 그렇지 않아요 그렇죠 여러분들 알고 있는 메서드 펑션 이거예요.
그렇죠 우리가 해야 되는 거 그리고 이 펑션은 어디에 있어요?
프로그램은 우리 피지컬 아키텍처 그죠? 하드웨어 컴퓨터 위에서 돌아가요.
그죠? 하지만 프로그램 안에서 이 펑션은 어디 있어요?
프로그램 안에 있는 어떤 메서드죠? 그죠? 그리고 이런 부분들을 만들어 가는 게 우리의 역할인 거죠.
그렇죠 좀 더 쉽게 우리 예제를 통해서 한번 좀 살펴볼게요.
우리 베튬 클리너 그 이 지붕 청소기예요. 청소기 로봇 청소기 같은 거라고 보시면 될 것 같아요.
그렇죠 그래서 여기 그림이 있는데요. 이게 좀 그림이 좀 웃기게 그려서 이제 아마 좀 이게 청소기인지 몰랐던 학생들도 있을 것 같은데 이게 청소기예요.
로봇 청소기가 있다라고 보시면 돼요. 그래서 여기가 흡입구 그다음에 여기 움직일 수 있는 바퀴 그죠?
좀 되게 괴란하죠. 그죠? 그래서 하지만 이게 청소기라고 보시면 되고요.
여기 a하고 b라고 이렇게 적혀 있어요. 이거는 a 방 b 방이라고 보시면 돼요.
그리고 여기 앞에 이거는 좀 먼지나 쓰레기 같은 거라고 보시면 됩니다.
그렇죠 그러면 얘가 이 로봇 청소기가 청소기가 우리 지능형 에이전트 인텔리전트 에이전트다라고 봤었을 때 아까 우리 에이전트는 환경으로부터 뭔가 센서를 통해서 인지한다고 했어요.
그죠? 그리고 물음표를 통해서 액추에이터 모터를 통해서 뭔가 액션을 유턴한다라고 했었죠.
그죠? 그럼 그런 개념을 여기다 한번 대입을 해보자는 거예요.
진공 청소기도 에이전트니까요. 인공지능이니깐요.
그죠? 이럴 때 그러면 이 진공 청소기가 인지하는 환경 정보는 뭘까요라는 거예요.
뭘 알아야 될까요? 이거 퍼센트 인지해야 됩니다.
환경 지금 어느 방에 있는지 얘가 알아야죠 a 방인지 b 방인지 그렇죠 그거 알아야 돼요.
그렇죠 뭔가 액션을 하려고 하면 그리고 지금 상황 얘가 지금 더러운 상황이야 깨끗한 상황이야 그렇죠 거기에 따른 액션이 달라지잖아요.
액션은 우리가 만들 거예요. 우리 물음표를 통해서 만들 거예요.
그렇죠 그래서 현재 환경 정보를 봤더니요. 지금 이 청소기는 a라고 하는 방이 있고요.
그다음에 이 라고 하는 방을 살펴봤더니 지금 더러워요.
그 정보가 센서를 통해서 지금 들어와요. 물음표 우리가 만들어야 된다고 했었어요.
우리 어떻게 만들 거요? 지금 더러운 상황이잖아요.
그렇잖아요. 그럼 어떻게 해야 돼요? 청소해야죠?
빨아들여야죠 그렇죠 그러면 반응 액션을 어떻게 할 수 있게끔 석이라고 하는 빨아들이는 어떤 액션을 할 수 있게끔 우리가 코드를 짜면 돼요.
지금 그렇죠 이런 상황이 그러면 얘는 액션 액추에이터 즉 모터를 통해서 실제로 막 빨아들이기 시작을 할 거예요.
맞죠? 그죠? 근데 만약에 a 방을 봤더니 지금 깨끗해요.
그럼 어떻게 해야 될까요?
여기 청소할 거 없잖아 그러면 어떻게 해요? 그 비만 가는 거예요 이동하는 거죠 그렇죠 이렇게 이동을 하죠.
더 이상 있을 이유가 없잖아요. 그렇죠 이동을 해라.
레프트든 와이트든 그죠? 왼쪽으로 이동해라. 오른쪽으로 이동해라.
아니면 멈춰 있을 수도 있어요. 노 오퍼레이션 노은 이제 그냥 스테이 하고 있어 움직이지 말고 이런 명령을 할 수도 있잖아요.
그렇죠 이런 것들을 우리가 반응할 수 있게 물음표를 만들어 봐야 됩니다.
그 근데 우리 앞에서 봤었을 때 이 펑션에 이 퍼센트 즉 인지되는 정보는 단순 정보 하나만 딱 들어올 수도 있지만 여러 번 시간에 따라 여러 번 들어올 수도 있어요.
그렇죠 그게 퍼센트 시퀀스라고 해요. 그는 인지된 어떤 연속적인 시퀀스 계열이라고 c 계열이라고 이렇게 보시면 돼요.
하지만 여기 딱 보니까 여기 딱 요 정도 들어왔어요.
a 방에 있고요.
현재 클린의 요 그러면은 어떤 결과를 줘야 돼요? 물음표에서 짜게 해야겠지만 그러면은 일단 방 옮긴다고 했잖아요.
비방 가는 거예요. 라이트 그죠? 액션은 라이트 이렇게 될 거예요.
a 반 지금 들어왔는데요. 더러워요. 그러면 액션은 뭐예요?
빨아들여야죠 청소해야죠 그렇죠 마찬가지로 b 방도 마찬가지예요.
b 방에 지금 로봇 청소기가 있어요. 그죠? 근데 깨끗해요 그러면 어떻게 해요?
왼쪽으로 가야죠 그죠? a 방으로 이런 어떤 명령들을 할 수 있죠 비방도 지금 더러워요 정도 나와 있죠 이런 식으로 단순 시퀀스 하나씩 하나씩 들어올 수도 있어요.
하지만 이 경우 한번 생각해 봐요. 2개도 있고 3개도 있어요.
그죠? a 방 지금 봤더니 깨끗해요. 30분 있다 다시 볼게요.
a 방 다시 봤어요. 그때도 깨끗할 수 있어요. 근데 밑에 거 보니까 a 방 지금 깨끗하죠 30분 있다 다시 봤어요.
어때요? 더러워요 그러면 어떻게 해야 돼요?
쉬워야죠 그렇죠 이건 이런 의미예요. 그러니까 이런 게 한 번만 딱 들어오는 게 아니라 시간을 갭을 두고 뚝뚝뚝뚝뚝뚝 들어올 수도 있다는 얘기잖아요.
그렇잖아요. 인지된 정보가 왜냐하면 시간에 따라서 상황은 바뀔 수 있잖아요.
a 방이 항상 깨끗하지는 않잖아요. 그렇죠 이런 경우에도 우리 물음표를 만들어 가서 해결해야 되는데 이런 경우는 어떻게 해결할 거냐는 거예요.
우리 물음표로 해결을 해야 되는 거죠. 그렇죠 인텔리서테이전트 이런 개념이에요.
그래서 인텔리전트 에이전트는 이런 상황이 주어지고 환경으로부터 데이터를 받고 이 데이터를 받은 어떤 입력으로부터 어떤 액션을 주기 위해서 이 물음표를 어떻게 가져갈 거냐 이걸 구현하자는 거예요.
인간을 대신하는 기계 에이전트로서 그래서 이걸 지능형 에이전트라고 근데 이제 한 단계 더 내려갈게요.
그러면 지능형 에이전트를 어떻게 만들어야 돼 그래서 만드는 건 알겠어.
그래서 그래서 환경에서 정보를 받아서 이렇게 이제 어떤 결과를 줄 수 있는 어떤 그런 걸 만들면 되는구나.
근데 그럼 어떤 관점으로 만들어야 되는지 그런 부분들이 좀 필요해요.
그렇죠 그래서 우리 그 부분은 레셔널 에이전트라고 얘기를 할게요.
사실 이제 인공지능은 레셔널 에이전트 합리적인 에이전트로 만들어야 돼요.
이 합리적인 에이전트는 이제 사실 이 인테리어전트 에이전트의 밑에 있는 개념인데 그러다 보니까 이 내용이 똑같아요.
그래서 이 내셔널 에이전트는 환경 인바리먼트하고 상호 작용하고 그렇죠 아까 봤던 것처럼 현재까지 인식된 퍼센트 된 이 연속적인 정보를 잘 받아들여서 다른 건 뭐냐면 최적의 의사결정을 내리는 에이전트를 얘기하는 거예요.
여러 가지 액션을 할 수 있는데 그중에 최적의 액션이냐 반응이냐라는 거예요.
그게 좀 차이가 있죠 그죠? 이 최적의 의사결정이라는 얘기는 뭐냐면 수행 성능 평가를 해야 돼요.
그죠? 여러 가지 내가 왼쪽으로 갈 수도 있고요.
인텔리전트 에이전트는 이래요. 그렇죠 지금 클린해요 클린하죠.
근데 여기에 라이트로 움직이는 게 아니라 깨끗함에도 불구하고 빨아들일 수 있어요.
썩 할 수도 있어요. 그죠? 그렇다고 얘 인공지능 아니에요 인텔리전트 에이전트 아니에요?
맞잖아요. 왜 이 구조 안에서 돌아가잖아요. 잘못된 결과를 하더라도 잘못된 행동을 하더라도 우리 의도와 상관이 없는 행동을 하더라도 얘는 얘를 받아들여서요.
행동을 했어요. 그죠? 지능형 에이전트는 맞아요.
하지만 이 지능형 에이전트를 잘 만들어야 되잖아요.
그죠? 내가 의도한 바대로 더러울 때 빨아들여야죠.
그죠? 더러울 때 노오퍼레이션이 일어나면 어떻게 해요?
이게 청소기로 가치가 없는 거예요. 하지만 이게 지능형 에이전트냐라고 물어볼 때 지능형 에이전트는 맞죠?
그렇죠 그래서 우리가 필요한 게 합리적인 에이전트예요.
최적의 액션을 내릴 수 있어야 되는 거죠. 그렇죠 그래서 수행 성능 평가라는 얘기는 뭐냐면 a반이 지금 현재 더러워요.
그러면 더러우면 무슨 뭐를 해야 되죠? 청소해야 돼요?
청소를 하느냐는 거예요. 이거를 한 번에 썼을 때 100번 했었을 때 200번 했었을 때도 다 청소하느냐는 거죠.
그렇죠 그래서 200번이 주어졌더라도 다 청소한다라고 하면 얘는 잘하는 인공지능이네라고 얘기할 수 있잖아요.
그죠? 그래서 인공지능은 수행 성능 평가 얼마나 그 액션에 대해서 평가를 했었을 때 해주느냐라는 부분이 분명히 따라와야 돼요.
그게 레슬러 에이전트라고 하는 개념이에요. 그래서 최대가 되는 액션을 선택할 수 있다.
얘는 라는 어떤 결과가 보여줘야 되는 게 레셔널 에이전트죠.
그래서 우리가 만들어가야 되는 물음표는 어때요?
그냥 지능형 에이전트는 구현적인 관점이에요. 이게 틀리든 맞든 간에 하지만 우리가 만들어가야 되는 이 물음표는 뭐냐면 레셔널 레이저트 즉 합리적인 에이전트 형태의 그렇죠 그래서 이 레셜 에이전트는 결국에는 성능 평가를 통해서 측정 가능해야 돼요.
왜 최대가 되는 액션을 선택하고 있느냐 가장 좋은 결과를 줄 수 있는 액션을 선택하고 있느냐 이걸 봐야 되는 거고 그리고 사전 지식이 있어야 되죠.
그죠? 부가적인 정보로 이제 이 연속적인 정보를 당연히 인식도 해야 돼요.
그죠? 또는 또는 액션을 잘 찾아서 그 액션을 취할 수도 있어야겠죠.
하지만 가장 중요한 건 뭐냐면 성능 평가를 통해서 측정이 가능 하느냐 그리고 거기에서 최대가 되는 액션을 선택할 수 있느냐라는 거야.
이게 합리적인 에이전트예요. 그러면 이 합리적인 에이전트를 이제 만들어가는 방법에 대해서도 한번 소개를 할게.
그렇죠 합리적인 에이전트는 큰 개념으로 peas라고 하는 이 개념을 써요.
그죠? 그래서 pas는 퍼포먼스 인바이러먼트 액츄에이터 센서라고 하는 이 개념인데요.
그죠? 근데 인바이러먼트 액츄에이터 센서는 우리 앞에서 봤어요.
이미 그렇죠 인테리어도 대기점. 그래서 여기 p 퍼포먼스 즉 내셔널 이벤트 합리적인 에이전트는 딱 이게 차이가 나요.
그래서 이 퍼포먼스는 결국 뭐냐면 얼마나 합리적으로 행동했느냐 평가를 할 거예요.
그리고 인바이러먼트 액추에이터 센서 이거는 이제 아마 이해를 할 거예요.
그렇죠 그러면 이런 기준으로 우리 자율주행 택시를 하나 만들어 본다고 가정을 그때 우리 peas가 뭐가 되는지 그러면 이 퍼포먼스가 어떤 의미를 가지고 있는지 아마 여러분들 아마 이해를 할 거야.
우리 자율주행 택시를 하나 만들 거예요. 그래서 이 자율주행 택시는 말 그대로 내가 여기서부터 목적지까지 택시인데 사람 없이 그죠 그냥 쭉 가는 택시라고 보시면 돼요.
먼저 그러면 우리 인바이러먼트부터 볼게요. 환경 그래서 이제 자율주행 택시를 만들려고 하면은 어떤 환경의 조건이 있느냐 우리한테 데이터를 줄 수 있는 이 환경이 도대체 뭐야 그죠?
그래서 봤더니 이게 미국인가 봐요. 그래서 ust 도로 정보 또는 하이웨이 프리웨이 그렇죠 고속도로 정보 이런 것들이죠.
하여튼 도로는 알아야 될 거 아니에요 그렇죠 그리고 트래픽 지금 교통 상황이에요.
막혔는지 지금 원활한지 이런 것들 이게 이제 주어진 환경 정보죠.
또는 페데스트리아 이게 보행자예요. 사람이 지나가고 있는지 잘못하면 칠 수 있잖아요.
그래서 사람 통행량이 얼마나 되는지 이런 것들이 지금 환경적으로도 주어지죠.
그리고 이런 환경에서 우리 뭘 통해서 인지하죠 센서를 통해서 지금 인지를 해요.
그럼 센서는 뭐일까요? 이런 상황들을 어떻게 우리가 이걸 받아들일까요?
영상으로 받아들일 수 있어요. 비디오 그죠? 아니면 가속도계 같은 거 그죠?
또는 게이지 엔진 센서 키보드 GPs 이런 것들은 신호 체계들이 있잖아요.
이런 걸로 우리의 입력을 받겠다는 거예요. 그리고 이게 물음표에 들어가겠죠.
그죠 물음표로 들어갈 거고 그 물음표를 통해서 뭔가 결과가 나오면 모터 액츄에이터 그렇죠 얘로 아마 될 거야.
그러면 액츄에이터는 뭐냐면 자율주행 택시니까 뭐가 움직여야 돼 액션이잖아요.
그죠?
핸들을 이렇게 줘야 하는 스티어를 아니면 엑셀레이터 이것도 엑셀 밟는다고 하잖아요.
가속을 하거나 아니면 멈출 수도 있어요. 브레이크 아니면 사람이 쓰다가 빵빵 혼 그죠 아니면 스피커 디스플레이 그렇죠 여기에서 뭔가 얘기해 줄 수도 있는 거예요.
그래서 이런 액션들로 이제 리턴을 하는 거예요. 그러면 인바이먼트 액추에이터 센서 요 세 가지만 가지고 우리 지능형 에이드는 또 구현해 볼 수 있어요.
그렇죠 하지만 우리 만들어야 되는 거는 내셔널 에이전트 이제 합리적인 에이전트라고 했었어요.
근데 퍼포먼스 한번 볼게요. 퍼포먼스 세이프티예요.
우리 이런 걸 가지고 물음표 우리 이걸 구현해 나갈 건데 뭐를 기준으로 만들 거야 안정성이 그렇죠 그래서 이런 거 가지고 내가 만드는 이 프로그램이 그죠 프로그램이 안전성을 추구하느냐 이 관점인 거죠.
그렇죠 또는 데스티네이션이에요. 목적지에 도달을 합니다.
이 목적지에 도달하는데 사고가 나도 상관없어요.
어떻게든 목적지만 도달하면 돼요.
그렇죠 그렇게 할 수도 있잖아요. 그렇죠 이게 가장 우선인 거냐라는 거예요.
아니면 프로필 이윤이에요. 그렇죠 그래서 먼 길 돌아가도 괜찮아요.
택시 비용 제일 많이 받을 수 있는 길을 택하고 있는 거냐라는 거죠.
그죠 또는 리갈리티 법 잘 지키고 있어 아니면 컴포트 편안하게 지금 운영하고 있어 이거 관점 다 달라요.
그렇죠 그래서 이거에서 내가 뭐를 추구하느냐에 따라서 이 물음표는 바꿔진다고요.
왜 인바리먼트 액추에이터 센서는 그대로 있잖아요.
하지만 이 물음표는 뭐에 의해서 결정돼요? 퍼포먼스에 의해서 결정돼요.
어떻게 갈지 그렇죠 그래서 이 세 가지는 지능형 에이전트라고 하는 인테리어던트 에이전트를 만드는 데 필요할 수 있어요.
하지만 구현할 수 있죠. 근데 무슨 관점으로 만들어 가야 돼요?
레셔널 에이전트는 달라요. 그죠? 그래서 세이프티하고 데스티네이션 이 두 가지가 합쳐질 수도 있어요.
그렇죠 안전하게 목적지까지 그렇죠 그런 관점으로 만들어질 수도 있겠죠.
하나만 바라보는 그래서 레서의 에이전트는 인공지능 아니 인텔리전트 에이전트하고 이제 차이가 난다라고 이렇게 이해해 주시면 되겠습니다.
그리고 퍼포먼스가 굉장히 중요한 요소입니다. 그렇죠 그리고 이제 제가 이 에이전트를 계속 설명하는데 계속 이제 약간 인바이먼트 하니까 외부 환경 같아요.
그죠? 근데 이 인바이러먼트는 외부 환경이 아니라 여러분들 PC 안에 상황에서 일어나는 내부적인 환경일 수도 있어요.
그렇죠 그래서 항상 로봇처럼 이런 게 인공지능은 아니잖아요.
그렇죠 그래서 요 예를 한번 들어볼게요. 그래서 이거는 인터넷 쇼핑 에이전트인데 이게 쉽게 얘기하면은 여러분들 대신 쇼핑해 주는 그냥 인공지능 시스템이라고 보시면 될 것 같아요.
그래서 내가 후드티 하나 사고 싶어요. 여러분들 많이 가는 네이버 쇼핑이나 지마켓이나 쿠팡 같은 데 가가지고요.
근데 내가 사는 게 아니라 이제 인공지능이 아무래도 대신 사주는 거죠.
그렇죠 그래서 이런 이런 상황에서 그러면 인바이먼트 환경은 도대체 뭐냐는 거예요.
그래서 지금 또는 이제 지금 운영 중인 w w 사이트 있잖아요.
쿠팡, 지마켓, 네이버 쇼핑 이런 데 이제 올라와 있는 어떤 이 사이트들이 지금 환경이겠죠.
그죠? 그다음에 벤더 브랜드예요. 브랜드 그래서 이 후드 틱 하는 브랜드 쫙 있잖아요.
그렇죠 그래서 이 브랜드들이 쫙 있을 거고 그다음에 택배를 받아야 돼요.
슈퍼 그죠? 롯데택배에서 받을 거예요. 한진택배에서 받을 거예요.
뭐 이런 거 있잖아요. 그렇죠 대한통운에서 받을 거예요.
그런 거 있잖아요. 그죠? 이런 것들은 쭉 정보들이 흩어져 있어요.
환경적으로 여기에서 우리 센서를 통해서 이제 뭔가를 받아들이죠.
이 센서는 뭐냐 HTML 페이지예요. 그래서 내가 상품을 딱 고르면 거기에 뜨여지는 사진들이 있잖아요.
그렇죠 텍스트 그래픽 얼마 이런 거.
인공지능 1주차 - 김건우 3
2025.03.13 목 오후 6:22 ・ 6분 11초
김진남
그랬어요. 결국에는 여러 가지 방법들을 제공할 거지만은 그중에 목표를 달성하는 방법을 찾아야 되잖아요.
그렇죠. 이 찾는 탐색이라고 하는 시간이 걸려요.
그래서 이게 짧으면 상관없는데 굉장히 많은 그래서 즉 진주에서 서울까지 갈 수 있는 경로는 굉장히 많잖아요.
그렇죠 고속도로만 갈 수 있는 거 아니에요? 국도 타고도 어떤 굉장히 많은 조합을 가지고 갈 수 있잖아요.
거기에서 이 최적의 경로가 무엇이냐 이걸 딱 하나 준다는 게 사실은 시간이 걸릴 수도 있다는 문제죠.
그렇죠 또는 인지 가능한 환경이 모두 다 목표를 기반으로 수행되지는 않는다라는 거예요.
이건 무슨 얘기냐면 아까 로봇 청소기 다시 얘기할게요.
모델 모델 기반의 에이전트 얘는 이제 로봇 청소기는 사실 목표 기반의 에이전트를 바라보면 어떤 거냐면 여기 보시면 블라인드 도구라고 해서 장림계 얘가 이제 우리가 만든 애예요.
그렇죠 이제 장림계를 하나 만들 건데 제가 줬던 에이전트라고 하는 어떤 이 클래스를 가지고 이 잠긴 게 블라인드 도구는 뭘 할 수 있냐면 음식이 있으면 음식 먹을 수 있어요.
물이 있으면 물을 마실 수 있는 어떤 그죠? 그리고 움직일 수 있는 이동할 수 있는 어떤 그런 에이전트예요.
인텔리전트 에이전트 즉 심플 리플렉스 에이전트라고 보시면 돼요.
그래서 얘가 에이전트라고 하는 클래스를 잘 호출해서 이제 만들어졌는지 테스트를 한번 해본 거예요.
그래서 지금 걔 살아있니라고 물어보면 살아있어 그다음에 걔 어디 지금 이 환경에서 부딪혔냐 물어보면 부딪히지 않았으면 폴스 부딪혔으면 트루 이렇게 해서 나오겠죠.
그렇죠 그래서 지금 걔가 뭐를 들고 있니 음식을 먹거나 아니면 물을 마셨으면 들고 있는 걸로 이제 판단을 하는 거죠.
그래서 음식 물 아니면 아무것도 없으면 아무것도 없는 MTST 이렇게 이제 리턴해줘요.
그렇죠 리스트로 그다음에 얼마나 이동을 했냐 이건 폭폭 먼으로 물어볼게요.
그래서 이게 이동할 거예요. 그죠? 그래서 한 번 이동했으면 1번 두 번 이동했으면 2번 이런 식으로 나오겠죠.
이걸 가지고 이제 우리는 환경을 만들게요. 그렇죠 이 환경은 푸드도 있고요.
워터도 있고요. 그렇죠 이제 큰 공원을 하나 줬어요.
그 공원 안에 음식도 던져줬고 물도 던져준 거죠. 그렇죠 이렇게 이제 하나 선택을 해놓고 이제 블라인드 도구를 우리가 이제 이 클래스로 만든 거예요.
이제 이동할 수 있게끔요. 그래서 이제 후드를 만나면 먹을 거고 워터를 만나면 이제 맛있는 어떤 그런 형태의 간단한 프로그램을 만들었어요.
그리고 실행을 한번 해봤어요. 그래서 지금 여기 보면은 우리 인바이러먼트로 지금 환경은 공원을 하나 만들었고요.
그 위에다가 잠긴 개 만들었고 푸드 워터 여기다 파크에다 갖다 놓을 거예요.
그래서 지금 이 개는 좌표 1번 1번이라고 하는 위치에다가 지금 내가 갖다 놓을게 그리고 이 푸드는 5번이라고 하는 위치에다 갖다 놓을게 그다음에 워터는 7번이라고 하는 위치에 갖다 놓을게 그다음에 도그 다섯 번 움직여 봐 아마 하나 둘 셋 넷 다섯 이렇게 막 움직이기 시작할 거예요.
근데 움직이려다 보니까 다섯 번 움직이니까 뭘 만나요?
후드 만나요 그래서 먹었어요. 그렇죠 그러면 더 움직여볼게라는 거예요.
다섯 번 더 움직여 봐라고 했더니 딱딱 움직이는데 일곱 번째 뭐 있냐면 물이 있어요.
그래서 한번 이제 마시고 멈춰요. 그래서 그러면 내가 한 15번째 위치에다가 물을 또 한 번 놓을게 그러면 더 움직여 봐라고 하면 이제 거기까지 도달하는 어떤 그런 형태의 이제 프로그램이라고 보시면 될 것 같고요.
여기까지 보면 좀 재미없잖아요. 조금 더 이제 복잡하게 갈게요.
이제 이 인밸러먼트를 약간 2D 형태로 볼게요. 그래서 2D 형태의 어떤 좌표로 조금 더 표현했어요.
그래서 이 좌표로 표현하고 얘를 이제 이렇게 이 코드를 통해서 이 좌표 안에서 움직일 수 있게끔 만든 거예요.
그래서 이 빨간색 점이 블라인드 도그예요. 그리고 이 주황색 점이 푸드 그다음에 이게 파란색 점이 워터예요.
그러면 이제 이 프로그램은 20번 실행해 봐 하면은 얘는 그냥 내려와요.
블라인드로 그냥 쭉쭉쭉쭉 내려옵니다. 내려와서 만나겠죠.
그죠? 음식을 딱 만났어요. 그러면 뭐예요? 음식을 먹었다.
그렇죠 더 내려가면 물을 마셨다. 그렇죠 드림크 워터 이렇게 나오겠죠 그죠?
그래서 쭉 내려가는 어떤 그런 형태의 심플 리플렉스 에이전트예요.
그래서 만나서 인지된 거 그냥 먹는 거예요. 그렇죠.
이런 형태의 어떤 실습이라고 보시면 되고요. 그다음에 마지막이에요.
이거 좀 재미없잖아요. 그냥 내려가기만 해요. 밑으로요.
그렇죠 이제 이 블라인드 도구를 앞뒤 좌우 막 랜덤하게 움직이게 한번 좀 만들어볼게요.
그렇죠. 근데 이게 랜덤하게 만드니까 룸을 만들 수는 없고요.
그냥 우리 랜덤 함수를 통해서 그냥 확률적으로 50대 50의 비율로 왼쪽으로 갈지 오른쪽으로 갈지 그냥 앞으로 갈지 이런 것들을 그냥 확률적으로 조금 줬어요.
그렇죠. 그래서 이거를 조금 더 바꿔서 조금 더 재미있게 이제 아까보다 좀 줄여서 이런 간격에서 빨간색 그죠?
이게 블라인드 도그예요. 물 음식 음식 물이에요.
옛날에는 그냥 이전까지는 그냥 내려갔어요. 이젠 일로 갈지 일로 갈지 몰라요.
왼쪽으로 갈 수도 있어요. 그렇죠 그래서 왼쪽으로 가면은 아마 조금 버벅거릴 거예요.
왜냐하면 여기 이제 안 보이니까 그래서 이런 것까지는 내가 못 만들었어요.
그렇죠. 그래서 여기 딱 시켰더니 이제 어떤 결과냐면 이제 레프트예요.
레프트 하는데 이제 없잖아요. 그렇죠. 그래서 이제 그냥 멈춰 있는데 그래서 아까는 그냥 내려갔다가 이제 이렇게 먹는 경우였는데 지금은 오른쪽으로도 가고 아래로도 가고 이제 막 랜덤하게 가기 시작해요.
그래서 내가 주어졌던 20번 안에 이 여기 있는 내용을 다 방문을 못할 수도 있어요.
그렇죠. 왜냐면 랜덤하게 움직이니까요. 그래서 이 20번을 해도 좋고 30번을 해도 좋고 100번을 해도 좋습니다.
그래서 여러분들 한번 해봐요. 그렇죠 다 먹는지 아니면 다 못 가는지 그렇죠.
이런 것들을 한번 해볼 수 있을 것 같아. 그래서 집에 돌아가셔서 이제 실습으로 이런 부분들 PDF 참고하시고 그냥 옮겨서 한번 또 실행을 해 보시면 좋을 것 같아요.
네 오늘 여기까지 할게요. 네.
'Other > AI' 카테고리의 다른 글
인공지능 4주차 - 김건우 교수님 (1) | 2025.03.27 |
---|---|
인공지능 3주차 : 문제해결 및 탐색전략 (1) : 김건우 교수님 (0) | 2025.03.20 |
인공지능 2주차 - 프로세스와 방법론 : 김건우 교수님 (0) | 2025.03.17 |
댓글