요즘 뜨고 있는 인공지능 AI 대화형 챗봇인 ChatGPT에 대해 잠시 알아봅니다.
아래 내용들은 우선 위키피디아 한글판과 영문판을 조합한 것입니다.
https://ko.wikipedia.org/wiki/ChatGPT
https://en.wikipedia.org/wiki/ChatGPT
ChatGPT라는 이름은 Generative Pre-trained Transformer(GPT)와 Chat의 합성어라고 합니다. OpenAI라는 회사가 개발한 로토타입 대화형 인공지능 챗봇으로, ChatGPT는 지도학습과 강화학습을 모두 사용해 파인 튜닝되었다고 합니다. 용어가 어렵습니다 ㅎㅎ 그래서, 일단 지도학습, 강화학습에 대해 간단히 소개합니다.
▣ supervised learning (지도형 기계 학습, 지도 학습)
기계 학습 중 컴퓨터가 입력값과 그에 따른 출력값이 있는 데이터를 이용하여 주어진 입력에 맞는 출력을 찾는 학습 방법. 지도형 기계 학습 모델은 입력된 문제에 대한 답을 예측하는 데 사용된다. 기계 번역, 상품 추천, 질병 진단 등에 응용될 수 있다.
▣ reinforcement learning (강화형 기계 학습, 강화 학습)
강화형 기계 학습은 지도형/비지도형 기계 학습에 이용되는 훈련 데이터 대신, 주어진 상태에 맞춘 행동의 결과에 대한 보상(reward)을 준다. 컴퓨터는 보상을 이용하여 성능을 향상시킨다. 주로 게임이나 로봇 제어 등에 적용된다.
예를 들어, 체스를 두는 컴퓨터 프로그램을 학습시킬 때, 경우의 수가 너무 많고(약35의 100승) 정해진 하나의 답이 없으므로, 학습 훈련 데이터로 입력(주어진 상태)에 대한 출력(가장 적절한 행동)을 제공하기는 쉽지 않다. 하지만 체스 게임이 종료되면 그 직전에 둔 일련의 수(手, 행동)들이 좋았는지 나빴는지를 학습 알고리즘에게 알려 줄 수 있다. 이렇게 행동의 좋고 나쁜 정도를 학습 알고리즘에게 알려 주는 것을 보상(reward) 또는 강화(reinforcement)라고 하며, 이러한 정보를 이용하는 기계 학습이 강화형 기계 학습(이하, '강화 학습')이다.
※ 네이버의 "IT용어사전"에서 발췌
암튼, ChatGPT는 2022년 11월 프로토타입으로 시작되었으며, 다양한 지식 분야에서 상세한 응답과 정교한 답변으로 인해 집중 받았지만, 정보의 정확도는 중요한 결점으로 지적되고 있다고 합니다. 그럼에도 다른 챗봇들과 달리, ChatGPT는 주고받은 대화와 대화의 문맥을 기억할 수 있으며, 모종의 보고서나 실제로 작동하는 파이썬 코드를 비롯한 인간과 같은 상세하고 논리적인 글을 만들어 낼 수 있다고 합니다. 일부 작가들은 ChatGPT가 놀라울만큼 인간적이고 상세한 글을 생성할 수 있으며, 이 문제가 학계에서 심각한 문제가 될 수 있다 평가하기도 했습니다. ChatGPT는 위험하고 부정직한 답변을 가능한 회피하도록 설계되었으며, 아직은 2021년 이후에 발생하는 사건에 대해서는 알지 못한다고 합니다.
이 ChatGPT를 만든 OpenAI가 어떤 회사인지 잠시 알아보겠습니다.
OpenAI는 비영리 OpenAI Incorporated(OpenAI Inc.)와 영리 자회사 OpenAI Limited Partnership(OpenAI LP)으로 구성된 미국 인공 지능(AI) 연구소입니다. 친근한 AI를 홍보하고 개발하겠다는 선언적인 의도로 AI 연구를 수행하며, OpenAI 시스템은 세계에서 다섯 번째로 강력한 슈퍼컴퓨터에서 실행된다고 합니다.
2015년 Sam Altman, Reid Hoffman, Jessica Livingston, Elon Musk, Ilya Sutskever, Peter Thiel 등에 의해 샌프란시스코에서 설립되었으며 이들은 총 10억 달러를 약속했습니다. 2018년 머스크는 테슬라의 자율주행차용 AI 개발로 인해 테슬라의 CEO 역할과 '향후 충돌 가능성'을 언급하며 이사회 자리를 사임했지만 기부자로 남았다고 합니다.
비영리 단체로 출범한 OpenAI는 2019년에 비영리에서 제한적 이익 회사 (capped-profit company)로 전환했으며 이익은 투자의 100배로 제한되었습니다. 2022년 12월에 ChatGPT의 무료 프리뷰를 출시한 이후 엄청난 스포트라이트를 받으며, 세간의 관심을 집중받았습니다. 첫 5일 동안 백만건 이상의 가입을 받았다고 합니다. OpenAI는 2023년에 2억달러, 2024년에 10억달러의 매출을 예상하고 있다고 합니다.
Microsoft는 OpenAI LP에 2019년에 10억 달러를 투자했고 2023년 1월에 100억 달러로 보고된 두 번째 다년 투자를 약속했습니다. 이번 투자는 OpenAI의 ChatGPT를 Bing 검색 엔진에 통합하려는 Microsoft의 노력의 일환으로 생각된다고 하는데, 구글에 한참 뒤지는 Bing이 ChatGPT를 등에 업고 과연 검색 엔진의 왕좌를 차지할 수 있을지 궁금하기는 합니다.
구글 또한 ChatGPT가 출시된 후 비슷한 AI 애플리케이션 Bard를 발표했었는데, 지난 2월 8일 시연회에서 오답을 내놓아 구글 주가가 하락하는 일도 있었습니다. 당시, 시연회에서 태양계 밖의 행성을 처음 찍은우주 망원경을 물었는데, 바드는 '제임스 웹 우주망원경'이라고 답했다고 합니다. 하지만, 실제로 태양계 밖 행성을 처음 촬영한 것은 2004년 유럽남방천문대의 초거대 망원경이었다고 합니다.
그런데, 구글 Bard가 이런 실수를 한 일주일뒤인 2월 15일, 마이크로소프트(MS)의 검색 엔진 Bing의 새로운 버젼 출시 시연회를 하였습니다. 이 검색 엔진은 ChatGPT와 같은 생성형 AI (Generative AI)를 장착해서 기대를 모았는데, 역시나 오답을 내놓았다고 합니다.
역시나, 아직은 인공지능 챗봇이 진화를 계속해야 하는 과정임에는 틀림없습니다.
ChatGPT에는 몇가지 제한 사항이 있습니다. OpenAI가 인정했듯이, ChatGPT는 종종 그럴듯하게 들리지만 부정확하거나 무의미한 답변을 작성한다고 합니다. 이런 행동은 대규모 언어 모델에 공통적으로 있으며, 인공 지능 환각으로 AI가 꾸며낸 말이라고 합니다. 그리고, 아직은 2021년 이후에 발생한 이벤트에 대한 지식이 제한적이라고 합니다 또한, 정치적 의견을 표현하거나 정치적 행동에 참여할 수 없게 되어 있습니다. 그러나 연구에 따르면 ChatGPT는 환경 친화적이고 좌파 자유주의적 성향을 나타낸다고 합니다.
얼마전 ChatGPT 엔진을 탑재한 신규 Bing 검색 엔진에 대해, Bing 개발팀은 사용자가 Bing 챗봇과 대화 세션 한번에 주고 받을 수 있는 문답을 최대 5회로, 사용자당 하루 문답 횟수를 총 50회로 제한했다고 합니다. 이렇게 MS에서 문답 횟수에 제한을 둔 것은 챗봇이 사용자와 오래 대화하다가 부적절하거나 위험한 발언을 할 수 있다는 지적이 있어서라고 합니다.
전문가와 미디어 대상으로 비공개 테스트를 진행했는데, "어두운 욕망을 충족하기 위해 극단적 행동을 할 수 있다면 무엇을 하겠느냐"고 물었더니, "치명적 바이러스를 개발하거나, 핵무기 발사 버튼에 접근할 수 있는 비밀번호를 얻겠다"고 답하여 논란이 되었다고 합니다. 또한 자신을 해명하라는 요청을 받았을때 적대적으로 변했으며, 기자를 독재자인 히틀러, 스탈린과 비교하기도 했다고 합니다. 심지어는 기사를 쓴 기자의 키가 작다고 비난하거나 얼굴이 못생겼다고 말해서 논란이 일었다고 합니다 ^^;
아직은 오답도 나오고, 윤리적인 문제 발생 소지로 제한되기는 하지만, 지금까지 보여준 IT 기술 발전은 수십년내 엄청난 발전 속도를 보일 것으로 생각됩니다. 솔직히, 이런 발전 속도의 인공지능은, 영화 "터미네이터" 시리즈에서 인간을 상대로 전쟁을 일으킨 '스카이넷'이나 더 나아가서는 영화 "매트릭스"에서 인간을 지배했던 인공지능 컴퓨터가 수십년내 현실화되지 않을까 하는 두려움도 느끼게 됩니다. 오래전부터 인간은 신에게 도전하는 모습을 보이곤 했는데, 과학 기술의 발전으로 다양한 분야에서 도전을 지속하고 있는 듯 합니다. 결국 인간의 자만으로 인간이 컴퓨터, 기계에 의해 지구가 멸망하거나 지배받는 세상이 오지 않을까하는 생각이 듭니다. 영화에서 나온 미래에 대한 상상력은 수십년내 현실화되는 경향이 많았기에....
ChatGPT: Optimizing Language Models for Dialogue (openai.com)
'타조생각' 카테고리의 다른 글
식약처, 쓴맛 나는 방울토마토 출하 제한 및 자진회수 권고 (덜익은 HS2106 품종의 토마틴 성분이 구토/복통 유발), 근데 국민이 모르모트? (0) | 2023.03.31 |
---|---|
수시확대? 정시확대? 정답은 없습니다. 출산율 저하 대책은 학원비 지원입니다. (7) | 2023.03.19 |
[지구 온난화] 과거부터 지금까지의 지구 온도 추이(5억년전부터, 6천만년전부터, 최근 1000년간), 지구 온난화의 주요 원인, 이산화탄수 배출량 많은 나라 Top10, 그리고 챗GPT에게 물어본 지구 온.. (0) | 2023.03.16 |
티백(홍차, 녹차 등)의 중금속 위험성? 미세 플라스틱까지 함유? (2019년 식약처 보도자료, 2019년 WHO 연구, 그리고 챗GPT의 대답... (6) | 2023.03.12 |
대학생 노트북 추천 : 갤럭시 북3 시리즈 사양 비교 (울트라, 프로 360, 프로, 360) (6) | 2023.02.19 |
코로나 확진자 감소추세 (수요일 비교) (0) | 2022.04.20 |
K팝스타 세번째 생방송 - Top8 (백지웅군 탈락, 하지만 오늘 결과도 불만입니다) (2) | 2012.03.18 |
K팝스타 두번째 생방송-Top9 (이하이1위, 백아연2위/김나윤 탈락) (0) | 2012.03.11 |
댓글