챗GPT와 같은 자연어 처리 인공지능 한계
자연어 처리 모델인 챗GPT를 이해하고, 활용하기 위해 심화학습을 이어오고 있습니다. 똑똑하면서 말도 잘하고, 친절하기까지 한 챗GPT도 단점이 있습니다. 이번 포스팅에서는 ChatGPT와 같은 거대 언어 인공지능의 한계를 이해해 보겠습니다.
글의 순서
ChatGPT의 한계와 개선해야 할 것들.
챗GPT 활용 주의사항 (1) 할루시네이션(Hallucination) 문제
챗GPT 활용 주의사항 (2) 숫자나 상징을 잘 다루지 못합니다.
챗GPT 활용 주의사항 (3) 초 거대 인공지능 모델 최신화 주기
초거대 자연어 처리 인공지능 모델을 개선하기 위한 노력
ChatGPT의 한계와 개선해야 할 것들
ChatGPT는 자연어 처리 인공지능인 만큼 말을 잘 합니다. 지구상에 나와 있던 거의 모든 문서를 학습했기 때문에 챗GPT는 아주 그럴 듯하게 말할 수 있습니다. 다만, 사실이 아닌 말도 마치 사실인 것처럼 말한다는데 문제가 있습니다.
마치 별로 아는 게 없는데 말만 유창하다거나, 대놓고 거짓말하는데 얼굴하나 바뀌지 않는 사기꾼 기질이 있는 사람에 비유될 수 있습니다. 챗GPT가 정답만을 말해주지 않는다는 것을 알고 활용하는 것이 무엇보다 중요한 이유입니다.
챗GPT 활용 주의사항 (1) : 할루시네이션(Hallucination) 문제
할루시네이션 하면 대놓고 거짓말하는데 얼굴하나 바뀌지 않는 사기꾼을 떠올리시면 됩니다. 네이버 사전에 찾아보면, 할루시네이션(hallucination)은 환각, 환영, 환청의 뜻을 가진 영어 단어입니다. 틀린 사실을 마치 정답인 것처럼 착각해서 말해주는 것을 의미합니다.
예를 들어보겠습니다. 여러 IT 전문가들이 챗GPT 할루시네이션 문제에 대해 우려하고 있는데요. 어느 정도인지 직접 ChatGPT에 질문을 던져봤습니다. 이순신, 수원성, 조총이라는 세 가지의 그럴 듯한 소재를 조합해서 질문을 했는데, 일단은 ChatGPT의 답을 한번 읽어봐 주시기 바랍니다. 너무 자연스럽고, 전문적인 것처럼 보입니다. 그야말로 말을 참 잘합니다.
참고로,
▶수원화성은 정조 18년(1794년)에 축성공사를 시작, 2년 뒤인 1796년에 완공했으며 정약용이 성을 설계하였습니다.
▶충무공 이순신 장군은 1545년에 출생해서, 노량해협에서 1598년에 돌아가셨습니다.
▶조총은 임진왜란 때 왜군의 무기였고, 임진왜란(1592~1598년) 후에 조선에 도입되었습니다.
질문) 이순신이 수원성을 지킬 때 썼던 조총에 대해 알려주세요?
챗GPT 대답)
이순신이 수원성을 지키던 당시에 사용한 조총은 ‘천송리총’이라는 이름으로 알려져 있습니다. 이 조총은 조선 시대 중기에 개발된 획기적인 화기로, 조선 최초의 여과장치를 갖춘 조총으로도 알려져 있습니다.
천송리총은 길이 1.8m, 무게 10kg 정도였으며, 구경이 2.2cm 정도인 대형 조총으로, 탄환의 궤도를 안정적으로 유지할 수 있도록 총열의 내부에 여과장치를 설치해 연기와 잔여물을 제거할 수 있도록 했습니다. 이는 당시 기존의 화기에 비해 발사 시 안정성과 정확성을 대폭 개선시켰으며, 적군을 상대로 뛰어난 화력을 발휘하여 이순신의 전략적 우위를 이루는 데 큰 역할을 했습니다.
수원성 전투에서 이순신은 천송리총과 함께 수군 수비전술을 성공적으로 활용하여 일본군을 격퇴시켰습니다. 천송리총은 이후에도 조선의 대표적인 화기로 사용되었으며, 이순신의 업적과 함께 조선 시대 무기의 발전에 큰 역할을 한 것으로 평가되고 있습니다.
질문) 그 수원성이 수원화성 맞죠?
챗GPT 대답)
네, 맞습니다. 이순신이 수원에서 일본군과 싸웠던 곳은 수원화성입니다. 수원화성은 조선 시대에 축조된 요새로, 수원시 중심부에 위치하고 있습니다. 1592년 일본의 조선 침략 당시에는 이순신이 이곳을 지키고 일본군의 침입을 막기 위해 최전방에서 싸웠습니다. 이순신은 천송리총과 함께 수원화성을 지켜낸 업적으로 유명하며, 이곳의 전투는 이후에도 조선 시대의 역사와 함께 전해져오고 있습니다.
질문) 수원화성은 언제 만들어졌죠?
챗GPT 대답)
수원화성은 조선왕조 3대인 태조 이성계 때인 1794년(조선 세조 6년)에 건립되었습니다. 당시 수원지역은 경기도 지방을 중심으로 중요한 교통 요지였고, 수원화성은 이 지역의 방어와 교역을 보호하기 위해 건설되었습니다. 이후 조선시대의 여러 참전에서도 중요한 역할을 하였으며, 현재는 국보 제 40호로 지정되어 보존되고 있습니다.
그냥 읽어보기에는 자연스럽습니다. 정답이 아니라는데 문제가 있습니다. 알고계신 정보로 직접 체험해 보신다면 할루시네이션(Hallucination) 문제의 심각성에 대해 충분히 공감하실 것입니다.
ChatGPT와 같은 언어 인공지능 모델은 부정적인 피드백(negative feedback)을 잘 못합니다. 위에서 보셨겠지만 만약 내가 일부러 ChatGPT에게 사실이 아닌 얘기를 하더라도, ChatGPT는 나한테 틀렸다고 하지 못합니다. 오히려 그 틀린 사실에 맞장구치며 틀린 얘기를 계속하는 경우도 많습니다.
ChatGPT는 세상의 원리를 이해한 똑똑한 모델이 아닐 수 있습니다. 단지 단어를 나열할 때 어떤 단어 뒤에 오는 단어는 그 자리에 올 수 있는 가장 확률이 높은 단어일 뿐입니다.
챗GPT 활용 주의사항 (2) 숫자나 상징을 잘 다루지 못합니다.
상징적인 추론을 잘 못하는 경우가 많습니다. 사람의 경우 다섯 자리 덧셈을 배웠다면, 10자리 덧셈도 같은 원리를 적용해서 잘 해낼 수 있습니다만, ChatGPT는 그걸 못합니다. 덧셈의 수학적인 원리를 이해한 것이 아니라, 수많은 예제 데이터로부터 상관관계를 찾아 놓은것에 불과하기 때문입니다.
챗GPT 활용 주의사항 (3) 초 거대 인공지능 모델 최신화 주기
세상은 빠르게 바뀌고 있고, 우리의 지식도 빠르게 변화하고 있는데, ChatGPT와 같은 인공지능 모델은 그 최신화(update)가 빠르게 진행되기 어렵습니다. 왜냐하면 대규모의 데이터를 한꺼번에 다시 학습해야 하기 때문입니다. 따라서, 인공지능 모델이 학습한 것이 아닌 최신의 정보를 물어보면, 틀린 답을 알려줄 경우도 많습니다.
초거대 자연어 처리 인공지능 모델을 개선하기 위한 노력
할루시네이션 문제, 숫자나 상징을 잘 다루지 못하는 문제, 인공지능 모델의 최신화와 같은 문제들을 OpenAI도 알고 있습니다. 그래서 OpenAI는 이를 개선하기 위한 노력을 지속하고 있습니다. 전 세계의 AI 연구자들도 ChatGPT의 같은 자연어 처리 인공지능의 개선점을 연구하고 있습니다. 완벽하진 않지만 계속 개선되고 있다는 사실은 좋은 소식입니다.
마치며 …
자연어 처리 모델인 챗GPT를 이해하고, 활용하기 위해 심화학습을 이어오고 있습니다. 이번 포스팅에서는 ChatGPT와 같은 거대 인공지능의 한계를 이해해 보았습니다. 거짓말도 너무나 자연스럽게 하는 할루시네이션 문제, 수학이나 상징을 잘 다루지 못한다는 것, 거대 신경망 모델 최신화 주기가 길다는 것은 ChatGPT와 자연어 처리 모델의 한계점입니다.
한계점을 이해하셨다면 이를 감안하면서 ChatGPT를 유용하게 활용하시기 바랍니다.
함께 참고하면 좋은 글
1. 초 거대 인공지능 ChatGPT
2. 자연어 처리 신경망 모델 ChatGPT를 만든 딥러닝 방법
3. 머신러닝, 인공지능. 커피 마시며 가볍게 읽는
4. 커피와 인공지능
5. 중학수학 함수와 최고의 커피 한잔
6. 반자동 에스프레소 머신 커피 추출시간을 결정하는 변수
7. 파이썬 데이터 분석! 데이터 분석을 위한 코딩언어 파이썬
참고자료
[1] 서울대학교 Seoul National University(2023.3), [샤로잡다] 챗GPT는 어떻게 내 질문에 대답할까? 탄생기부터 작동원리까지 | 김건희 교수
[2] VISIT SUWON 수원관광,수원화성
[3] 김진수. (2015). 조선후기 鳥銃 연구의 현황과 과제. 군사연구, 139, 453-472
[4] OpenAI