ChatGPT로 대표되는 LLM은 이제 모르는 사람이 없다. 나이가 한참 지긋하신 저의 아버지도 사용법을 가르쳐달라고 하시는 것을 보면 대중화는 이미 시작되었다고 해도 되겠다.
ChatGPT-3 시발점으로 시작된 LLM에서도 기존의 단점을 보완하는 개선된 개념이 나타나고 있다. 대표적으로 RAG, sLLM, AGI 등 등 이 있다. 그중에서도 활발하게 적용되고 있는 RAG (Retrieval Augmented Generation)에 대해 알아보겠다.
RAG (Retrieval Augmented Generation)
RAG란 단어 풀이 그대로 검색(Retrieval)을 강화(Augmented)하여 답변(Generation)하는 것을 의미한다.
LLM의 한계를 일부 극복한 모델이 LLM-RAG이다. 그럼 LLM의 한계가 무엇인지 보면,
첫번째, 최신 데이터의 답변이 아니다. LLM은 학습한 데이터에서 답변을 준다. 즉 LLM에 따라 몇 개월 혹은 몇 년 전의 답변을 준다는 한계가 있다.
어제 발 기사(2024.4.29)로 보면 테슬라가 중국에서 데이터 안전 및 개인정보보호와 관련된 심사를 통과했다.
이에 대한 ChatGPT3.5에 질문을 하면 아래와 같은 답변을 받는다.
위와 같은 모호한 답변을 주는 이유는 LLM은 학습한 시점까지의 데이터에 한하여 답변한다는 것이다. 따라서, 과거의 사실에 대해서는 답변이 어느 정도 신뢰할 만하지만 최신의 이벤트에 대한 답변은 기대할 수 없다.
두번째, 답변의 출처를 알 수 없다는 것이다. 가끔 할루시네이션을(잘못된 정보, 존재하지 않은 사실을 생산) 경험하는데, 이는 추론 능력이 아직 만족할 만한 수준이 아니기 때문에 생기는 현상이다. 그래서 정확하고 신빙성 있는 응답으로 받아들이기 위해서는 근거가 필요하다.
위의 질문을 이번에는 ChatGPT4 에 해봤다.
보다시피, 정확한 답변과 출처까지 링크를 해준다. ChatGPT4에는 RAG가 적용되었기 때문에 가능하다.
RAG은 위의 두 가지 out of date 및 no source의 한계를 극복한 프레임워크이다.
일차적으로 LLM이 학습한 데이터에서 추론을 하고 학습한 정보에 없을 시에는 검색을 하여 가져온 데이터를 바탕으로 재학습 후 답변을 내놓는다. 그리고, 학습된 데이터의 근거를 제공한다.
'IT > AI' 카테고리의 다른 글
GPT 프롬프트 기본 명령어 (1) | 2024.12.16 |
---|---|
웹에서 파이썬 코드 실행 하기 (1) | 2024.12.13 |
AI 서비스 사이트 - API, 크롬확장, AI 정보 모음 (0) | 2024.03.27 |
AI 서비스 사이트 - 채팅, 번역, 받아쓰기 (0) | 2024.03.27 |
AI 서비스 사이트 - 웹사이트 생성 (0) | 2024.03.27 |