LLM의 종류와 비교
최근 정말 많은 LLM이 출시되고 있는데요. 최초 ChatGPT에 이어서 MS는 코파일럿을 Google은 제미나이를, 메타는 라마 등 자체 언어모델을 계속 출시하고 있습니다.
이에 따라 정말 많은 LLM이 출시되었고 그에 따라 조금씩 체계화되고 있습니다.
LLM이란?
LLM은 Large Language Model(대규모 언어 모델)의 약자입니다. 이름에서 알 수 있듯이, 방대한 양의 텍스트 데이터를 학습하여 인간의 언어를 이해하고, 생성하며, 다양한 언어 관련 작업을 수행할 수 있는 인공지능 모델을 의미합니다.

LLM의 주요 특징
- 대규모 데이터 학습: LLM은 인터넷에 존재하는 수많은 책, 문서, 웹페이지, 코드 등 방대한 텍스트 데이터를 학습합니다. 이 과정에서 단어, 문법, 문맥, 의미적 관계 등을 익힙니다.
- 자연어 처리 (NLP) 능력: 학습을 통해 인간의 언어를 이해하고 해석하며, 자연스러운 문장을 생성하는 능력을 갖춥니다.
- 패턴 및 관계 인식: 딥러닝 기술, 특히 트랜스포머(Transformer) 아키텍처를 기반으로 단어와 단어 사이의 복잡한 패턴과 관계를 인식하고 다음에 올 단어나 문장을 확률적으로 예측합니다. 마치 자동완성 기능이 고도로 발전한 형태라고 생각할 수 있습니다.
- 생성형 AI의 핵심: 사용자의 프롬프트(질문이나 명령)를 이해하고, 그에 맞는 새로운 텍스트, 코드, 이미지 등을 생성하는 생성형 AI의 핵심 기술입니다.
LLM의 주요 활용 분야
- 텍스트 생성: 블로그 글, 이메일, 기사, 소설, 시 등 다양한 형태의 텍스트를 작성합니다.
- 질의응답: 질문의 의도를 파악하고 관련 정보를 바탕으로 답변을 제공합니다. (예: 챗봇, 가상 비서)
- 요약: 긴 문서나 내용을 핵심만 간추려 요약합니다.
- 번역: 한 언어를 다른 언어로 번역합니다.
- 코드 생성 및 분석: 프로그래밍 코드를 생성하거나 기존 코드를 분석하고 개선하는 데 도움을 줍니다.
- 감성 분석: 텍스트에 담긴 감정(긍정, 부정 등)을 분석합니다.
- 고객 서비스: AI 챗봇을 통해 고객 문의에 응대하고 정보를 제공합니다.
LLM의 비교
앞에서 말씀드린 것처럼 많은 LLM이 우후죽순 출시되고 있는데요. 각각의 LLM은 장단점이 있는데요. 물론 가장 먼저 출시한 ChatGPT가 보편적으로 높은 성능을 보이나, 이미지나 그림의 경우 Gemini가 뛰어나고, 코딩에는 Claude가 강점을 보입니다.
웹 검색에서는 Perplexity가 잘하구요.

그리고 이제는 추론 모델이라는 개념이 있는데요. 기존 LLM은 바로 답변이 나왔으나 추론 모델은 아래처럼 생각하는 과정이 표시되어 좀더 복잡한 추론을 진행할 수 있게되었습니다.

요약하자면, Gemini 2.5 Pro는 정확성과 깊이 있는 추론이 중요한 복잡한 작업에, Gemini 2.5 Flash는 빠른 속도와 비용 효율성이 중요한 대량의 실시간 작업에 더 적합합니다.
AI 검색
최근에는 LLM과 구글이나 네이버와 같은 검색엔진이 합쳐진 AI 검색이라는 개념이 확대되고 있는데요. 전통적인 검색에서는 개별 검색된 결과에 대해서 내용 확인을 개별적으로 하고 정보를 종합화는 과정이 필요했는데요.
AI 검색에서는 질문을 입력하면 AI가 자동으로 인터넷에서 검색해서 이에 통합된 답변을 제공합니다.

이런 AI검색을 하기 위해서는
- 구체적이고 명확한 질문
- 맥락 정보 추가
- 출력 형식 지정(요약, 비교표, 타임 라인 등)
- 신뢰도 요청(공신력 있는 출처 요구)