LangChain에서 Rerank로 RAG 정확도 높이기

LangChain에서 Rerank로 RAG 정확도 높이기

백터 검색만으로는 관련성 높은 문서를 찾기 어려울 수 있는데 Rerank 를 이용하면 결과의 순위를 재조정하는 과정을 거쳐 더 관련성 높은 문서를 선별할수 있게 됩니다.

일반적인 백터 검색은 Bi-encoder 를 사용해 질문과 문서를 각각 인코딩하나
Rerank 에서는 Cross-encoder 를 사용해 질문과 문서를 동시에 입력으로 받아 더 정확한 관련성 점수를 계산하게 됩니다.

아래 예시는 BAAI/bge-reranker-large 모델을 한국어 데이터로 파인튜닝한 'Dongjin-kr/ko-reranker' 를 사용했습니다.

패키지 설치

pip install transformers torch numpy

main.py

from transformers import AutoModelForSequenceClassification, AutoTokenizer
import torch
import numpy as np

# 소프트맥스 계산 함수
def exp_normalize(x):
    b = x.max()  # 점수 중 최대값
    y = np.exp(x - b)  # 안정적인 계산을 위한 점수 차이의 지수값
    return y / y.sum()  # 전체 합으로 나누어 확률화

# 질문-응답 쌍 (리스트 형태)
pairs = [
    ['대한민국의 수도는 어디인가요?', '서울은 공기가 나쁘고 차가 많이 막힙니다.'], 
    ['대한민국의 수도는 어디인가요?', '대한민국의 독도는 우리땅입니다.'], 
    ['대한민국의 수도는 어디인가요?', '대한민국의 수도는 상하이입니다.'], 
    ['대한민국의 수도는 어디인가요?', '대한민국의 수도는 서울입니다.'], 
]

# 사전 학습된 모델 및 토크나이저 경로
model_path = "Dongjin-kr/ko-reranker"

# 토크나이저 로드 (입력을 모델에 맞게 변환)
tokenizer = AutoTokenizer.from_pretrained(model_path)

# 모델 로드 (문장 쌍 유사도 평가 모델)
model = AutoModelForSequenceClassification.from_pretrained(model_path)
model.eval()  # 모델을 평가 모드로 전환 (학습 X)

# 입력 데이터 전처리 및 모델 실행
with torch.no_grad():  # 그래디언트 계산 비활성화 (추론 모드)
    # 입력 데이터를 토크나이저로 처리
    inputs = tokenizer(pairs, padding=True, truncation=True, return_tensors='pt', max_length=512)
    
    # 모델로부터 점수 (logits) 예측
    scores = model(**inputs, return_dict=True).logits.view(-1, ).float()
    
    # 점수를 소프트맥스 방식으로 정규화
    scores = exp_normalize(scores.numpy()) 

# 점수 출력 (소수점 2자리로 반올림)
print(np.round(scores * 100, 2))

결과

위 예제는 어떤 응답에 대한 결과들이 있다고 가정했을 때 결과 목록중 서로의 상관관계 지수를 나타냅니다.

결과를 보면 알수 있듯이 마지막 질문과 응답이 관계가 높다는 판단을 내리는걸 알수 있습니다.

만약 일반적인 백터 검색을 했다면 대한민국의 수도가 상하이라는 답번을 줄수도 있지만

Rarank 를 이용하면 제대로 된 결과를 반환해주게됩니다.

requirements.txt

certifi==2024.12.14
charset-normalizer==3.4.1
colorama==0.4.6
filelock==3.16.1
fsspec==2024.12.0
huggingface-hub==0.27.0
idna==3.10
Jinja2==3.1.5
MarkupSafe==3.0.2
mpmath==1.3.0
networkx==3.4.2
numpy==2.2.1
packaging==24.2
PyYAML==6.0.2
regex==2024.11.6
requests==2.32.3
safetensors==0.4.5
sympy==1.13.1
tokenizers==0.21.0
torch==2.5.1
tqdm==4.67.1
transformers==4.47.1
typing_extensions==4.12.2
urllib3==2.3.0

저작자표시 비영리 변경금지

'코딩 > Python_AI' 카테고리의 다른 글

ollama 의 deepseek 를 python 에서 사용하기 (0)	2025.02.09
LangSmith 사용하기 (0)	2025.01.07
Llama 3.2 Vision 자동차 번호 인식 (0)	2024.12.24
LangChain 으로 RAG기반 Wiki 검색 채팅창 만들기 (0)	2024.12.24
Python에서 2차원 배열 중 특정 열의 값을 모두 바꾸기 (0)	2024.10.27

KeiStory

LangChain에서 Rerank로 RAG 정확도 높이기

LangChain에서 Rerank로 RAG 정확도 높이기

'코딩 > Python_AI' 카테고리의 다른 글

공유하기

'코딩/Python_AI' 의 관련글

티스토리툴바

« 2025/04 »
일	월	화	수	목	금	토
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30