leejeong6 님의 블로그

  • 홈
  • 태그
  • 방명록

Colbert 1

ColPali논문 리뷰

https://arxiv.org/pdf/2407.01449ColPali: EFFICIENT DOCUMENT RETRIEVAL WITH VISION LANGUAGE MODELS에 대해 정리해 보겠습니다 ColPali의 기본 구조는 아래 그림과 같습니다 먼저 기존 방법들의 대표적인 구조입니다 그림으로 먼저 모델의 아키텍쳐를 분석해 보면 OCR, Layout Detection, captioning, chunking 등이 없어지고 Vision LLM이 삽입된 것을 볼 수 있습니다. 또한 시간도 엄청 단축되었고, query가 LLM을 거쳐서 나오는 것도 다른 것 같습니다 이제 이 배경을 가지고 어떤 장점이 있고, 어떻게 적용되었는지를 보겠습니다 ABSTRACT시각적 자료를 처리하는데, 기존 RAG기법이 어려움을..

논문리뷰 2025.04.09
이전
1
다음
더보기
프로필사진

leejeong6 님의 블로그

leejeong6 님의 블로그 입니다.

  • 분류 전체보기 (12)
    • TEPS공부-서울대 공식 기출문제집 (4)
      • TEST1 (4)
    • 논문리뷰 (4)
    • Karpathy-GPT만들기 (2)

Tag

paligemma, mmed, med-rag, RAG, mmed-, model collapse, Colbert, colpali, efficient transformer, LLM, GPT, Transformer, Embedding, MEDICAL, scratch, gating network, tokenizer, tiktokenizer, 검색증강기법, MOE,

최근글과 인기글

  • 최근글
  • 인기글

최근댓글

공지사항

페이스북 트위터 플러그인

  • Facebook
  • Twitter

Archives

Calendar

«   2026/05   »
일 월 화 수 목 금 토
1 2
3 4 5 6 7 8 9
10 11 12 13 14 15 16
17 18 19 20 21 22 23
24 25 26 27 28 29 30
31

방문자수Total

  • Today :
  • Yesterday :

Copyright © AXZ Corp. All rights reserved.

티스토리툴바