https://www.youtube.com/watch?v=kCc8FmEb1nY&t=5065s Karpathy-BUILD GPT 이번 글은 이 영상을 따라하는 글이며, 제 생각과 추가 실습 가능한 부분을 같이 써보는 식으로 진행해보려합니다 먼저 tokenizer를 만드는 걸 소개하는데셰익스피어 글을 다운받아서 커스텀 tokenizer를 만듭니다chars = sorted(list(set(text)))vocab_size = len(chars)string_to_idx = {ch:i for i,ch in enumerate(chars)}idx_to_string = {i:ch for i,ch in enumerate(chars)}sti = string_to_idxits = idx_to_stringencode = lam..