딥러닝 공부 다시 시작 (2024.12)
딥러닝논문읽기모임 보면서 잘 모르는 부분이나 질문들을 적어본다.
오늘은 2백만 토큰 컨텍스트 달성! 초 장문 프롬프트 이해하기 LongRoPE : Extending LLM Context Window Beyond 2 Million Tokens 논문리뷰
Q
- Positional embedding?
- Positional Extra / interpolation
- 선형 보강
- Vector dimension 에 따라서 선형 보강을 다르게 적용
- YaRN, Perplexity
- 비균일한 positional interpolation 을 적절하게 진행할 방법론
- Context window?
답글 남기기