반응형
Notice
Recent Posts
Recent Comments
Link
| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | ||||
| 4 | 5 | 6 | 7 | 8 | 9 | 10 |
| 11 | 12 | 13 | 14 | 15 | 16 | 17 |
| 18 | 19 | 20 | 21 | 22 | 23 | 24 |
| 25 | 26 | 27 | 28 | 29 | 30 | 31 |
Tags
- CTM
- Roberta
- 다항분포
- 원신
- NLP
- 블루 아카이브
- 자연어 모델
- LDA
- 데벨챌
- 트위치
- 피파온라인 API
- 옵티마이저
- SBERT
- Tableu
- 데이터넥스트레벨챌린지
- BERTopic
- 데이터리안
- 구글 스토어 리뷰
- 조축회
- KeyBert
- geocoding
- Optimizer
- 포아송분포
- 개체명 인식
- 클래스 분류
- 토픽 모델링
- 코사인 유사도
- 블루아카이브 토픽모델링
- 문맥을 반영한 토픽모델링
- 붕괴 스타레일
Archives
- Today
- Total
목록trl (1)
분석하고싶은코코
PPO 구현을 위한 TRL패키지 살펴보기
이번 포스팅에는 NLP분야에서 PPO 알고리즘을 구현하기 위한 TRL패키지에 대한 이야기와 이전에 포스팅했던 ColossalAI에서 제공하는 패키지의 다른점들들 몇가지에 대해서 기록합니다. 현재 던전앤파이터의 세계관에 대해서 이야기할 수 있는 챗봇을 만드는 작업을 진행하고 있습니다. 지난번 RLHF에 대한 이야기를 하면서 작성했던 코드들은 모두 ColossalAI에서 제공하는 패키지로 KoGPT모델을 통한 훈련을 진행하였습니다. 그런데 해당 실습을 하면서 문제점은 작은 모델이여서 생각만큼 원하는 결과가 나오지 않는다는 것이었고, 두번째로 사용하는 패키지가 최근 버전과는 맞지 않아서 강제로 다운그레이드를 해서 진행을 해야하는 번거로움이 존재했습니다. 그래서 던파 챗봇 프로젝트에서는 해당 패키지를 사용하지 ..
머신러닝&딥러닝/RF(강화학습)
2024. 1. 31. 11:17