#sft articles | Hashnode

RSRijul Sarinappliedailab.hashnode.devJun 21 · 12 min read

How Models Learn to Behave: SFT, RLHF, and What Alignment Means for Product

Applied AI Product Management, a supplementary post. This topic sits naturally between Post 5 (The measurement concepts every AI PM needs to own) and Post 6 (Build, buy, or API). Post 3 covered fine-t

0

AAAbstract Algorithmsabstractalgorithms.hashnode.devMar 9 · 12 min read

SFT for LLMs: A Practical Guide to Supervised Fine-Tuning

TLDR: Supervised fine-tuning (SFT) is the stage where a pretrained model learns task-specific response behavior from curated input-output examples. It is usually the first alignment step after pretrai

0

JKJonas Kimbits-bytes-nn.hashnode.devJan 7, 2024 · 24 min read

Mixtral of Experts 논문 리뷰

TL;DR 이 연구를 시작하게 된 배경과 동기는 무엇입니까? 대규모 언어 모델의 발전은 최근 인공지능 분야에서 가장 중요한 연구 주제 중 하나로 자리 잡았다. 그러나 기존 모델들은 계산 비용과 메모리 요구사항이 급격히 증가하면서 실제 응용에 있어 심각한 제약을 가지고 있었다. 특히 모델의 크기가 커질수록 모든 매개변수를 동시에 활성화하는 것은 비현실적이며 비효율적이었다. 이러한 문제를 해결하기 위해 연구자들은 모델의 계산 효율성을 높이면서도 성...

0

JKJonas Kimbits-bytes-nn.hashnode.devJan 4, 2024 · 21 min read

DeepSeek LLM: Scaling Open-Source Language Models with Longtermism 논문 리뷰

TL;DR 이 연구를 시작하게 된 배경과 동기는 무엇입니까? 오픈소스 대규모 언어 모델(LLMs)의 발전이 가속화되면서, 모델 스케일링에 대한 명확한 이해의 필요성이 대두되었습니다. 기존 연구들은 스케일링 법칙에 대해 서로 다른 결론을 제시했으며, 하이퍼파라미터 설정에 대한 상세한 설명이 부족했습니다. 특히 AGI 발전의 초기 단계에서 효율적인 모델 스케일링 전략의 수립이 중요한 과제로 대두되었습니다. 이러한 배경에서 DeepSeek LLM 연...

0

JKJonas Kimbits-bytes-nn.hashnode.devSep 9, 2023 · 20 min read

Mistral 7B 논문 리뷰

TL;DR 이 연구를 시작하게 된 배경과 동기는 무엇입니까? 자연어 처리 분야에서 언어 모델의 성능 향상은 주로 모델 크기 증가에 의존해왔습니다. 그러나 이러한 규모 확장은 계산 비용과 추론 지연 시간을 증가시켜 실제 환경에서의 배포에 장벽을 만듭니다. 연구자들은 높은 성능과 효율성을 동시에 제공하는 균형 잡힌 모델의 필요성을 인식했습니다. 기존의 대규모 언어 모델들은 뛰어난 성능을 보여주지만, 실시간 애플리케이션이나 제한된 리소스 환경에서 활...

0

JKJonas Kimbits-bytes-nn.hashnode.devJul 17, 2023 · 34 min read

Llama 2: Open Foundation and Fine-Tuned Chat Models 논문 리뷰

TL;DR 이 연구를 시작하게 된 배경과 동기는 무엇입니까? 대규모 언어 모델(LLM)의 발전으로 AI 어시스턴트가 복잡한 추론 작업을 수행할 수 있게 되었지만, 이러한 모델의 개발은 높은 컴퓨팅 요구사항으로 인해 소수의 기업에만 제한되어 있었습니다. 기존의 오픈소스 모델들은 ChatGPT와 같은 상용 모델들과 비교했을 때 성능과 안전성 측면에서 격차가 있었습니다. 메타는 이러한 격차를 해소하고 AI 기술의 민주화를 촉진하기 위해 Llama 2...

0

JKJonas Kimbits-bytes-nn.hashnode.devFeb 26, 2023 · 18 min read

LLaMA: Open and Efficient Foundation Language Models 논문 리뷰

TL;DR 이 연구를 시작하게 된 배경과 동기는 무엇입니까? 대규모 언어 모델(LLM)의 발전은 주로 비공개 데이터셋과 막대한 컴퓨팅 자원을 보유한 대기업들에 의해 주도되어 왔습니다. 이는 학계와 소규모 연구 기관들의 LLM 연구 참여를 제한하는 중요한 장벽이 되어왔습니다. 메타 AI 연구진은 이러한 한계를 극복하고자, 공개적으로 접근 가능한 데이터만을 사용하여 최고 수준의 성능을 달성할 수 있는 효율적인 언어 모델을 개발하고자 했습니다. 특히...

0

B

#sft

#sft

Explore Hashnode

Trending tags this week

How Models Learn to Behave: SFT, RLHF, and What Alignment Means for Product

SFT for LLMs: A Practical Guide to Supervised Fine-Tuning

Mixtral of Experts 논문 리뷰

DeepSeek LLM: Scaling Open-Source Language Models with Longtermism 논문 리뷰

Mistral 7B 논문 리뷰

Llama 2: Open Foundation and Fine-Tuned Chat Models 논문 리뷰

LLaMA: Open and Efficient Foundation Language Models 논문 리뷰

#sft

Search Hashnode

#sft

Explore Hashnode

Trending tags this week

How Models Learn to Behave: SFT, RLHF, and What Alignment Means for Product

SFT for LLMs: A Practical Guide to Supervised Fine-Tuning

Mixtral of Experts 논문 리뷰

DeepSeek LLM: Scaling Open-Source Language Models with Longtermism 논문 리뷰

Mistral 7B 논문 리뷰

Llama 2: Open Foundation and Fine-Tuned Chat Models 논문 리뷰

LLaMA: Open and Efficient Foundation Language Models 논문 리뷰