Zrozumienie i porównanie tokenizerów używanych w popularnych otwartych modelach AI, takich jak Llama, Phi-3 i Qwen2
Czym jest tokenizer?
Wyobraź sobie, że piszesz list do przyjaciela, ale zamiast słów używasz małych, kolorowych klocków. Każdy klocek reprezentuje literę, słowo, a może nawet całe zdanie. Żeby list miał sens, musisz te klocki ułożyć w odpowiedniej ko...
arturkud.hashnode.dev3 min read