Paper reading | Fastformer: Additive Attention Can Be All You Need
1. Động lực
Transformer là model nổi tiếng với khả năng xử lý trên dữ liệu dạng văn bản một cách mạnh mẽ. Tuy nhiên, điểm trừ lớn của Transformer là độ phức tạp bậc hai với độ dài của chuỗi đầu vào. Trong bài báo, nhóm tác giả đề xuất model Fastforme...
halleystories.hashnode.dev6 min read