Data Preprocessing
(Tiền xử lý dữ liệu)
Bối cảnh
Trong thế giới dữ liệu ngày nay, chúng ta không làm việc với những bộ dữ liệu “hoàn hảo”. Thực tế, dữ liệu thực (real-world data) thường bị nhiễu, thiếu, và không nhất quán — hậu quả của:
Kích thước dữ liệu khổng lồ (từ vài GB đến hàng TB)....
dwnngnn.hashnode.dev2 min read