Wednesday, July 17, 2013

Excel: Remove duplicates - Loại bỏ dòng trùng lặp

(Anhgolden's Blog)-Từ phiên bản MS Excel 2007, Excel có thêm biểu tượng tính năng mới "Remove Duplicates". Đây là tính năng nhằm hỗ trợ loại bỏ các dòng dữ liệu bị trùng lặp.

Ví dụ: Chúng ta có nhiều dòng dữ liệu, ghi nhận diễn biến trạng thái của Mã Giao dịch. Một Mã giao dịch sẽ trải qua nhiều trạng thái như: Bắt đầu - Đang xử lý và Thành công hoặc Hủy và mỗi lần thay đổi trạng thái sẽ phát sinh thêm 1 dòng dữ liệu. Trong trường hợp, chúng ta chỉ muốn sử dụng 1 dòng dữ liệu có Ngày cập nhật trạng thái cuối cùng, chúng ta sẽ sử dụng tính năng "Remove Duplicates".

Bước 1: Sort dữ liệu theo Mã giao dịch (không phân biệt thứ tự) và Ngày giao dịch (với thứ tự Newest to Oldest). Như vậy dòng dữ liệu có ngày cập nhật trạng thái cuối cùng sẽ có thứ tự nằm trên cùng theo từng Mã giao dịch.
Bước 2: Chọn Remove Duplicates.
Chọn check Colums Giao dịch.
Nguyên lý: chương trình sẽ chạy tuần tự từ trên xuống dưới và so sách dữ liệu của các Colums được chọn giữa dòng hiện tại với dòng trên. Nếu thấy trùng lặp thì xóa dòng hiện tại hoặc tiếp tục đọc xuống dòng dưới.

Và kết quả hiển thị các dòng dữ liệu duy nhất (theo điều kiện các cột chọn so sánh ở trên)


No comments:

Post a Comment