Cách loại bỏ các hàng trùng lặp trong Excel

Các giá trị trùng lặp(Duplicate) trong trang tính Excel của bạn có thể làm rối tung dữ liệu của bạn. Trừ khi có chủ ý trùng lặp, chúng có thể gây ra sự không chính xác và sai lệch báo cáo.

Trong hướng dẫn này, chúng tôi sẽ chỉ cho bạn cách tìm và loại bỏ các bản sao trong tài liệu Excel của bạn .

Cách tìm hàng hoặc dữ liệu trùng lặp

Trước tiên, điều cần thiết là phải kiểm tra xem hàng (hoặc cột) nào có thông tin giống nhau. Vì vậy, trước khi chúng tôi hướng dẫn bạn cách xóa các bản sao trong Excel , hãy cùng hướng dẫn bạn quy trình kiểm tra dữ liệu trùng lặp trên trang tính của bạn.

Phương pháp 1: Tìm kiếm Toàn bộ Trang tính(Method 1: Search Entire Worksheet)

Excel có công cụ Định dạng có Điều kiện(Conditional Formatting tool) giúp xác định, trực quan hóa và rút ra kết luận từ dữ liệu. Đây là cách sử dụng công cụ để đánh dấu các giá trị trùng lặp trong tài liệu Excel của bạn .

  1. Nhấn Control + A để chọn danh sách hoặc bảng của bạn. Ngoài ra, hãy nhấp vào biểu tượng Chọn tất cả(Select All) ở góc trên cùng bên trái của bảng để chọn toàn bộ trang tính.

  1. Chuyển đến tab Trang(Home) đầu và nhấp vào nút thả xuống Định dạng có điều kiện .(Conditional Formatting)

  1. Di chuyển con trỏ của bạn qua Quy tắc ô tô sáng(Highlight Cell Rules) và chọn Giá trị trùng lặp(Duplicate Values) .

  1. Đảm(Make) bảo rằng hộp thả xuống đầu tiên có nội dung “Sao y”. Bạn cũng có thể chọn màu đánh dấu ưa thích của mình trong menu thả xuống thứ hai.

  1. Chọn OK để tiếp tục.

Excel sẽ ngay lập tức đánh dấu các hàng và cột có giá trị trùng lặp.

Phương pháp 2: Bằng cách kết hợp các hàng(Method 2: By Combining Rows)

Phương pháp này hoàn hảo để tìm các hàng có giá trị trùng lặp trên tất cả các cột hoặc ô. Trước tiên(First) , bạn sẽ cần sử dụng chức năng “Kết hợp” của Excel để kết hợp nội dung của mỗi hàng. Sau đó, chọn cột mà bạn muốn các giá trị kết hợp được lưu trữ và làm theo các bước bên dưới. Chúng tôi khuyên bạn nên kết hợp các giá trị trong một cột bên cạnh giá trị cuối cùng trên hàng đầu tiên.

  1. Nhập hoặc dán =CONCAT( trong ô, chọn ô đầu tiên trên hàng, nhập cột ( :) và chọn ô cuối cùng trên hàng. Sau đó(Afterward) , đóng công thức bằng dấu ngoặc đơn và nhấn Enter .

Trong trang tính mẫu của chúng tôi (xem hình ảnh bên dưới), ô đầu tiên và ô cuối cùng trên hàng đầu tiên có tham chiếu A2 và D2 ​​tương ứng. Do đó(Hence) , công thức sẽ có dạng sau: =CONCAT(A2:D2) .

Hãy nhớ rằng(Remember) , các tham chiếu ô sẽ khác nhau tùy thuộc vào số hàng và cột trên bảng.

  1. Sao chép công thức xuống cột cho đến khi bạn đến hàng cuối cùng. Để thực hiện việc này, hãy chọn ô có công thức, di chuyển con trỏ chuột đến góc dưới cùng bên trái của ô, giữ biểu tượng Ô điều khiển điền(Fill handle) (tức là biểu tượng dấu cộng) và kéo nó xuống cột.

  1. Chọn toàn bộ cột — nhấp vào ký tự ở đầu cột hoặc nhấp vào một ô trong cột và nhấn Control + Space .

  1. Chuyển đến tab Trang đầu và chọn (Home)Định dạng có Điều kiện(Conditional Formatting) .

  1. Di con trỏ chuột của bạn trên Quy tắc ô tô sáng(Highlight Cell Rules) và chọn Giá trị trùng lặp(Duplicate Values) .

  1. Chọn OK để tiếp tục.

Excel sẽ đánh dấu cột có các giá trị trùng lặp. Điều đó cho bạn biết các ô trong hàng cụ thể đó có giá trị trùng lặp như một hàng khác trên trang tính.

Nếu bạn quan sát kỹ hình ảnh ở trên, bạn sẽ nhận thấy rằng công cụ Định dạng có Điều kiện(Conditional Formatting) đã không tô sáng Hàng 4(Row 4)Hàng 13(Row 13) . Cả hai hàng đều có các giá trị trùng lặp trong cột Tên(Names) , Điểm(Scores)ID , nhưng các giá trị khác nhau trong cột Ngày(Day) .

Chỉ 3 trong số 4 cột ở cả hai hàng có thông tin trùng lặp. Điều đó giải thích tại sao công cụ Định dạng có Điều kiện(Conditional Formatting) không đánh dấu các giá trị được nối hoặc kết hợp cho cả hai hàng. Cả hai hàng ( Hàng 4(Row 4)Hàng 13(Row 13) ) là duy nhất vì có thông tin phân biệt trong cột "Ngày".

Cách loại bỏ các hàng trùng lặp(Duplicate Rows) trong Excel

Bạn đã tìm thấy nhiều hàng chứa thông tin trùng lặp trong trang tính Excel của mình . Chúng tôi sẽ hướng dẫn bạn cách loại bỏ các hàng trùng lặp này bằng hai công cụ Excel .

1. Sử dụng Công cụ “Xóa các bản sao”(1. Use the “Remove Duplicates” Tool)

Công cụ này chỉ có một công việc: đảm bảo bạn có dữ liệu sạch trong trang tính Excel của mình . Nó đạt được điều này bằng cách so sánh các cột đã chọn trong trang tính của bạn và loại bỏ các hàng có giá trị trùng lặp. Đây là cách sử dụng công cụ:

  • Chọn một ô trên bảng và nhấn Control + A trên bàn phím của bạn để đánh dấu bảng.

  • Chuyển đến tab Dữ liệu và nhấp vào biểu tượng (Data)Xóa bản sao(Remove Duplicates) trong phần “Công cụ dữ liệu”.

Nếu PC của bạn có màn hình nhỏ hoặc cửa sổ Excel được thu nhỏ, hãy nhấp vào nút thả xuống Công cụ dữ liệu và chọn (Data Tools)Xóa bản sao(Remove Duplicates) .

  • Đi qua phần Cột(Columns) và chọn tất cả các cột. Nếu bảng của bạn có tiêu đề, hãy chọn hộp có nội dung “Dữ liệu của tôi có tiêu đề”. Thao tác đó sẽ bỏ chọn hàng tiêu đề hoặc hàng đầu tiên trên trang tính. Nhấn (Click) OK để tiếp tục.

Mẹo nhanh:(Quick Tip:) Để đặt hàng đầu tiên của trang tính Excel làm tiêu đề, hãy chuyển đến tab Xem , chọn (View)Cố(Freeze Panes) định các ngăn và chọn Cố định Hàng trên cùng(Freeze Top Row) .

  • Excel sẽ hiển thị lời nhắc thông báo cho bạn về tổng giá trị trùng lặp được tìm thấy và loại bỏ khỏi trang tính. Bấm (Click) OK để quay lại trang tính.

2. Sử dụng Công cụ lọc nâng cao(2. Use the Advanced Filter Tool)

“Bộ lọc nâng cao” là một công cụ tuyệt vời khác giúp bạn làm sạch dữ liệu của mình trong Excel(clean your data in Excel) . Công cụ này cho phép bạn xem, chỉnh sửa, nhóm và sắp xếp dữ liệu trên trang tính của mình(group and sort data on your worksheet) . Thực hiện theo các bước bên dưới để tìm hiểu cách sử dụng công cụ này để xóa các hàng trùng lặp khỏi trang tính Excel của bạn .

  • Chọn(Select) bất kỳ ô nào trên bảng và nhấn Control + A để đánh dấu toàn bộ bảng.

  • Chuyển đến tab Dữ liệu và chọn (Data)Nâng cao(Advanced) trong phần “Sắp xếp & Bộ lọc”.

  • Chọn hộp Chỉ bản ghi duy nhất(Unique records only) và nhấp vào OK .

Nếu bảng hoặc trang tính chứa nhiều hàng có thông tin hoặc giá trị tương tự, Excel sẽ loại bỏ tất cả trừ lần xuất hiện đầu tiên của các bản sao.

Lưu ý:(Note:) Công cụ Bộ lọc Nâng cao(Advanced Filter) tự động coi hàng đầu tiên là tiêu đề. Điều này có nghĩa là công cụ sẽ không xóa hàng đầu tiên, ngay cả khi nó chứa thông tin trùng lặp. Ví dụ: trong bảng bên dưới, việc chạy tính năng “Chỉ bản ghi duy nhất” của công cụ (Unique)Bộ lọc nâng cao(Advanced Filter) đã không loại bỏ hàng đầu tiên và hàng cuối cùng — mặc dù cả hai đều có giá trị trùng lặp trên tất cả các cột.

Vì vậy, nếu trang tính hoặc bảng Excel của bạn có tiêu đề, tốt nhất bạn nên sử dụng công cụ “Loại bỏ các bản sao” để loại bỏ các hàng trùng lặp.(Excel)

Mẹo nhanh:(Quick Tip:) Đã vô tình xóa các hàng hoặc giá trị trùng lặp? Nhấn Control + Z để hoàn nguyên thay đổi và lấy lại dữ liệu trùng lặp.

Loại bỏ các bản sao trong Excel : Hạn chế

Chúng tôi nên lưu ý rằng bạn không thể xóa các hàng hoặc giá trị trùng lặp khỏi trang tính có chứa dữ liệu được dàn ý hoặc nhóm(outlined or grouped data) . Vì vậy, nếu bạn đã nhóm các hàng và cột trong trang tính Excel của mình(grouped the rows and columns in your Excel worksheet) , có lẽ thành Tổng và Tổng phụ, bạn sẽ phải hủy nhóm dữ liệu trước khi có thể kiểm tra các bản sao. Tham khảo tài liệu chính thức này của Microsoft(this official documentation from Microsoft) để tìm hiểu thêm về cách loại bỏ các bản sao trong Excel và lọc các giá trị duy nhất.



About the author

Tôi là nhà phát triển phần mềm miễn phí và là người ủng hộ Windows Vista / 7. Tôi đã viết hàng trăm bài báo về các chủ đề khác nhau liên quan đến hệ điều hành, bao gồm các mẹo và thủ thuật, hướng dẫn sửa chữa và các phương pháp hay nhất. Tôi cũng cung cấp các dịch vụ tư vấn liên quan đến văn phòng thông qua công ty của tôi, Dịch vụ Bộ phận Trợ giúp. Tôi hiểu sâu về cách hoạt động, các tính năng của Office 365 và cách sử dụng chúng hiệu quả nhất.



Related posts