Tự động loại bỏ hàng trùng lặp trong Excel


Excel là một ứng dụng đa năng đã phát triển vượt xa các phiên bản ban đầu của nó chỉ đơn giản là một giải pháp bảng tính. Được sử dụng như một người giữ hồ sơ, sổ địa chỉ, công cụ dự báo, và nhiều hơn nữa, nhiều người thậm chí còn sử dụng Excel theo cách nó không bao giờ được dự định.

Nếu bạn sử dụng Excel ở nhà hoặc tại văn phòng, bạn biết đôi khi các tệp Excel có thể nhanh chóng trở nên khó sử dụng do số lượng bản ghi tuyệt đối mà bạn đang làm việc.

May mắn thay, Excel có các hàm dựng sẵn để giúp bạn tìm và loại bỏ các bản ghi trùng lặp. Thật không may, có một vài thông báo trước khi sử dụng các chức năng này, vì vậy hãy cẩn thận hoặc bạn có thể vô tình xóa các bản ghi mà bạn không có ý định xóa. Ngoài ra, cả hai phương pháp bên dưới ngay lập tức xóa các bản sao mà không cho phép bạn xem nội dung nào đã bị xóa.

Tôi cũng sẽ đề cập đến cách đánh dấu các hàng trùng lặp trước để bạn có thể xem những mục nào sẽ bị xóa bởi các hàm trước khi bạn chạy chúng. Bạn phải sử dụng quy tắc Định dạng có điều kiện tùy chỉnh để đánh dấu một hàng hoàn toàn trùng lặp.

Xóa chức năng trùng lặp

Giả sử bạn sử dụng Excel để theo dõi địa chỉ và bạn nghi ngờ bạn có bản ghi trùng lặp. Xem ví dụ bảng tính Excel dưới đây:

Remove Duplicate Excel Records

Lưu ý rằng bản ghi "Jones" xuất hiện hai lần. Để xóa các bản ghi trùng lặp như vậy, hãy nhấp vào tab Dữ liệutrên ruy-băng và định vị chức năng Xóa các bản saotrong phần Công cụ dữ liệu. Nhấp vào Xóa các bản saovà một cửa sổ mới mở ra.

Click on Remove Duplicates Button

Tại đây bạn phải đưa ra quyết định dựa trên việc bạn sử dụng nhãn tiêu đề ở đầu cột của bạn. Nếu bạn làm như vậy, hãy chọn tùy chọn có nhãn Dữ liệu của tôi có tiêu đề. Nếu bạn không sử dụng nhãn tiêu đề, bạn sẽ sử dụng chỉ định cột tiêu chuẩn của Excel, chẳng hạn như Cột A, Cột B, v.v.

Excel Delete Duplicate Records Options

Dành cho ví dụ này, chúng tôi sẽ chỉ chọn cột A và nhấp vào nút OK. Cửa sổ tùy chọn đóng và Excel loại bỏ bản ghi “Jones” thứ hai.

Excel Removed the Duplicate Record

Tất nhiên, đây chỉ là một ví dụ đơn giản. Bất kỳ bản ghi địa chỉ nào bạn tiếp tục sử dụng Excel đều có thể phức tạp hơn nhiều. Giả sử, ví dụ, bạn có một tệp địa chỉ trông như thế này.

Excel Address Book Duplicate Records

Lưu ý rằng mặc dù có ba bản ghi "Jones", chỉ có hai là giống hệt nhau. Nếu chúng ta sử dụng các thủ tục trên để loại bỏ các bản ghi trùng lặp, chỉ một mục nhập "Jones" sẽ vẫn còn. Trong trường hợp này, chúng tôi cần mở rộng tiêu chí quyết định của mình để bao gồm cả tên và họ được tìm thấy trong Cột A và B tương ứng.

Để thực hiện điều này, một lần nữa nhấp vào Dữ liệutrên ruy-băng và sau đó nhấp vào Xóa các bản sao. Lần này, khi cửa sổ tùy chọn bật lên, hãy chọn cột A và B. Nhấp vào nút OKvà thông báo rằng lần này Excel chỉ xóa một trong các bản ghi "Mary Jones".

Điều này là do chúng tôi đã yêu cầu Excel loại bỏ các bản sao bằng cách khớp các bản ghi dựa trên Cột A và B thay vì chỉ Cột A. Các cột bạn chọn càng nhiều, tiêu chí càng cần phải đáp ứng trước khi Excel xem xét bản ghi là trùng lặp. Chọn tất cả các cột nếu bạn muốn xóa các hàng hoàn toàn trùng lặp.

More Options When Removing Duplicates

Excel sẽ cung cấp cho bạn một thông báo cho bạn biết số lượng bản sao đã bị xóa. Tuy nhiên, nó sẽ không hiển thị cho bạn những hàng nào đã bị xóa! Cuộn xuống phần cuối cùng để xem cách đánh dấu các hàng trùng lặp trước khi chạy hàm này.

Phương pháp lọc nâng cao

Cách thứ hai để xóa các mục trùng lặp là sử dụng tùy chọn bộ lọc nâng cao. Đầu tiên, chọn tất cả dữ liệu trong trang tính. Tiếp theo, trên tab Dữ liệu trong ruy-băng, nhấp vào Nâng caotrong Sắp xếp & amp; Bộ lọc.

Trong hộp thoại bật lên, hãy đảm bảo kiểm tra Chỉ bản ghi duy nhấthộp kiểm.

Bạn có thể lọc danh sách tại chỗ hoặc bạn có thể sao chép các mục không trùng lặp sang một phần khác của cùng một bảng tính . Vì một số lý do kỳ lạ, bạn không thể sao chép dữ liệu sang một trang tính khác. Nếu bạn muốn nó trên một trang tính khác, trước tiên hãy chọn một vị trí trên trang tính hiện tại và sau đó cắt và dán dữ liệu đó vào một trang tính mới.

Với phương pháp này, bạn thậm chí không nhận được thông báo cho biết có bao nhiêu hàng đã bị xóa. Các hàng được loại bỏ và đó là nó.

Làm nổi bật hàng trùng lặp trong Excel

Nếu bạn muốn xem bản ghi nào trùng lặp trước khi xóa chúng, bạn phải thực hiện một chút công việc thủ công . Rất tiếc, Excel không có cách nào để làm nổi bật các hàng hoàn toàn trùng lặp. Nó có một tính năng theo định dạng có điều kiện làm nổi bật các ô trùng lặp, nhưng bài viết này là về các hàng trùng lặp.

Điều đầu tiên bạn cần làm là thêm công thức vào cột ở bên phải bộ của bạn dữ liệu. Công thức rất đơn giản: chỉ cần ghép tất cả các cột cho hàng đó lại với nhau.

= A1 & B1 & C1 & D1 & E1

Trong ví dụ dưới đây, tôi có dữ liệu trong cột A qua F. Tuy nhiên, cột đầu tiên là một số ID, vì vậy tôi loại trừ nó khỏi công thức của tôi dưới đây. Đảm bảo bao gồm tất cả các cột có dữ liệu bạn muốn kiểm tra trùng lặp.

Tôi đặt công thức đó vào cột H và sau đó kéo nó xuống cho tất cả các hàng của tôi. Công thức này chỉ đơn giản là kết hợp tất cả dữ liệu trong mỗi cột dưới dạng một phần văn bản lớn. Bây giờ, hãy bỏ qua một vài cột khác và nhập công thức sau:

=COUNTIF($H$1:$H$34, $H1) > 1

Ở đây chúng tôi đang sử dụng hàm COUNTIF và tham số đầu tiên là tập hợp dữ liệu chúng tôi muốn xem tại. Đối với tôi, đây là cột H (có công thức dữ liệu kết hợp) từ hàng 1 đến 34. Bạn cũng nên loại bỏ hàng tiêu đề trước khi thực hiện điều này.

Bạn cũng sẽ muốn đảm bảo bạn sử dụng ký hiệu đô la ($) ở phía trước chữ cái và số. Nếu bạn có 1000 hàng dữ liệu và công thức hàng kết hợp của bạn là trong cột F, ví dụ, công thức của bạn sẽ trông giống như thế này:

=COUNTIF($F$1:$F$1000, $F1) > 1

Tham số thứ hai chỉ có đô la đăng nhập trước chữ cái cột để khóa, nhưng chúng tôi không muốn khóa số hàng. Một lần nữa, bạn sẽ kéo mục này xuống cho tất cả các hàng dữ liệu của mình. Nó sẽ giống như thế này và các hàng trùng lặp phải có TRUE trong chúng.

Bây giờ, hãy làm nổi bật các hàng có TRUE trong chúng như những là các hàng trùng lặp. Đầu tiên, chọn toàn bộ bảng tính của dữ liệu bằng cách nhấp vào hình tam giác nhỏ ở giao điểm trên cùng bên trái của các hàng và cột. Bây giờ, hãy chuyển đến tab Trang chủ, sau đó nhấp vào Định dạng có điều kiệnvà nhấp vào Quy tắc mới.

Trong hộp thoại, nhấp vào Sử dụng công thức để xác định ô cần định dạng.

Trong hộp dưới Định dạng giá trị trong đó công thức này là đúng:, nhập công thức sau, thay thế Pbằng cột của bạn có giá trị TRUE hoặc FALSE. Hãy chắc chắn để bao gồm ký hiệu đô la ở phía trước của thư cột.

=$P1=TRUE

Một khi bạn đã làm điều đó, bấm vào Định dạng và bấm vào tab Điền. Chọn một màu và sẽ được sử dụng để làm nổi bật toàn bộ hàng trùng lặp. Nhấn OK và bây giờ bạn sẽ thấy các hàng trùng lặp được tô sáng.

Nếu điều này không hiệu quả với bạn, hãy bắt đầu lại và làm lại chậm rãi. Nó phải được thực hiện chính xác để tất cả điều này hoạt động. Nếu bạn bỏ lỡ một biểu tượng $ duy nhất trên đường đi, nó sẽ không hoạt động đúng cách.

Cẩn thận với việc loại bỏ các bản ghi trùng lặp

Có, tất nhiên, một vài vấn đề với việc cho phép Excel tự động xóa các bản ghi trùng lặp cho bạn. Trước tiên, bạn phải cẩn thận khi chọn quá ít hoặc quá nhiều cột để Excel sử dụng làm tiêu chí để xác định bản ghi trùng lặp.

Quá ít và bạn có thể vô tình xóa các bản ghi mình cần. Quá nhiều hoặc bao gồm cột số nhận dạng do tai nạn và không tìm thấy trùng lặp nào.

Thứ hai, Excel luôn giả định rằng bản ghi duy nhất đầu tiên mà nó đi qua là bản ghi chính. Mọi bản ghi tiếp theo được giả định là trùng lặp. Đây là một vấn đề nếu, ví dụ, bạn không sửa đổi địa chỉ của một trong những người trong tệp của bạn mà thay vào đó đã tạo bản ghi mới.

Nếu bản ghi địa chỉ (chính xác) mới xuất hiện sau cũ out-of-date) bản ghi, Excel sẽ giả định rằng bản ghi đầu tiên (lỗi thời) là bản ghi chính và xóa mọi bản ghi tiếp theo mà nó tìm thấy. Đây là lý do tại sao bạn phải cẩn thận cách tự do hoặc bảo thủ bạn để Excel quyết định cái gì hoặc không phải là bản ghi trùng lặp.

Đối với những trường hợp đó, bạn nên sử dụng phương pháp đánh dấu trùng lặp mà tôi đã viết và xóa thủ công bản ghi trùng lặp thích hợp.

Cuối cùng, Excel không yêu cầu bạn xác minh xem bạn có thực sự muốn xóa bản ghi hay không. Sử dụng các tham số bạn chọn (cột), quá trình này hoàn toàn tự động. Điều này có thể là một điều nguy hiểm khi bạn có một số lượng lớn hồ sơ và bạn tin tưởng rằng các quyết định bạn đã đưa ra là chính xác và cho phép Excel tự động xóa các bản ghi trùng lặp cho bạn.

Ngoài ra, hãy chắc chắn kiểm tra bài viết trước của chúng tôi về xóa các dòng trống trong Excel. Hãy tận hưởng!

Cách xóa dữ liệu trùng lặp trong Excel - Excel cơ bản

bài viết liên quan:


6.04.2010