Skip to content
В статье описаны наиболее эффективные способы поиска, фильтрации и выделения уникальных значений в Excel.
Ранее мы рассмотрели различные способы подсчета уникальных значений в Excel. Но иногда вам может понадобиться только просмотреть уникальные или различные значения в столбце, не пересчитывая их. Но, прежде чем двигаться дальше, давайте убедимся, что мы понимаем, о чем будем говорить. Итак,
- Уникальные значения – это элементы, которые появляются в наборе данных только один раз.
- Различные – это элементы, которые появляются хотя бы один раз, то есть неповторяющиеся и первые вхождения повторяющихся значений.
А теперь давайте исследуем наиболее эффективные методы работы с уникальными и различными значениями в таблицах Excel.
- Как найти уникальные значения формулами.
- Фильтр для уникальных данных.
- Выделение цветом и условное форматирование.
- Быстрый и простой способ — Duplicate Remover.
Как найти уникальные значения при помощи формул.
Самый простой способ сделать это – использовать функции ЕСЛИ и СЧЁТЕСЛИ. В зависимости от типа данных, которые вы хотите найти, может быть несколько вариантов формулы, как показано в следующих примерах.
Как найти уникальные значения в столбце.
Чтобы найти различные или уникальные значения в списке, используйте одну из следующих формул, где A2 – первая, а A10 – последняя ячейка с данными.
Чтобы найти уникальные значения в Excel:
=ЕСЛИ(СЧЁТЕСЛИ($A$2:$A$10; $A2)=1; “Уникальный”; “”)
Чтобы определить различные значения:
=ЕСЛИ(СЧЁТЕСЛИ($A$2:$A2; $A2)=1; “Различный”; “”)
Во второй формуле есть только одно небольшое отличие во второй ссылке на ячейку, что, однако, имеет большое значение:
Совет. Если вы хотите найти уникальные значения между двумя столбцами , т.е. найти значения, которые присутствуют в одном столбце, но отсутствуют в другом, используйте формулу, описанную в статье Как сравнить 2 столбца на предмет различий.
Уникальные строки в таблице.
Аналогичным образом вы можете найти уникальные строки в таблице Excel на основе изучения записей не в одном, а в двух или более столбцах. В этом случае вам необходимо использовать СЧЁТЕСЛИМН вместо СЧЁТЕСЛИ для оценки значений (до 127 пар диапазон/критерий можно обработать в одной формуле).
Формула для получения уникальных строк:
=ЕСЛИ(СЧЁТЕСЛИМН($A$2:$A$10; $A2; $B$2:$B$10; $B2)=1; “Уникальная”; “”)
Формула для поиска различных строк:
=ЕСЛИ(СЧЁТЕСЛИМН($A$2:$A2; $A2; $B$2:$B2; $B2)=1; “Различная”; “”)
В нашем случае уникальная комбинация Имя+Фамилия встречается 2 раза. А всего в списке 6 человек, из которых трое дублируются.
Как найти уникальные записи с учетом регистра?
Если вы работаете с набором данных, где важен регистр букв, вам понадобится немного более сложная формула массива.
Поиск уникальных значений с учетом регистра :
{=ЕСЛИ(СУММ((–СОВПАД($A$2:$A$10;A2)))=1;”Уникальный”;””)}
Поиск различных значений с учетом регистра :
{=ЕСЛИ(СУММ((–СОВПАД($A$2:$A2;$A2)))=1;”Различный”;””)}
Поскольку обе они являются формулами массива, обязательно нажмите Ctrl + Shift + Enter
, чтобы правильно их записать.
Когда уникальные или различные значения найдены, вы можете легко отфильтровать, выбрать или скопировать их, как будет описано ниже.
Фильтр для уникальных значений.
Чтобы просмотреть только уникальные или различные значения в списке, отфильтруйте их, выполнив следующие действия.
- Примените одну из приведенных выше формул для определения уникальных или различных ячеек или строк.
- Выберите диапазон и нажмите кнопку «Фильтр» на вкладке «Данные».
- Щелкните стрелку фильтрации в заголовке столбца, содержащего формулу, и выберите то, что хотите просмотреть:
Как выбрать уникальные из фильтра.
Если у вас относительно небольшой список уникальных, вы можете просто выбрать их обычным способом с помощью мыши при нажатой клавише Ctrl. Если отфильтрованный список содержит сотни или тысячи строк, то для экономии времени вы можете использовать один из следующих способов.
Чтобы быстро выбрать весь получившийся список, включая заголовки столбцов, отфильтруйте уникальные значения, щелкните любую ячейку в получившемся списке, а затем нажмите Ctrl + A
.
Чтобы выбрать уникальные значения без заголовков столбцов, отфильтруйте их, выберите первую ячейку с данными и нажмите Ctrl + Shift + End, чтобы расширить выделение до последней ячейки.
Примечание. В некоторых редких случаях, в основном в очень больших книгах, рекомендованные выше комбинации клавиш могут выбирать как видимые, так и невидимые ячейки. Чтобы исправить это, нажмите сначала либо Ctrl + A
или же Ctrl + Shift + End
, а затем нажмите Alt +;
для выбора только видимых ячеек, игнорируя скрытые строки.
Если вам сложно запомнить такое количество комбинаций, используйте этот визуальный способ: выделите весь список, затем перейдите на вкладку «Главная» > «Найти и выделить» > «Выделить группу ячеек» и выберите «Только видимые ячейки».
Как скопировать уникальные значения в другое место?
Чтобы скопировать список на новое место, сделайте следующее:
- Выберите отфильтрованные значения с помощью мыши или вышеупомянутых комбинаций клавиш.
- Нажмите
Ctrl + C
для копирования выбранных значений. - Выберите верхнюю левую ячейку в целевом диапазоне (она может находиться на том же или другом листе) и нажмите Ctrl + V , чтобы вставить данные.
Выделение цветом уникальных значений в столбце.
Всякий раз, когда вам нужно выделить что-либо в Excel на основе определенного условия, перейдите прямо к функции условного форматирования. Более подробная информация и примеры приведены ниже.
Самый быстрый и простой способ выделить уникальные значения в Excel – применить встроенное правило условного форматирования:
- Выберите столбец данных, в котором вы хотите выделить уникальные.
- На вкладке Главная в группе Стили щелкните Условное форматирование > Правила выделения ячеек > Повторяющиеся значения …
- В диалоговом окне « Повторяющиеся значения » выберите «Уникальный» в левом поле и выберите желаемое форматирование в правом поле, затем нажмите « ОК» .
Совет. Если вас не устраивает какой-либо из предопределенных форматов, щелкните «Пользовательский формат …» (последний элемент в раскрывающемся списке) и установите цвет заливки и / или шрифта по своему вкусу.
Как видите, выделение уникальных значений в Excel – самая простая задача, которую можно себе представить. Однако встроенное правило Excel работает только для элементов, которые появляются в списке только один раз. Если вам нужно выделить различные значения – уникальные и первые вхождения дубликатов – то придется создать собственное правило на основе формулы.
Вам также потребуется создать настраиваемое правило для выделения уникальных строк на основе значений в одном или нескольких столбцах.
Как создать правило для условного форматирования уникальных значений?
Чтобы выделить уникальные или различные значения в столбце, выберите диапазон ячеек без заголовка столбца (вы же не хотите, чтобы заголовок выделялся, не так ли?) Затем создайте правило условного форматирования с помощью формулы.
Чтобы создать правило условного форматирования на основе формулы, выполните следующие действия:
- Перейдите на вкладку «Главная » и щелкните « Условное форматирование» > « Новое правило» > «Использовать формулу», чтобы с ее помощью определить, какие ячейки нужно форматировать .
- Введите формулу в поле «Форматировать значения …».
- Нажмите кнопку «Формат …» и выберите нужный цвет заливки и/или цвет шрифта.
- Наконец, нажмите кнопку ОК , чтобы применить правило.
Более подробные инструкции см. в статье: Как создать правила условного форматирования Excel на основе другого значения ячейки .
А теперь поговорим о том, какие формулы использовать и в каких случаях.
Выделяем цветом отдельные уникальные значения.
Чтобы выделить значения, которые появляются в списке только один раз, используйте следующую формулу:
=СЧЁТЕСЛИ($A$2:$A$10;$A2)=1
Где A2 – первая, а A10 – последняя ячейка диапазона.
Чтобы выделить все различные значения в столбце, то есть встречающиеся хотя бы однажды, используйте это выражение:
= СЧЁТЕСЛИ($A$2:$A2;$A2)=1
Где A2 – самая верхняя ячейка диапазона.
Как выделить строку с уникальным значением в одном столбце.
Чтобы выделить целые строки на основе уникальных значений в определенном столбце, используйте формулы, которые мы использовали в предыдущем примере, но применяйте правило ко всей таблице, а не к одному столбцу.
На следующем скриншоте показано, как выглядит правило, выделяющее строки на основе уникальных значений в столбце A:
Как видите, формула
=СЧЁТЕСЛИ($A$2:$A$10;$A2)=1
та же самая, что и раньше, но строка в диапазоне выделена вся.
А можно использовать и такое выражение:
=СУММ(Ч($A2&$B2=$A$2:$A$10&$B$2:$B$10))<2
Результат будет таким же.
Как выделить уникальные строки?
Если вы хотите выделить строки на основе значений в двух или более столбцах, используйте функцию СЧЁТЕСЛИМН, которая позволяет указать несколько критериев в одной формуле.
Чтобы выделить уникальные строки:
=СЧЁТЕСЛИМН($A$2:$A$10;$A2; $B$2:$B$10;$B2)=1
Чтобы выделить различные строки:
=СЧЁТЕСЛИМН($A$2:$A2;$A2; $B$2:$B2;$B2)=1
Быстрый и простой способ найти и выделить уникальные значения
Как вы только что видели, Microsoft Excel предоставляет довольно много полезных функций, которые могут помочь вам идентифицировать и выделять уникальные значения на ваших листах.
Однако все эти решения сложно назвать интуитивно понятными и простыми в использовании, поскольку они требуют запоминания нескольких различных формул. Конечно, для профессионалов Excel в этом нет ничего страшного 🙂
Для тех пользователей Excel, которые хотят сэкономить свое время и силы, позвольте мне показать быстрый и простой способ поиска уникальных значений в Excel.
В этом последнем разделе нашего сегодняшнего руководства мы собираемся использовать надстройку Duplicate Remover для Excel. Пожалуйста, пусть вас не смущает название инструмента. Помимо повторяющихся записей, он может отлично обрабатывать уникальные и различные записи.
Давайте посмотрим.
- Выберите любую ячейку в таблице, в которой вы хотите найти уникальные значения, и нажмите кнопку DuplicateRemover на вкладке AblebitsData в группе Dedupe.
Мастер запустится, и вся таблица будет выбрана автоматически. Итак, просто нажмите « Далее», чтобы перейти к следующему шагу.
- В зависимости от вашей цели выберите один из следующих вариантов и нажмите Далее :
- Уникальные
- Уникальные + 1е вхождения (различные)
- Выберите один или несколько столбцов, в которых вы хотите проверить значения.
В этом примере мы хотим найти уникальные сочетания Заказчик + Товар на основе значений в двух столбцах. Их и выбираем при помощи галочки. - Выберите один или несколько столбцов, в которых вы хотите проверить значения.
Если у вашей таблицы есть заголовки, обязательно установите флажок Mytable has headers. И если в вашей таблице могут встретиться пустые ячейки, то убедитесь, что установлен флажок Skipempty cells. Оба параметра находятся в верхней части диалогового окна и обычно выбираются по умолчанию.
Если вдруг в наших записях случайно появились лишние пробелы, то, думаю, стоит их игнорировать. Поэтому отмечаем также Ignore extra spaces.
Также наш поиск буден нечувствителен к регистру, то есть не будем при сравнении данных различать прописные и строчные буквы. Поэтому не активируем опцию Case-sensitive match.
- Выберите одно из следующих действий, которые нужно выполнить с найденными значениями:
- Выделить цветом.
- Выбрать и выделить.
- Отметить в колонке статуса.
- Копировать в другое место.
Если вы выберете опцию Select values, то все найденные значения окажутся выделенными, как будто вы кликали на них мышкой при нажатой клавише Ctrl. Пока они выделены, вы можете изменить их цвет фона и шрифта, границы и т.д. К сожалению, скопировать либо переместить их никуда не получится, так как такую операцию не поддерживает Excel.
В нашем случае чтобы найти уникальные значения, вполне достаточно будет просто выделить их цветом. Поэтому выберем Highlight with color.
Нажмите кнопку «Готово» и получите результат:
Вот как вы можете находить, выбирать и выделять уникальные значения в Excel с помощью надстройки Duplicate Remover. Это действительно просто, не правда ли?
Я рекомендую вам загрузить полнофункциональную ознакомительную версию Ultimate Suite и попробовать в работе Duplicate Remover и множество других инструментов, которые помогут сэкономить вам кучу времени при работе в Excel.
Часто при работе в программе Excel перед пользователем стоит задача получить из таблицы уникальные значения одного из столбцов.
Способов это сделать, не используя различных настроек, несколько:
- (самый простой способ) с помощью встроенных методов и инструментов Excel;
- с помощью формул;
- с помощью сводных таблиц;
- с помощью макросов VBA.
Способ № 1
Начиная с Excel 2007 пользователю предоставлена возможность удаления дубликатов строк. Для этого необходимо:
1. Выбрать диапазон строк, в котором расположены записи, из которых нужно оставить только уникальные значения.
2. На панели инструментов на вкладке “Данные” нужно найти и нажать кнопку “Удалить дубликаты”
3. Получите результат
Нужно помнить, что данная команда удаляет дубликаты из выделенного диапазона, поэтому для того, чтобы не испортить исходный диапазон нужно скопировать его например на другой лист и выполнить эту операцию на нем.
Описание второго и третьего вариантов, у меня есть на видео, в котором можно наглядно посмотреть как это работает.
Способ № 2. Выборка уникальных значений с помощью формулы
Порядок действий такое.
1. Как и в первом способе, сначала нужный нам диапазон необходимо скопировать на другой лист и отсортировать его.
2. В соседний столбец (ячейка B1) в самую верхнюю ячейку, рядом с первой ячейкой отсортированного диапазона вводим следующую формулу:
=ЕСЛИ(A2<>A1;A1;1)
и копируем ее до самой последней строки. На примере это ячейка B20.
Этот способ подходит тем, у кого версия Excel ниже 2007. Скорее всего таких осталось очень мало, но все же и такой способ имеет место быть 🙂
Способ № 3. Выборка уникальных значений с помощью сводной таблицы.
Способ тоже не требует особых навыков и трудозатрат и например, если строк очень много и “протягивать” формулу из примера № 2 очень долго. Кроме того, его можно использовать если вам нужен не просто перечень уникальных значений, но и в последующем нужно будет провести более подробный анализ данных.
Для этого необходимо выделить нужный диапазон, как на рисунке
И перейти на вкладку “Вставить” и нажать на кнопку “Сводная таблица
Программа автоматически перейдет на новый лист для формирования сводной таблицы
В правой части можно увидеть наименования столбцов нашей выделенной таблицы. Так как в примере у нас только один столбец “Наименование” то и на рисунке одна строка “Наименование”.
С помощью мыши нужно перенести эту строку в нижнюю правую часть экрана в графу “Строки”
Способ №4. С помощью макросов
Данный способ технически более сложный из всех, но он и самый гибкий. Если в предыдущих примерах для получения уникальных значений нам нужна таблица, в которой не должно быть ни пропусков, ни объединенных ячеек, то с помощью макросов (встроенного языка программирования VBA) мы можем получить уникальные значения из любого диапазона ячеек.
В нашем примере, мы рассмотрим таблицу, в которой имеются строки, содержащие объединенные ячейки, которые мешают использовать все предыдущие способы.
Например у нас есть таблица
Нам необходимо получить уникальные значения наименований товаров из этой таблицы. Так как в ней присутствуют объединенные строки, то использовать формулы может оказаться трудоемкой задачей (при наличии в таблице нескольких сотен, а то и тысяч строк), а сводные таблицы не допускают наличия в искомой таблице объединенных ячеек, то мы будем использовать встроенный язык программирования VBA.
Для того чтобы начать “волшебство” нужно перейти в редактор VBA, для чего нажмите сочетание клавиш Alt+F11
Теперь мы создаем нашу процедуру, для чего последовательно выполните следующие действия
Dim r As Range
Dim i As Integer
Dim s As Range
Set r = ActiveSheet.UsedRange
Set s = ActiveSheet.Cells(2, 6)
For i = 3 To r.Rows.Count
If r.Cells(i, 2).MergeCells Then
Else
s = r.Cells(i, 2)
Set s = s.Offset(1)
End If
Next i
Set s = s.CurrentRegion
s.RemoveDuplicates Columns:=1, Header:=xlNo
После копирования этого кода в редактор VBA и запустив процедуру с помощью кнопки F5 вы получите следующий результат
В данной статье мы рассмотрели 4 способа получения уникальных строк из электронной таблицы. Какой из этих способов использовать? Это решать вам. Любой из них может оказаться эффективным в конкретном случае, поэтому предпочтительно знать каждый из них.
Если статья вам понравилась, ставьте лайк и подписывайтесь на мой канал. Дальше будет интересно!!!
Excel для Microsoft 365 Excel для Microsoft 365 для Mac Excel для Интернета Excel 2021 Excel 2021 для Mac Excel для iPad Excel для iPhone Excel для планшетов с Android Excel для телефонов с Android Еще…Меньше
Функция УНИК возвращает список уникальных значений в списке или диапазоне.
Возвращение уникальных значений из списка значений
Возвращение уникальных имен из списка имен
=УНИК(массив,[by_col],[exactly_once])
Функция УНИК имеет следующие аргументы:
Аргумент |
Описание |
---|---|
массив Обязательный |
Диапазон или массив, из которого возвращаются уникальные строки или столбцы |
[by_col] Необязательный |
Аргумент by_col является логическим значением, указывающим, как проводить сравнение. Значение ИСТИНА сравнивает столбцы друг с другом и возвращает уникальные столбцы Значение ЛОЖЬ (или отсутствующее значение) сравнивает строки друг с другом и возвращает уникальные строки |
[exactly_once] Необязательно |
Аргумент exactly_once является логическим значением, которое возвращает строки или столбцы, встречающиеся в диапазоне или массиве только один раз. Это концепция базы данных УНИК. Значение ИСТИНА возвращает из диапазона или массива все отдельные строки или столбцы, которые встречаются только один раз Значение ЛОЖЬ (или отсутствующее значение) возвращает из диапазона или массива все отдельные строки или столбцы |
Примечания:
-
Массив может рассматриваться как строка или столбец со значениями либо комбинация строк и столбцов со значениями. В примерах выше массивы для наших формул УНИК являются диапазонами D2:D11 и D2:D17 соответственно.
-
Функция УНИК возвращает массив, который будет рассеиваться, если это будет конечным результатом формулы. Это означает, что Excel будет динамически создавать соответствующий по размеру диапазон массива при нажатии клавиши ВВОД. Если ваши вспомогательные данные хранятся в таблице Excel, тогда массив будет автоматически изменять размер при добавлении и удалении данных из диапазона массива, если вы используете Структурированные ссылки. Дополнительные сведения см. в статье Поведение рассеянного массива.
-
Приложение Excel ограничило поддержку динамических массивов в операциях между книгами, и этот сценарий поддерживается, только если открыты обе книги. Если закрыть исходную книгу, все связанные формулы динамического массива вернут ошибку #ССЫЛКА! после обновления.
Примеры
Пример 1
В этом примере СОРТ и УНИК используются совместно для возврата уникального списка имен в порядке возрастания.
Пример 2
В этом примере аргумент exactly_once имеет значение ИСТИНА, и функция возвращает только тех клиентов, которые обслуживались один раз. Это может быть полезно, если вы хотите найти людей, которые не получали дополнительное обслуживание, и связаться с ними.
Пример 3
В этом примере используется амперсанд (&) для сцепления фамилии и имени в полное имя. Обратите внимание, что формула ссылается на весь диапазон имен в массивах A2:A12 и B2:B12. Это позволяет Excel вернуть массив всех имен.
Советы:
-
Если указать диапазон имен в формате таблицы Excel, формула автоматически обновляется при добавлении или удалении имен.
-
Чтобы отсортировать список имен, можно добавить функцию СОРТ: =СОРТ(УНИК(B2:B12&” “&A2:A12))
Пример 4
В этом примере сравниваются два столбца и возвращаются только уникальные значения в них.
Дополнительные сведения
Вы всегда можете задать вопрос специалисту Excel Tech Community или попросить помощи в сообществе Answers community.
См. также
Функция ФИЛЬТР
Функция СЛУЧМАССИВ
Функция ПОСЛЕДОВ
Функция СОРТ
Функция СОРТПО
Ошибки #SPILL! в Excel
Динамические массивы и поведение массива с переносом
Оператор неявного пересечения: @
Нужна дополнительная помощь?
Нужны дополнительные параметры?
Изучите преимущества подписки, просмотрите учебные курсы, узнайте, как защитить свое устройство и т. д.
В сообществах можно задавать вопросы и отвечать на них, отправлять отзывы и консультироваться с экспертами разных профилей.
Извлечение уникальных элементов из диапазона
Способ 1. Штатная функция в Excel 2007
Начиная с 2007-й версии функция удаления дубликатов является стандартной – найти ее можно на вкладке Данные – Удаление дубликатов (Data – Remove Duplicates):
В открывшемся окне нужно с помощью флажков задать те столбцы, по которым необходимо обеспечивать уникальность. Т.е. если включить все флажки, то будут удалены только полностью совпадающие строки. Если включить только флажок заказчик, то останется только по одной строке для каждого заказчика и т.д.
Способ 2. Расширенный фильтр
Если у вас Excel 2003 или старше, то для удаления дубликатов и вытаскивания из списка уникальных (неповторяющихся) элементов можно использовать Расширенный фильтр (Advanced Filter) из меню (вкладки) Данные (Data).
Предположим, что у нас имеется вот такой список беспорядочно повторяющихся названий компаний:
Выбираем в меню Данные – Фильтр – Расширенный фильтр (Data – Filter – Advanced Filter). Получаем окно:
В нем:
- Выделяем наш список компаний в Исходный диапазон (List Range).
- Ставим переключатель в положение Скопировать результат в другое место (Copy to another location) и указываем пустую ячейку.
- Включаем (самое главное!) флажок Только уникальные записи(Uniqe records only) и жмем ОК.
Получите список без дубликатов:
Если требуется искать дубликаты не по одному, а по нескольким столбцам, то можно предварительно склеить их в один, сделав, своего рода, составной ключ с помощью функции СЦЕПИТЬ (CONCATENATE):
Тогда дальнейшая задача будет сводиться к поиску дубликатов уже в одном столбце.
Способ 3. Выборка уникальных записей формулой
Чуть более сложный способ, чем первые два, но зато – динамический, т.е. с автоматическим пересчетом, т.е. если список редактируется или в него дописываются еще элементы, то они автоматически проверяются на уникальность и отбираются. В предыдущих способах при изменении исходного списка нужно будет заново запускать Расширенный фильтр или жать на кнопку Удаление дубликатов.
Итак, снова имеем список беспорядочно повторяющихся элементов. Например, такой:
Первая задача – пронумеровать всех уникальных представителей списка, дав каждому свой номер (столбец А на рисунке). Для этого вставляем в ячейку А2 и копируем затем вниз до упора следующую формулу:
=ЕСЛИ(СЧЁТЕСЛИ(B$1:B2;B2)=1;МАКС(A$1:A1)+1;””)
В английской версии это будет:
=IF(COUNTIF(B$1:B2;B2)=1;MAX(A$1:A1)+1;””)
Эта формула проверяет сколько раз текущее наименование уже встречалось в списке (считая с начала), и если это количество =1, т.е. элемент встретился первый раз – дает ему последовательно возрастающий номер.
Для упрощения адресации дадим нашим диапазонам (например, исходя из того, что в списке может быть до 100 элементов) имена. Это можно сделать в новых версиях Excel на вкладке Формулы – Диспетчер имен (Formulas – Name manager) или в старых версиях – через меню Вставка – Имя – Присвоить (Insert – Name – Define):
- диапазону номеров (A1:A100) – имя NameCount
- всему списку с номерами (A1:B100) – имя NameList
Теперь осталось выбрать из списка NameList все элементы имеющие номер – это и будут наши уникальные представители. Сделать это можно в любой пустой ячейке соседних столбцов, введя туда вот такую формулу с известной функцией ВПР (VLOOKUP) и скопировав ее вниз на весь столбец:
=ЕСЛИ(МАКС(NameCount)<СТРОКА(1:1);””;ВПР(СТРОКА(1:1);NameList;2))
или в английской версии Excel:
=IF(MAX(NameCount)
Эта формула проходит сверху вниз по столбцу NameCount и выводит все позиции списка с номерами в отдельную таблицу:
Ссылки по теме
- Выделение дубликатов по одному или нескольким столбцам в списке цветом
- Запрет ввода повторяющихся значений
- Извлечение уникальных значений при помощи надстройки PLEX
Большая часть аналитики данных связана с очисткой данных. Хорошо очищенные данные — это данные, в которых отсутствуют неполные, нерелевантные и избыточные записи. Чтобы удалить избыточность, вам нужно избавиться от дубликатов, чтобы у вас остался набор уникальных записей данных. Это уменьшает беспорядок и сводит к минимуму ошибки.
Хорошей новостью является то, что таблицы Google предоставляют вам несколько простых способов, позволяющих быстро находить уникальные значения в ваших данных.
В этом руководстве я покажу вам два простых метода, которые вы можете использовать для быстрого поиска уникальных значений из данных одного столбца или данных нескольких столбцов.
- С помощью встроенного в Google Таблицы инструмента « Удалить дубликаты ».
- Использование функции UNIQUE .
Предположим, у нас есть следующий набор данных, из которого мы хотим удалить повторяющиеся записи:
Обратите внимание, что в строках 2 и 5, а также в строках 6 и 7 есть повторяющиеся записи.
Мы рассмотрим, как использовать два упомянутых метода для удаления этих повторяющихся записей из набора данных.
В этом руководстве я покажу вам, как найти уникальные значения, когда у вас есть несколько столбцов. Вы можете использовать те же методы, если у вас есть данные в одном столбце.
Поиск уникальных значений с помощью инструмента «Удалить дубликаты»
Google Таблицы предлагает пункт меню, который посвящен именно этой задаче — удалению дубликатов для поиска уникальных значений. Используя этот метод, вы можете удалить дубликаты всего за три клика.
Вот шаги, которые вам необходимо выполнить:
Теперь вы должны обнаружить, что строки 5 и 7 удалены. Это связано с тем, что, когда инструмент «Удалить дубликаты» находит повторяющиеся значения, он сохраняет только первое вхождение значения, удаляя все остальные.
Если вы хотите удалить все строки, содержащие дубликаты имени, вы можете просто снять флажок рядом со столбцом B в диалоговом окне «Удалить дубликаты» (шаг 5).
В этом случае вам придется удалить три повторяющихся строки, поскольку строка, содержащая имя Пола Родригеса, также считается дубликатом.
Тогда ваш результирующий набор данных будет следующим.
Поиск уникальных значений с помощью функции UNIQUE
Инструмент «Удалить дубликаты» работает с исходным набором данных. Поэтому, когда он удаляет дубликаты, он изменяет исходные данные. Если, однако, вы хотите сохранить исходный набор данных, то лучшим вариантом будет использование функции UNIQUE.
Синтаксис функции UNIQUE
Синтаксис функции UNIQUE:
UNIQUE(range)
Здесь диапазон (range) — это диапазон данных, из которых вы хотите извлечь уникальные записи.
Диапазон может включать в себя либо диапазон имен столбцов, либо диапазон ссылок на ячейки. Функция покажет результат, начиная с ячейки, в которую вы ввели формулу.
Использование уникальной функции для поиска уникальных значений в Google Таблицах
Давайте поработаем с тем же набором данных, чтобы понять, как применяется функция UNIQUE.
Чтобы вы могли легко увидеть различия между исходными и результирующими данными, мы собираемся отобразить результат на том же листе (в соседнем диапазоне ячеек). Однако вы даже можете ввести УНИКАЛЬНУЮ формулу на новом листе и отобразить там уникальные записи.
Вот шаги, которые вам необходимо выполнить, если вы хотите использовать функцию UNIQUE для удаления дубликатов из указанного выше набора данных:
-
В ячейке D1 введите следующую формулу: =UNIQUE(A:B) or =UNIQUE(A1:B10).
- Нажмите клавишу возврата.
Теперь вы должны увидеть, что набор уникальных записей занимает диапазон от ячейки D1 до E8.
Обратите внимание, что функция UNIQUE позволяет динамически удалять дубликаты, поэтому любые изменения, которые вы вносите в исходный набор данных, автоматически обновляются для вывода функции.
Также обратите внимание, что вы не можете вносить какие-либо изменения в вывод. Попытка сделать это приведет к ошибке #REF.
Фактически, основное различие между двумя методами, описанными в этом руководстве, заключается в том, что инструмент «Удалить дубликаты» работает и изменяет исходный диапазон данных.
Функция UNIQUE, с другой стороны, отображает уникальные данные в новом диапазоне данных, тем самым сохраняя исходные данные неизменными.
Если вы хотите сохранить результаты функции UNIQUE (чтобы вы могли выполнять с ней последующие операции), вам необходимо преобразовать результат формулы в статические значения.
Для этого вам нужно выделить ячейки, содержащие результат, и скопировать их. Затем используйте сочетание клавиш CTRL + SHIFT + V (на ПК) или CMD + SHIFT + V (на Mac), чтобы вставить значения скопированных ячеек.
В этом руководстве мы показали вам два способа найти уникальные значения в Google Таблицах, удалив дубликаты. Первый метод использует встроенную функцию «Удаление дубликатов» в Google Таблицах. Вы можете использовать этот метод для удаления дубликатов и замены исходных данных только уникальными записями.
Второй метод использует УНИКАЛЬНЫЙ метод. Этот метод идеален, если вы не хотите вносить какие-либо изменения в исходные данные. Оба метода отлично работают и быстро справляются со своей задачей.
Мы надеемся, что это руководство было для вас полезным.