CalcToolsLab

Сравнение двух списков онлайн

Сравните два списка: совпадения, отличия, только в первом, только во втором, режимы set/multiset, диаграмма Венна и экспорт CSV/JSON.

0 / 0 уник.
0 / 0 уник.

Сравнение двух списков онлайн

Инструмент сравнивает два списка и делит элементы на три группы: только в A, общие и только в B. Это утилита для сверки строк, email, ID, артикулов, URL, ключевых слов и версий наборов данных, а не генератор случайных значений.

  1. Вставьте два списка в поля A и B: по одному элементу в строке, через запятую, точку с запятой или таб
  2. Настройте обрезку пробелов, пустые строки, регистр и порядок вывода
  3. Выберите режим подсчёта: множества без дублей или мультимножества с кратностью повторов
  4. Проверьте совпадения, отличия, диаграмму Венна, коэффициент Жаккара и сводную таблицу
  5. Скопируйте нужную секцию или скачайте TXT, CSV либо JSON

Операции над списками

ТерминЧто значит для списковКак называется в режиме версий
Пересечениеэлементы, которые есть в обоих спискахбез изменений
Разность первого спискаэлементы только в Aудалено
Разность второго спискаэлементы только в Bдобавлено
Объединениеобщее количество элементов после сравненияполный набор
Симметрическая разностьвсе отличия: элементы только в одном из списковвсе изменения

J - коэффициент Жаккара, A - первый список после выбранной нормализации, B - второй список после выбранной нормализации.

Коэффициент Жаккара
Показатель похожести двух списков: 100% означает полное совпадение, 0% - отсутствие общих элементов. Он помогает быстро оценить пересечение аудиторий, тегов или наборов ключевых слов.

Множества vs мультимножества

РежимКак считает дублиКогда использовать
Множестваповтор внутри списка считается один разemail, ID, URL, ключевые слова, теги
Мультимножестваучитывает количество повторовтовары, билеты, штрихкоды, повторяющиеся задачи

Множества подходят, когда важно наличие элемента. Если один email встречается три раза, он считается один раз.

Мультимножества подходят, когда важна кратность. Если товар есть в первом списке три раза, а во втором один раз, инструмент покажет один общий повтор и два остатка только в первом списке.

Сравнение версий: добавлено / удалено / без изменений

Если переключить терминологию вывода на «Сравнение версий», список A считается старой версией, а список B - новой:

  • Удалено - элементы, которых больше нет в новой версии
  • Без изменений - совпадения в обоих списках
  • Добавлено - новые элементы во втором списке

Так удобно сверять старый и новый прайс, списки клиентов, сотрудников, файлов, SKU или URL после обновления.

Разделители и нормализация

  • Переносы строк - основной формат: один элемент на строку
  • Запятая, точка с запятой и таб - используются как разделители, если во вводе нет переносов строк
  • Пробелы - запасной вариант для коротких однословных элементов
  • Обрезать пробелы - убирает пробелы по краям перед сравнением
  • Игнорировать пустые - исключает пустые элементы из результата
  • Без учёта регистра - сравнивает варианты вроде `Email@x.ru` и `email@x.ru` как один ключ
  • Сохранять порядок ввода - выводит результаты в порядке первого появления, а не по алфавиту
Не CSV-парсер
Инструмент не является полноценным CSV-парсером: кавычки, экранирование, запятые внутри ячеек и многострочные поля не разбираются как таблица.

Экспорт результата

  • Копирование секции - только нужная группа строк
  • TXT по секциям - отдельный файл для элементов только в A, общих элементов, элементов только в B или всех отличий
  • JSON - массивы результата, статистика, режим подсчёта и коэффициент Жаккара
  • Сводная таблица CSV - колонки `element, in_A, in_B, category` для дальнейшего анализа

Приватность и ограничения

Сравнение выполняется в браузере пользователя: данные не отправляются на сервер этим инструментом для расчёта результата. Для чувствительных списков всё равно учитывайте правила организации, буфер обмена и скачанные файлы.

ОжиданиеПоддержкаКомментарий
Два текстовых спискадаосновной сценарий страницы
Столбцы из Excelчастичноможно вставить как текст, но инструмент не сравнивает Excel-файлы напрямую
Сложный CSVнетне разбираются кавычки, экранирование и многострочные ячейки
Построчный Git diffнетне показывает построчный diff как Git: порядок строк не считается смыслом изменения
Нечеткое сравнениенетне выполняет нечеткое сравнение похожих строк
Доменные нормализаторынетemail, телефоны и URL сравниваются как строки после выбранной нормализации

Часто задаваемые вопросы

Обновлено:

Похожие инструменты