CalcToolsLab

Подсчёт элементов списка онлайн

Посчитайте строки, слова, уникальные значения, дубликаты и частоту повторов. Есть числовая статистика, фильтры, CSV/TXT/JSON и локальная обработка.

Если есть переносы строк, каждый перенос считается границей элемента. Запятые внутри строки не разделяют список, пока выбран автоматический разделитель.

Подсчёт элементов списка онлайн

Инструмент считает элементы списка онлайн: строки, слова, уникальные значения, дубликаты и частоту повторов. Вставьте список из строк, колонку из таблицы или текст, выберите режим подсчёта и получите сводку, частотную таблицу и экспорт CSV.

  1. Вставьте список строк, колонку из таблицы или текст.
  2. Выберите режим: по строкам/элементам или по словам.
  3. Проверьте общее количество, уникальные значения и дубликаты.
  4. Отфильтруйте частотную таблицу или скачайте результат.

Как работает разбиение списка

РежимЧто считаетПример использования
По строкам/элементамСтроки или значения через выбранный разделительEmail-база, ID, товары, теги
По словамСлова по пробеламТексты, статьи, ключевые слова
Числовая статистикаЧистые числовые элементыКолонки с суммами, весами, оценками

В режиме строк список делится по переносам строк. Если переносов нет, используются точки с запятой, табы или запятые. В режиме слов текст делится по пробелам, а пунктуация по краям слова может быть удалена.

Важная деталь
Когда в автоматическом режиме есть переносы строк, запятые внутри строки не становятся границей элемента. Для CSV можно выбрать разделитель явно, но инструмент не является полноценным CSV-парсером: кавычки, экранирование и запятые внутри поля не разбираются как таблица.

Примеры входных данных

СценарийКак вставитьЧто смотреть
Список строкОдно значение на строкуВсего, уникальные, дубликаты
Список через запятуюЗначения в одной строке через запятыеРазделитель и частотную таблицу
Текст для словАбзац или набор фразЧастоту слов и топ повторов
Числовая колонкаОдно чистое число на строкуСумму, среднее, медиану, минимум и максимум

Мини-словарь метрик

  • Уникальных — сколько разных значений осталось после выбранной нормализации.
  • С дублями — сколько уникальных значений встречаются больше одного раза.
  • Дубликатов-вхождений — сколько повторных строк или слов можно убрать без потери уникальных значений.
  • % от общего — доля элемента в текущем наборе после фильтрации и настроек подсчёта.

Обозначения для подсчёта

N - общее число элементов после выбранного разбиения; f_i - сколько раз встретился конкретный элемент.

p_i - доля элемента в процентах от общего количества; f_i - число повторов элемента; N - текущий общий набор после настроек подсчёта.

x_bar - среднее по распознанным числам; m - количество элементов, строго распознанных как числа; x_j - числовые элементы без букв и единиц измерения.

sigma - стандартное отклонение числовых элементов; m - количество распознанных чисел; x_j - отдельное число; x_bar - среднее значение.

Числовая статистика

Если большинство элементов являются числами, появляется числовая статистика: сумма, среднее, медиана, минимум, максимум и стандартное отклонение. Для точности числа должны быть записаны без лишних букв, валют, процентов и единиц измерения.

МетрикаЧто показываетКогда полезна
СуммаОбщий итог по числамБюджет, общий вес, количество
СреднееАрифметическое среднееТипичное значение при ровных данных
МедианаСерединное значение по сортировкеТипичное значение, устойчивое к выбросам
Минимум / МаксимумКрайние значенияПоиск выбросов, диапазон
РазмахРазница между максимумом и минимумомШирина разброса
Стандартное отклонениеМера разброса вокруг среднегоОценка неоднородности данных
Строгое распознавание
Значения с буквами или единицами измерения не считаются числами. Например, строка с весом и подписью единицы останется текстовым элементом.

Частотная таблица и фильтры

  • Сортировка по любой колонке (элемент / кол-во / %) кликом по заголовку
  • Поиск по подстроке в элементе
  • Минимальная частота — оставить только элементы с нужным числом повторов
  • Показать первых — ограничить вывод для больших списков

Гистограмма топ-10 по частоте показывается всегда — кликните по бару, чтобы быстро отфильтровать таблицу по этому элементу.

Закон Ципфа

В естественных текстах частые слова обычно заметно опережают редкие, а частоты постепенно убывают по мере роста ранга. Гистограмма топ-10 помогает быстро увидеть форму распределения.

Для тегов, имён, доменов и рабочих списков необычная форма распределения может указывать на дубли, технические хвосты или перекос источника данных, но не является самостоятельным доказательством ошибки.

Экспорт

  • Копировать сводку — текстовый блок со всеми числами для вставки в отчёт
  • Частоты CSV — `element, count, percent` для анализа в Excel или Google Sheets
  • Уникальные TXT — список уникальных значений по строке
  • JSON — сводка, частоты и числовая статистика для разработчиков

Приватность

Обработка выполняется в браузере: текст списка не отправляется на сервер. Это удобно для email-баз, ID, внутренних выгрузок и рабочих списков.

Экспорт CSV, TXT и JSON создаётся локально на вашем устройстве.

Часто задаваемые вопросы

Обновлено:

Похожие инструменты