Подсчёт элементов списка онлайн
Посчитайте строки, слова, уникальные значения, дубликаты и частоту повторов. Есть числовая статистика, фильтры, CSV/TXT/JSON и локальная обработка.
Подсчёт элементов списка онлайн
Инструмент считает элементы списка онлайн: строки, слова, уникальные значения, дубликаты и частоту повторов. Вставьте список из строк, колонку из таблицы или текст, выберите режим подсчёта и получите сводку, частотную таблицу и экспорт CSV.
- Вставьте список строк, колонку из таблицы или текст.
- Выберите режим: по строкам/элементам или по словам.
- Проверьте общее количество, уникальные значения и дубликаты.
- Отфильтруйте частотную таблицу или скачайте результат.
Как работает разбиение списка
| Режим | Что считает | Пример использования |
|---|---|---|
| По строкам/элементам | Строки или значения через выбранный разделитель | Email-база, ID, товары, теги |
| По словам | Слова по пробелам | Тексты, статьи, ключевые слова |
| Числовая статистика | Чистые числовые элементы | Колонки с суммами, весами, оценками |
В режиме строк список делится по переносам строк. Если переносов нет, используются точки с запятой, табы или запятые. В режиме слов текст делится по пробелам, а пунктуация по краям слова может быть удалена.
Примеры входных данных
| Сценарий | Как вставить | Что смотреть |
|---|---|---|
| Список строк | Одно значение на строку | Всего, уникальные, дубликаты |
| Список через запятую | Значения в одной строке через запятые | Разделитель и частотную таблицу |
| Текст для слов | Абзац или набор фраз | Частоту слов и топ повторов |
| Числовая колонка | Одно чистое число на строку | Сумму, среднее, медиану, минимум и максимум |
Мини-словарь метрик
- Уникальных — сколько разных значений осталось после выбранной нормализации.
- С дублями — сколько уникальных значений встречаются больше одного раза.
- Дубликатов-вхождений — сколько повторных строк или слов можно убрать без потери уникальных значений.
- % от общего — доля элемента в текущем наборе после фильтрации и настроек подсчёта.
Обозначения для подсчёта
N - общее число элементов после выбранного разбиения; f_i - сколько раз встретился конкретный элемент.
p_i - доля элемента в процентах от общего количества; f_i - число повторов элемента; N - текущий общий набор после настроек подсчёта.
x_bar - среднее по распознанным числам; m - количество элементов, строго распознанных как числа; x_j - числовые элементы без букв и единиц измерения.
sigma - стандартное отклонение числовых элементов; m - количество распознанных чисел; x_j - отдельное число; x_bar - среднее значение.
Числовая статистика
Если большинство элементов являются числами, появляется числовая статистика: сумма, среднее, медиана, минимум, максимум и стандартное отклонение. Для точности числа должны быть записаны без лишних букв, валют, процентов и единиц измерения.
| Метрика | Что показывает | Когда полезна |
|---|---|---|
| Сумма | Общий итог по числам | Бюджет, общий вес, количество |
| Среднее | Арифметическое среднее | Типичное значение при ровных данных |
| Медиана | Серединное значение по сортировке | Типичное значение, устойчивое к выбросам |
| Минимум / Максимум | Крайние значения | Поиск выбросов, диапазон |
| Размах | Разница между максимумом и минимумом | Ширина разброса |
| Стандартное отклонение | Мера разброса вокруг среднего | Оценка неоднородности данных |
Частотная таблица и фильтры
- Сортировка по любой колонке (элемент / кол-во / %) кликом по заголовку
- Поиск по подстроке в элементе
- Минимальная частота — оставить только элементы с нужным числом повторов
- Показать первых — ограничить вывод для больших списков
Гистограмма топ-10 по частоте показывается всегда — кликните по бару, чтобы быстро отфильтровать таблицу по этому элементу.
Закон Ципфа
В естественных текстах частые слова обычно заметно опережают редкие, а частоты постепенно убывают по мере роста ранга. Гистограмма топ-10 помогает быстро увидеть форму распределения.
Экспорт
- Копировать сводку — текстовый блок со всеми числами для вставки в отчёт
- Частоты CSV — `element, count, percent` для анализа в Excel или Google Sheets
- Уникальные TXT — список уникальных значений по строке
- JSON — сводка, частоты и числовая статистика для разработчиков
Приватность
Обработка выполняется в браузере: текст списка не отправляется на сервер. Это удобно для email-баз, ID, внутренних выгрузок и рабочих списков.
Часто задаваемые вопросы
Похожие инструменты
Удалите повторяющиеся строки из списка или, наоборот, найдите только дубли. Сохранение первого/последнего вхождения, без учёта регистра, копирование и TXT.
Отсортируйте список по алфавиту, natural sort, числам, длине, полю строки, случайно или в обратном порядке. Локаль, дубликаты, TXT-экспорт.
Сравните два списка: совпадения, отличия, только в первом, только во втором, режимы set/multiset, диаграмма Венна и экспорт CSV/JSON.
Перемешайте строки списка в случайном порядке: seed для повторяемости, разнесение дублей, режим без старых мест, TXT/CSV и таблица «было → стало».