Внимание! Вышло обновление Penguin до версии 19.8. Внесены следующие изменения:
- Добавлено автоматическое определение наличия заголовков в CSV и XLS, XSLX - файлах.
- Добавлена возможность сбора списка стоп-слов при фильтрации исходного списка при помощи анализа кластеров.
- Исправлены все найденные при тестах ошибки и недочеты в работе функционала, добавленного в предыдущих версиях.
- Добавлена возможность задавать словосочетания, которые нужно учитывать, как единую фразу при кластеризации.
- Добавлена возможность использовать условия, как приоритетные фазы, при построении кластеров.
- Добавлена возможность объединять синонимические фразы в один кластер.
- Добавлена возможность кодирования и декодирования Unicode-символов, согласно таблице символов Unicode.
- Максимально оптимизирован алгоритм распределения фраз по кластерам.