Tesuçk

Tesuçk — это Web-сервис автоматического выделения ключевых слов и словосочетаний из текста на естественном языке.

Изначально сервис затевался как моя выпускная работа бакалавра ФТИ УрФУ. Сейчас от выпускной работы ничего не осталось: полностью переписан код и переработаны алгоритмы.

Цель проекта: предоставить доступный инструмент для извлечения ключевых словосочетаний из текстовых документов.

Зачем это нужно? Без ключевых слов не обойтись в задачах эффективной обработки документов — индексировании, реферировании, классификации.

Сервер запущен в облачной среде ИММ УрО РАН.

Когда будет версия 1.0? Есть ряд требований:

Котята

Внимание! Анализатор доступен только для некоммерческого использования, так как при обработке текста используются программные продукты, запрещающие коммерческое применение.

История версий

0.5.2

Документация перенесена на NLPub.

0.5.1

Введено ограничение по подсетям источников запросов.

0.5.0

Значительно повышена производительность.

0.4.5

Повышено качество автоматического реферирования.

0.4.4

Возможность указать количество предложений в автореферате.

0.4.3

Повышено качество анализа текстов. Обновлён интерфейс пользователя.

0.4.2

Поддержка работы с внешними URL.

0.4.1

Изменения в API, добавлен экспорт в CSV.

0.4.0

Выполняется автоматическое реферирование.

0.3.2

Выведена возможность ассессмента.

0.3.1

Введена возможность ассессмента.

0.3.0

Добавлена поддержка английского языка.

0.2.4

Исправлена неполная выдача списка вершин при генерации GraphML.

0.2.3

Добавлен параметр window в API.

0.2.2

Опубликован API.

0.2.1

Добавлена базовая реализация DegExt.

0.2

Вместо C-value используется TextRank. Полностью переписан код.

0.1

Первый публичный релиз. Выделение терминов производится при помощи метода C-value.