Каталог решений - Векторизация текста и нечеткий поиск лучшего совпадения со строкой

Векторизация текста и нечеткий поиск лучшего совпадения со строкой

Векторизация текста и нечеткий поиск лучшего совпадения со строкой

В наличии

Векторизация идеальна, если нужно осуществить нечеткий поиск по 100-200 строкам и найти 1+ лучшее вхождение (которое гарантированно там есть).

Категория:

Описание

Векторизация текста на языке 1С. Простейший пример. Используется в реальной работе в обработке Контур.Диадок при подборе Склада по произвольному человекочитаемому комментарию, содержащему Адрес склада (и другую инфомрацию)

Подходит для использования, если нужно осуществить нечеткий поиск по 100-200 строкам и найти 1 лучшее вхождение (которое гарантированно там есть). Также

  • инвариантно к РеГиСтРу, наличию      повторению илиотсутствиюв    тексте   пробелов и знаков препинания и т.д.
  • инвариантно к положению мест словами (слов местами)
  • множество значений функции КосинусноеПроизведение: [0; 1] — можно спрогнозировать порог адекватности похожести строк
  • приемлемая скорость поиска ~100 строк/сек
  • легко внедрять: 3 функции/50 строчек кода, работающие в любой конфигурации.
has been added to your cart:
Оформление заказа