Нечеткий поиск: умный поиск с учетом синонимов и обработкой ошибок пользователей
Решение расширяет базовый функционал стандартного модуля «Поиск» от Битрикс, позволяя эффективно обрабатывать синонимичные значения, опечатки и ошибки в поисковым запросе. Высокая эффективность модуля обеспечивается комбинированной работой различных алгоритмов поиска по сходству (fuzzy string search) и компьютерной лингвистики.
Модуль включает в себя следующие функциональные блоки
|
|
|
| ||||||
|
|
| ||||||
|
|
Установка и настройка модуля
| Требования к ПО
В требованиях указана протестированная конфигурация. Если хостинг не удовлетворяет указанным требованиям, то напишите в нашу техническую поддержку, мы проверим совместимость модуля конкретно с Вашим ПО. |
Расширение поисковой выборки
Исходный поисковый индекс Bitrix искусственно расширяется: строится множество «ошибочных» слов, а также слов-синонимов (опционально). Таким образом, если пользователь введет поисковый запрос с ошибкой, который ранее попал в расширенный индекс, ему будет автоматически возвращена релевантная выдача. Данный режим не требует изменений стандартных компонентов.
Ниже рассмотрен пример работы модуля с индексируемым словом «платье».
Поиск по сходству
При ошибочном поисковом запросе проиндексированные данные последовательно сравниваются с запрашиваемой строкой, ищутся максимально похожие на основании расстояния Левенштейна. Доступно сравнение на основании стемминга (морфологический основ) и metaphone (фонетического звучания). Для работы в режиме поиска по сходству, модуль использует как стандартный индекс Bitrix, так и собственные таблицы индексации. Данный режим требует замены стандартных компонентов bitrix:catalog.search, bitrix:search.title и bitrix:search.page на одноименные компоненты модуля. |
Обработка поисковых запросов пользователей
При включенной опции «Собирать статистику по поисковым фразам» модуля «Поиск» будет производиться автоматический сбор информации по поисковым запросам пользователей. Ознакомиться с собранной статистикой можно на вкладке Настройки > Поиск > Статистика > Список фраз. Модуль «Нечеткий поиск» расширяет данный функционал, выбирая из статистики те запросы, для которых не нашлось ни одного совпадения. Фразы запросов разбиваются на отдельные слова, для слов находятся морфологические основы. При индексации данных на сайте выделенные морфологические основы будут сравниваться с основами индексируемых слов, близкие основы будут добавлены в индекс.
Пример работы Пользователь ввел поисковый запрос с опечаткой «фцтболка». Для данного запроса на сайте не было найдено совпадений, запрос попал специальную таблицу модуля «Нечеткий поиск». На сайте есть проиндексированное слово «футболка». Поскольку основа слова «футболка» близка к основе слова «фцтболка», происходит расширение поискового индекса. Теперь при запросе «фцтболка» пользователю будет возвращены данные, соответствующие поисковому индексу для «футболка». | Особенности
|
Словарь синонимов
Модуль «Нечеткий поиск» предоставляет удобный функционал для поиска по синонимам. Синонимы добавляются к поисковому индексу в случае, если морфологическая основа какого-либо слова из индекса совпадает с основой слова из таблицы синонимов.
Вместе с модулем поставляется обширный словарь синонимов, который пользователь может добавлять самостоятельно. Список синонимов смотрите в разделе Настройки > Нечеткий поиск > Словарь синонимов.
Пример работы Допустим, что в поисковый индекс попало слово «футболки», при этом в словаре активна запись для слова «футболка» с синонимами «рубашка, майка». Морфологические основы слов «футболки» и «футболка» совпали, поэтому слова «рубашка» и «майка» расширят поисковую выдачу для «футболки». | Особенности
|
Часто задаваемые вопросы
Да, обрабатывает. Данный функционал есть в стандартных компонентах bitrix (параметр «Включить автоопределение раскладки клавиатуры»), и он сохранен в компонентах модуля. Это позволяет, например, обработать ситуацию, когда пользователь ввел в строку поиска «gkfnmt» вместо «платье». Кроме того, в настройках модуля доступен режим сравнения по фонетическому сходству, что позволяет корректно обработать созвучные запросы разных языков, например «platie» вместо «платье». |
1С-Битрикс: Управление сайтом
«1С-Битрикс: Управление сайтом» - профессиональная система управления интернет-ресурсами, CMS №1 в России. С помощью простой современной системы вы можете создавать и поддерживать любые проекты:
◄ интернет-магазинов
◄ корпоративных сайтов
◄ информационных порталов
◄ страниц сообществ
◄рекламных лендингов
Сайты на платформе 1С-Битрикс - это удобство, надежность и высокая посещаемость. Развивайте свой бизнес с нашими инструментами!
CMS №1 в России*
Создание и развитие корпоративных сайтов, интернет-магазинов, информационных порталов и других веб-проектов.
*В рейтинге систем управления сайтом в Рунете по данным iTrack
Конструктор сайтов
Простой конструктор для быстрого создания сайтов и лендингов - для акций, рекламы, продвижения товаров и услуг. 35 шаблонов для разных сфер бизнеса и более 200 блоков. Сайты готовы к просмотру на мобильных устройствах.
Интернет-магазин
Инструменты для продаж в интернете:
Продуманная корзина, сравнение товаров, платежи и доставка, Удобное управление магазином: SKU, склады, учет остатков, интеграция с 1С.
Маркетинг и коммуникации
Все для повышения конверсии:
Сегментация клиентской базы, email и sms рассылки, триггерные рассылки, целевая реклама в интернете, настройка программ лояльности с широким выбором видов скидок.
Высокая производительность
Загрузка сайта происходит в сто раз быстрее.
Магазины работают в разы быстрее даже при высоких нагрузках - скорость оформления заказа выше в 32 раза, скорость работы корзины выше в 2,5 раза.
Продуманная корзина, сравнение товаров, платежи и доставка, Удобное управление магазином: SKU, склады, учет остатков, интеграция с 1С.
Безопасность
Надежная защита от взлома и кражи информации с сайта. Целый ряд технических решений по защите всей системы и веб-приложений. Это многоуровневая безопасность ваших интернет-проектов от большинства известных угроз.
Мобильность
Технология, позволяющая быстро разрабатывать мобильные приложения под iOS и Android для сайтов, созданных на платформе «1С-Битрикс».
Приложения публикуются в AppStore и Google Play.