DataparkSearch 4.26 Руководство

Поисковая машина


Содержание
1. Введение
Возможности DataparkSearch
Где взять DataparkSearch
Disclaimer
Авторы
Помощники
2. Установка
Требования к SQL базе даных
Поддерживаемые операционные системы
Инструментарий, необходимый для установки
Инсталяция DataparkSearch
Возможные проблемы установки
Регистрация установки
3. Индексирование
Общая информация об индексировании
Конфигурирование
Запуск indexer
Создание SQL-таблиц
Удаление SQL-таблиц
Управление подсекциями
Как очистить базу данных
Статистика базы данных
Проверка ссылок
Параллельное индекирование
Реакция на коды HTTP-ответа
Поддержка Content-Encoding
Конфигурирование indexer
Указание веб-пространства для индексирования
Алиасы
ServerTable
FlushServerTable
Внешние парсеры
Остальные команды, используемые в indexer.conf
Расширенные возможности индексирования
Индексирование таблиц SQL баз данных (виртуальная URL схема htdb:)
Индексирование вывода программ (виртуальные схемы URL exec: и cgi:)
Зеркалирование
Использование syslog
Хранение сжатых копий документов
Конфигурирование stored
Как работает stored
Использование stored при поиске
4. HTML-парсер в DataparkSearch
Tag-парсер
Специальные символы
META-тэги
Ссылки
Комментарии
5. Хранение данных
SQL режимы хранения
Общая инфоромация о хранении
Разнообразные способы хранения слов
Способ хранения single
Способ хранения multi
Способ хранения crc
Способ хранения crc-multi
Способ хранения cache
Замечание о стуктуре таблиц для SQL серверов
Дополнительные возможности не-CRC режимов хранения
Способ хранения Cache
Введение
Структура индексов слов при способе хранения Cache
Утилиты для способа хранения Cache
Запуск способа хранения cache
Использование нескольких splitter одновременно
Использование скрипта run-splitter
Поиск
Использование лимитов при поиске
К вопросу производительности DataparkSearch
Рекомендация использовать searchd
Рекомендация использовать файловую систему в памяти (mfs)
Производительность MySQL
Оптимизация после индексирования
Поддержка SearchD
Для чего использовать searchd
Запуск searchd
Oracle notes
Introduction
Compilation, Installation and Configuration
6. Подсекции
Тэги
Тэги в SQL версии
Категории
7. Поддержка языков
Кодировки
Поддерживаемые кодировки
Разные названия кодировок
Перекодировка во время индексации
Выбор LocalCharset
Определение кодировки документа
Автоматическое распознавание кодировки
Кодировка документов по-умолчанию
Язык документов по-умолчанию
Перекодировка во время поиска
Создание многоязычных страниц поиска
Как это работает ?
Возможные сложности
Сегментеры фраз японского, тайского, корейского и китайского языков
Сегментер фраз японского языка
Сегментер фраз китайского языка
Сегментер фраз тайского языка
Сегментер фраз корейского языка
Поддержка мультиязычных веб серверов
8. Поиск документов
Использование поисковых фронт-эндов
Осуществление поиска
Параметры поиска
Изменение весов различных частей документов во время поиска
Использование фронт-энда на страницах с SSI
Использование нескольких шаблонов
Булев поиск
Как используются при поиске устаревшие документы
Модуль mod_dpsearch для Apache httpd
Как создавать шаблоны результатов поиска
Секции шаблона
Секция Variables
Включения в шаблонах
Условные операторы в шаблонах
О безопасности
Дизайн search.html
Как создаётся страница результатов
Ваш HTML-шаблон
О формах
Относительные ссылки в search.htm
Добавление формы поиска на другие страницы
Релевантность
Упорядочивание документов
Расчёт релевантности
Рейтинг популярности
Булевы запросы
Crosswords
Регистрация поисковых запросов
Кэш результатов поиска
Нечёткий поиск
Ispell
Синонимы
Поиск без учёта акцентов над буквами
9. Разное
Сообщение о багах
Посметрные дампы
Использование библиотеки libdpsearch
Скрипт dps-config
DataparkSearch API
Структура таблиц базы данных
Предметный указатель
Список таблиц
3-1. уровни подробности сообщений indexer'а
5-1. Типы лимитов способа хранения Cache
7-1. Кодировки и их языковые группы
7-2. Синонимы наименований кодировок
8-1. Параметры поиска
9-1. Структура таблицы server
9-2. Значения некоторых параметров серверов в таблице srvinfo