DataparkSearch 4.26 Руководство
Поисковая машина
Copyright © 2003-2004 Datapark corp.
Copyright © 2001-2003 Lavtech.com corp.
Содержание
1.
Введение
Возможности
DataparkSearch
Где взять
DataparkSearch
Disclaimer
Авторы
Помощники
2.
Установка
Требования к SQL базе даных
Поддерживаемые операционные системы
Инструментарий, необходимый для установки
Инсталяция
DataparkSearch
Возможные проблемы установки
Регистрация установки
3.
Индексирование
Общая информация об индексировании
Конфигурирование
Запуск
indexer
Создание SQL-таблиц
Удаление SQL-таблиц
Управление подсекциями
Как очистить базу данных
Статистика базы данных
Проверка ссылок
Параллельное индекирование
Реакция на коды HTTP-ответа
Поддержка Content-Encoding
Конфигурирование indexer
Указание веб-пространства для индексирования
Алиасы
ServerTable
FlushServerTable
Внешние парсеры
Остальные команды, используемые в
indexer.conf
Расширенные возможности индексирования
Индексирование таблиц SQL баз данных (виртуальная URL схема
htdb:
)
Индексирование вывода программ (виртуальные схемы URL
exec:
и
cgi:
)
Зеркалирование
Использование syslog
Хранение сжатых копий документов
Конфигурирование stored
Как работает stored
Использование stored при поиске
4.
HTML-парсер в
DataparkSearch
Tag-парсер
Специальные символы
META-тэги
Ссылки
Комментарии
5.
Хранение данных
SQL режимы хранения
Общая инфоромация о хранении
Разнообразные способы хранения слов
Способ хранения single
Способ хранения multi
Способ хранения crc
Способ хранения crc-multi
Способ хранения cache
Замечание о стуктуре таблиц для SQL серверов
Дополнительные возможности не-CRC режимов хранения
Способ хранения Cache
Введение
Структура индексов слов при способе хранения
Cache
Утилиты для способа хранения
Cache
Запуск способа хранения
cache
Использование нескольких
splitter
одновременно
Использование скрипта
run-splitter
Поиск
Использование лимитов при поиске
К вопросу производительности
DataparkSearch
Рекомендация использовать
searchd
Рекомендация использовать файловую систему в памяти (mfs)
Производительность
MySQL
Оптимизация после индексирования
Поддержка SearchD
Для чего использовать
searchd
Запуск
searchd
Oracle notes
Introduction
Compilation, Installation and Configuration
6.
Подсекции
Тэги
Тэги в SQL версии
Категории
7.
Поддержка языков
Кодировки
Поддерживаемые кодировки
Разные названия кодировок
Перекодировка во время индексации
Выбор LocalCharset
Определение кодировки документа
Автоматическое распознавание кодировки
Кодировка документов по-умолчанию
Язык документов по-умолчанию
Перекодировка во время поиска
Создание многоязычных страниц поиска
Как это работает ?
Возможные сложности
Сегментеры фраз японского, тайского, корейского и китайского языков
Сегментер фраз японского языка
Сегментер фраз китайского языка
Сегментер фраз тайского языка
Сегментер фраз корейского языка
Поддержка мультиязычных веб серверов
8.
Поиск документов
Использование поисковых фронт-эндов
Осуществление поиска
Параметры поиска
Изменение весов различных частей документов во время поиска
Использование фронт-энда на страницах с SSI
Использование нескольких шаблонов
Булев поиск
Как используются при поиске устаревшие документы
Модуль
mod_dpsearch
для Apache httpd
Как создавать шаблоны результатов поиска
Секции шаблона
Секция Variables
Включения в шаблонах
Условные операторы в шаблонах
О безопасности
Дизайн search.html
Как создаётся страница результатов
Ваш HTML-шаблон
О формах
Относительные ссылки в search.htm
Добавление формы поиска на другие страницы
Релевантность
Упорядочивание документов
Расчёт релевантности
Рейтинг популярности
Булевы запросы
Crosswords
Регистрация поисковых запросов
Кэш результатов поиска
Нечёткий поиск
Ispell
Синонимы
Поиск без учёта акцентов над буквами
9.
Разное
Сообщение о багах
Посметрные дампы
Использование библиотеки
libdpsearch
Скрипт
dps-config
DataparkSearch
API
Структура таблиц базы данных
Предметный указатель
Список таблиц
3-1.
уровни подробности сообщений indexer'а
5-1.
Типы лимитов способа хранения Cache
7-1.
Кодировки и их языковые группы
7-2.
Синонимы наименований кодировок
8-1.
Параметры поиска
9-1.
Структура таблицы
server
9-2.
Значения некоторых параметров серверов в таблице
srvinfo
След.
Введение