Я проинсталлировал скрипт, но он не работает!!!
Как показывает практика, в подавляющем большинстве случаев
скрипты не работают по двум причинам:
1) в первой строке скрипта укажите путь к перлу
на Вашей системе (под Windows обычно можно просто написать "#!perl");
2) на Unix-системах текстовые файлы имеют формат отличный от Windows.
Поэтому при пересылке скрипта на сервер необходимо использовать текстовый режим.
И еще раз проверьте правильность всех путей в файле "config.pl"
Как правильно указать путь к директории с файлами для индексации?
Путь к файлам в параметре $base_dir указывается аналогично
относительным ссылкам в HTML файлах. Например, Ваш сайт имеет такую структуру:
/home/user1/public_html/index.html
/home/user1/public_html/cgi-bin/index.pl
В таком случае $base_dir будет выглядеть следующим образом:
'..'
(или '../'
, как Вам больше нравится).
В случае, если скрипты расположены в отдельном подкаталоге,
/home/user1/public_html/index.html
/home/user1/public_html/cgi-bin/search/index.pl
необходимо подняться на два уровня вверх: '../../'
.
Многие серверы имеют другую структуру дирукторий:
/home/user1/WWW/index.html
/home/user1/cgi/search/index.pl
В данном случае правильный путь будет таким: '../../WWW/'
.
Все вышеприведенные случаи верны только в том случае, когда текущей
рабочей директорией является та директория, где расположен скрипт.
В большинстве случаев это действительно так, но сервер может быть
настроен таким образом, что при запуске скрипта через броузер
рабочей директорией будет корневая директория вебсервера. В таком
случае Вам придется соответственно изменить все пути (параметр
$base_dir, пути к файлам базы данных db/0_hash и т.д. в config.pl, и путь
к файлу config.pl в index.pl и search.pl.
Если у Вас все же остались проблемы с указанием правильного пути,
попробуйте использовать абсолютный путь. Только учтите, что надо использовать
абсолютный путь начиная с корня файловой системы, а не вебсервера.
То есть, /home/user1/WWW/
, /home/user1/cgi/search/db/0_hash
и т.д.
Могу ли я индексировать удаленные сервера с помощью RiSearch?
Да, воспользуйтесь скриптом "spider.pl". Правда, скрипт этот довольно примитивен
и предназначен для индексации одного двух сайтов.
Поддерживает RiSearch поиск фраз?
Нет, после индексации RiSearch не сохраняет в своей базе данных
текст файла, а следовательно вся информация о связях между словами теряется.
Существует ли ограничения на число или размер индексируемых файлов?
Нет. Скрипт сам по себе не имеет каких-либо ограничений.
Все зависит только от системных ресурсов Вашего сервера.
Тем не менее RiSearch не предназначен для работы с действительно
огромными сайтами (см. раздел "Производительность").
Кроме того, скрипт потребляет огромное
количество системных ресурсов во время индексации.
Можно ли удалить или добавить страницу в базу данных?
Нет. Вам придется заново проиндексировать весь сайт.
Работает ли RiSearch с другими языками?
RiSearch должен работать практически с любым языком после
небольшой модификации. Вы должны указать ему, какие символы
являются буквами в Вашем языке и как конвертировать заглавные
буквы в строчные.
Когда RiSearch находит много совпадений, он работает несколько медленно.
Это возможно в случае использования длинных и сложных запросов.
Если запрос состоит из 10 ключевых слов, и для каждого слова
найдено более 1000 совпадений, может потребоваться некоторое время
для обработки всех данных. Но даже в этом случае поиск не займет более 2-3 секунд.