RiSearch

Поисковый скрипт

        English / Russian

Введение
Инсталляция
Системные
требования

Производительность
Язык запросов
Пользователи
Кодировки
ЧаВо
Планы
Форум
  Инсталляция   Настройка   Известные проблемы

Инсталляция

  1. Откройте полученный архив. Внутри Вы найдете несколько файлов.

         index.pl     - индексирующий скрипт
         spider.pl    - скрипт для индексации через HTTP протокол
         search.pl    - поисковый скрипт
         stat.pl      - анализ статистики запросов
         config.pl    - конфигурационный файл
         template.htm - шаблон для результатов поиска
         searchbox    - пример формы для поиска
         readme.txt и readme.rus
    
  2. Разместите файлы index.pl, search.pl, config.pl, template.htm и stat.pl в Вашей CGI директории.

  3. Создайте директории "db" для индексных файлов и "log" для сохранения запросов.

  4. Установите атрибуты файлов/директорий с правом на чтение и исполнение (755 для скриптов и 777 для директорий "db" и "log").

  5. Файл searchbox содержит шаблон формы поиска. Разместите ее в любых Ваших html файлах.

      Перед началом работы еще раз проверьте три основных источника ошибок в CGI скриптах.

  1. В первой строке всех скриптов надо указать путь к интерпретатору Перл на Вашем сервере. Обычно это #!/usr/bin/perl. На платформе "Windows" надо написать что-то вроде #!C:\PERL\5.00502\bin\MSWin32-x86-object\perl.exe, хотя обычно достаточно просто #!perl.

  2. Юникс подобные системы (т.е. большинство вебсерверов) имеют формат текстовых файлов отличный от принятого в MS-DOS. Отличаются они символом конца строки, поэтому перед закачкой скриптов на сервер необходимо преобразовать файл в Юникс формат (это позволяют делать многие текстовые редакторы, например UltraEdit) или использовать ASCII режим FTP клиента.

  3. И еще раз проверьте права доступа для скрипта (установить их можно с помощью большинства FTP клиентов). Учтите, что некоторые провайдеры, в целях повышения безопасности, требуют использовать строго определенные права доступа (отличные от указанных выше), в противном случае скрипты на их сервере исполняться не будут.

Индексация

      Для начала индексации необходимо запустить скрипт "index.pl". Делать это можно или через UnixShell (если провайдер предоставляет Вам такую возможность) или запустив его как обычный CGI скрипт (т.е. набрав в адресной строке броузера http://www.server.com/cgi-bin/index.pl). Желательно переименовать скрипт, чтобы никто не мог запустить индексацию без вашего ведома. Во время индексации скрипт создаст файлы базы данных с информацией о Вашем сайте (0_hash, 0_hashwords, 0_sitewords, 0_finfo, 0_word_ind) и сохранит их в поддиректории "db".

      Еще одним методом индексации является использование HTTP протокола. Запустите скрипт "spider.pl" и он начнет загружать страницы с Вашего сервера, попутно вытаскивая из них все ссылки, пока не проиндексирует весь сайт (скрипту "spider.pl" для работы необходим модуль LWP). Это особенно полезно при индексации динамических сайтов. Скрипт не имеет больших возможностей и предназначен для работы только с одним сайтом. Еще одно ограничение: Вы не можете остановить процесс индексации и затем возобновить его с этого места. Необходимо индексировать весь сайт сразу.

      Индексирование может потребовать значительное количество системных ресурсов. Ваш провайдер может быть очень недоволен, если Вы будете проделывать это слишком часто. И если сайт объемом в 10-20 мегабайт будет проиндексирован без особых проблем, индексация сайта размером в 500 Мб может чрезмерно загрузить любой сервер. В такой ситуации лучше проводить индексацию на локальной копии сайта. Затем Вы можете просто скопировать созданные при индексации файлы на сервер (пожалуйста используйте при копировании бинарный режим).

      Пожалуйста учтите еще одно обстоятельство: большинство вебсерверов не позволяют CGI скриптам работать более 30-60 секунд. Если за это время скрипт не закончит свою работу, сервер его просто убьет. Поэтому сайты объемом более нескольких мегабайт необходимо индексировать либо запуская скрипт через UnixShell, либо на локальной машине.



Введение | Инсталляция | Системные требования | Производительность | Язык запросов | ЧаВо | Планы | Форум

Home: http://www.alooks.ru/ Sergej Tarasov, © 2010.