Введение
Инсталляция Системные требования Производительность Язык запросов Пользователи Кодировки ЧаВо Планы Форум |
Инсталляция
Настройка
Известные проблемы
Инсталляция
Перед началом работы еще раз проверьте три основных источника ошибок в CGI скриптах.
ИндексацияДля начала индексации необходимо запустить скрипт "index.pl". Делать это можно или через UnixShell (если провайдер предоставляет Вам такую возможность) или запустив его как обычный CGI скрипт (т.е. набрав в адресной строке броузера http://www.server.com/cgi-bin/index.pl). Желательно переименовать скрипт, чтобы никто не мог запустить индексацию без вашего ведома. Во время индексации скрипт создаст файлы базы данных с информацией о Вашем сайте (0_hash, 0_hashwords, 0_sitewords, 0_finfo, 0_word_ind) и сохранит их в поддиректории "db". Еще одним методом индексации является использование HTTP протокола. Запустите скрипт "spider.pl" и он начнет загружать страницы с Вашего сервера, попутно вытаскивая из них все ссылки, пока не проиндексирует весь сайт (скрипту "spider.pl" для работы необходим модуль LWP). Это особенно полезно при индексации динамических сайтов. Скрипт не имеет больших возможностей и предназначен для работы только с одним сайтом. Еще одно ограничение: Вы не можете остановить процесс индексации и затем возобновить его с этого места. Необходимо индексировать весь сайт сразу. Индексирование может потребовать значительное количество системных ресурсов. Ваш провайдер может быть очень недоволен, если Вы будете проделывать это слишком часто. И если сайт объемом в 10-20 мегабайт будет проиндексирован без особых проблем, индексация сайта размером в 500 Мб может чрезмерно загрузить любой сервер. В такой ситуации лучше проводить индексацию на локальной копии сайта. Затем Вы можете просто скопировать созданные при индексации файлы на сервер (пожалуйста используйте при копировании бинарный режим). Пожалуйста учтите еще одно обстоятельство: большинство вебсерверов не позволяют CGI скриптам работать более 30-60 секунд. Если за это время скрипт не закончит свою работу, сервер его просто убьет. Поэтому сайты объемом более нескольких мегабайт необходимо индексировать либо запуская скрипт через UnixShell, либо на локальной машине. |
Home: http://www.alooks.ru/ | Sergej Tarasov, © 2010. |