|
|
From: Sly Golovanov <Sly.Golovanov@p13.f794.n5020.z2.fidonet.org>
Date: Mon, 09 Jul 2001 04:00:01 +0400
------------------------------------------------------------------------------
Perl FAQ created by SLY Golovanov, 2:5020/794.13
Последнее обновление 18 июня 2001
Обновления выделяются символом ">" в начале
==============================================================================
Спасибо to:
Artem Chuprina, 2:5020/371.32
Victor Wagner, vitus@ice.ru
==============================================================================
Общие вопросы
------------------------------------------------------------------------------
Q: Что такое Perl?
A: Practical Extraction and Report Language. Язык программирования, который
задумывался, как удобный язык для работы со строками, и не стесненный, к тому
же, ограничениями, свойственными другим языкам. Фактически, получился удобный
язык, на котором программы быстро пишутся (в общем случае это не значит, что
они работают быстрее, например, программ С++ - но написать код можно точно
быстрее)
Q: Кто его придумал?
A: Larry Wall. А развивается он при помощи тысяч энтузиастов по всему миру.
Q: Для чего его используют?
A: Самое распространенное использование - в качестве CGI-программ,
выполняемых на интернет-сайтах.
Q: Сколько стоит его коммерческая версия?
A: Мечта тех, кто разрабатывает Perl - сделать некоммерческий продукт, который
будет лучше коммерческих. Это им удается, ИМХО. Perl распространяется
свободно, поддержка пользователей осуществляется через ньюс-конференции и
рассылки. Тем не менее, если есть желание, можно заключить контракт на
поддержку за деньги. Подробности - perlfaq2.
Q: Под какие платформы он существует?
A: perl 5 - под практически все виды UNIX-систем (Linux, FreeBSD, SunOS,..),
DOS (защищенный режим, i386 и выше), Windows 9x/NT, OS/2, VAX VMS, Novell
Netware. Amiga..
Q: А компилятор где взять?
A: Пока полноценных компиляторов не существует - скрипты выполняются и
распространяются в виде исходников. Нечто, заявленное, как компилятор,
и подходящее только к Activestate-перлу для w32, лежит на www.activestate.com
Q: Сайт перла какой? Где взять последнюю версию?
A: www.perl.com ; для windows - www.activestate.com
Q: Как сделать то-то? Может, уже есть готовая библиотека?
A: http://www.perl.com/CPAN/
http://search.cpan.org
CPAN - огромное, отсортированное собрание всех дополнительных модулей к perl,
не включенных в поставку. Собраны все версии модулей. Рядом с ними лежат
readme. Скачиваете, и устанавливаете. В 90% случаев то, что вы пытаетесь
сделать, уже кто-то сделал и выложил на CPAN.
Как устанавливать модули для perl w32 - см. ниже, в разделе perl+Windows
Q: Где взять скриптов готовых, побольше?
A: www.cgi-resources.com
www.cgiresources.com
www.script.ru
www.codemanual.com
Только не используйте и не разбирайте скрипты из Matt's scripts archive. Он
не умеет правильно их писать, лучше не учиться плохому.
Q: А вот у меня вопрос...
A: Во-первых, вместе с perl поставляется уйма документации. Начиная с perlfaq,
который НЕОБХОДИМО прочесть (хотя бы просмотреть заголовки). Кроме этого,
также вместе с ним поставляется программа perldoc, которая может выдавать
доку для каждого из установленных модулей:
perldoc <имя_модуля>
для любой встроенной функции:
perldoc -f <имя_функции>
да и вообще много по какому поводу:
perldoc perldoc
В большинстве статей документации есть примеры кода. Если с вашим
дистрибутивом perl не поставляется perldoc - выкиньте этот дистрибутив.
Можете также зайти на сайт http://perldoc.narod.ru
Q: Какие существуют редакторы для написания программ, с подсветкой?
A: Мультиплатформенный - vim
Под win32 - FAR с плагином Colorer, perl scripting tool
------------------------------------------------------------------------------
Книжки
------------------------------------------------------------------------------
Q: Какую книгу для начинающих посоветуете?
A: Llama Book, она же "Изучаем перл" в русском издании. С ламой на обложке.
Q: А для продолжающих?
A: Perl Cookbook. Переведенена как "Perl. Библиотека программиста". Список
конкретных задач и их решений, плюс уроки хорошего стиля программирования.
Q: А в электронном виде где книги взять?
A:
Llama Book по-русски:
ftp://molly.wbt.ru/incoming/lama.rar
http://ag.ru/files/llama.exe
Сайт по программированию и перл:
http://simplex.ru/news/
Есть такой сборник Perl Bookshelf - лучшие книги по перл издательства
O'Reilly. На английском, разумеется. Лежит на:
http://lpcs.math.msu.ru/CD_Bookshelf/Perl/
В виде архива ее можно взять как
ftp://twilight.telco.md/pub/books/perlbookshelf.zip
http://ag.ru/files/perlbookshelf.zip
ftp://freebsd.svib.ru:21/incoming/ora/perlbookshelf.zip
(дополнительные ссылки принимаются).
Perl Cookbook в HTML-виде из этого комплекта, но с исправленными опечатками
(список опечаток - на www.oreily.com):
http://meltingpot.fortunecity.com/nj/80/cookbook.rar
Неплохая, по слухам, книжка для начинающих:
http://www.effectiveperl.com
The Perl Journal:
www.itknowledge.com/tpj/
Заметки по Perl-у:
http://www.perlreference.com
http://perlfect.com/articles/
http://www.perlmonth.com/
http://www.stonehenge.com/merlyn/WebTechniques/
http://www.stonehenge.com/merlyn/UnixReview/
http://www.stonehenge.com/merlyn/LinuxMag/
http://www.plover.com/~mjd/perl/#tpj
http://home.od.ua/watman/perl/
http://spider.softclub.net/books/web/
http://athena.vvsu.ru/docs/unix/
http://athena.vvsu.ru/docs/tcpip/
http://athena.vvsu.ru/docs/www/
http://webims.virtualave.net/docs/
http://www.citforum.ru
http://home.od.ua/watman/perl/
------------------------------------------------------------------------------
perl+Windows
------------------------------------------------------------------------------
Q: Как прикрутить perl к винде, чтобы можно было скрипты выполнять локально?
A: www.activestate.com, download perl. Устанавливаете, и запускаете:
perl myscript.pl
Q: У меня перл от Activestate, как мне поставить такой-то модуль?
A: www.activestate.com/packages/zips/
Находите нужный архив, скачиваете, читаете readme.
Если нужного модуля нет - идёте на CPAN, ищете его там, пытаетесь понять, как
его прикрутить. С некоторой вероятностью он чисто перловый, и тогда есть шанс,
что просто положив его в директорию с модулями, вы получите работающий модуль.
Если же у него есть С-часть, ставите MS Visual C, и мучаетесь, мучаетесь...
Q: А из браузера как смотреть на вывод скрипта? Почему-то показывается
исходник.
A: Потому что между браузером и perl должен стоять сервер, который и
запускает скрипт на выполнение, отдавая результат браузеру. Сервер не
обязательно подразумевает под собой отдельный компьютер - вы можете поставить
себе программу, и обращаться к ней через браузер, наблюдая за работой
скриптов. Вариантов масса:
Personal Web Server из поставки Win9x
Sambar, www.sambar.com
Apache-W32, www.apache.org
Устанавливаете сервер, и либо указываете в настройках сервера ассоциацию на
файлы cgi и pl - запуск perl.exe, либо устанавливаете такую ассоциацию на эти
файлы в windows (dbl click в windows explorer AKA проводник).
Q: Как заставить работать связку perl + MySQL под виндой?
A: Скачать дистрибутив MySQL с сайта (www.mysql.com), и дистрибутив perl с
этого же сайта, собранный с необходимыми модулями - DBI и DBD:MySQL.
------------------------------------------------------------------------------
Regular expressions (регулярные выражения)
------------------------------------------------------------------------------
Q: А что это за закорючки такие в скрипте - s/^[^\w]{1,3}(\d+)/$1/
A: Это регулярные выражения, одна из мощнейших возможностей perl. Средства
поиска и замены подстрок в строках
Q: Как ими пользоваться?
A: Этому учатся всю жизнь. Даже целая книга есть - "Mastering regular
expressions". Также следует прочесть perldoc perlre
А начать можно со следующего:
// - поиск
s/// - поиск и замена
tr/// - трансляция
Если мы хотим узнать, нет ли в строке $_ подстроки 'my', мы пишем:
/my/;
Если мы имеем дело не с переменной по умолчанию, а с любой другой, пишем:
$str=~/my/;
Если мы хотим заменить в строке подстроку tree на root, используем поиск и
замену:
$str=~s/tree/root/;
В конце выражения могут стоять опции g, i и т.п. g означает проводить замену
не 1 раз, а по всей подстроке. i означает не учитывать регистр символов.
В подстроке для поиска можно использовать управляющие символы. Есть
несколько видов управляющих символов - мета-символы, обозначающие какой-то
символ из набора букв, цифр, и т.п., мета-символы, управляющие количеством
символов, и т.п. Например, \d в подстроке обозначает любую цифру, \w -
любую букву, \s - пробел, . - любой символ. Стоящая после мета-символа *
означает, что предыдущий символ может повторяться 0 или более раз. + означает
повторение 1 или более раз. То есть, строка вида
$str=~s/\s\d+\s/ 1 /g;
означает "заменить все числа в строке $str, отделенные пробелами с двух
сторон, на цифру 1, отделенную пробелами".
Более подробное описание регулярных выражений, список управляющих символов и
других возможностей смотрите в документации.
Q: Как не учитывать регистр в русском тексте? С английским регекспы с ключом
i работают, а с русским - нет.
A: На UNIX'оподобных системах с корректной локализацией (FreeBSD, Linux на
glibc 2.1) это делается так:
use locale;
use POSIX qw (locale_h);
setlocale(LC_CTYPE, 'ru_RU.KOI8-R');
(можно еще выставить переменную окружения export LANG=ru_RU.KOI8-R
тогда будет достаточно вызова use locale; в Perl-скрипте)
Под Windows это делается так:
use locale;
use POSIX qw (locale_h);
setlocale(LC_CTYPE, "Russian_Russia.1251"); # или "Russian_Russia.866"
С трансляцией АКА tr/XX/xx/ даже не используя use locale; можно так сделать:
tr/\xB3\xE0-\xFF/\xA3\xC0-\xDF/; # для KOI8-r
или
tr/\xA8\xC0-\xDF/\xB8\xE0-\xFF/; # для Windows-1251
или
tr/\xF0\x80-\x9F/\xF1\xA0-\xAF\xE0-\xEF/; # для CP-866
Q: Кто-нибудь может мне по-русски рассказать о операорах: ?:, ?!, ?= и т.д.
и когда они используются?
A:
(?:pattern) - это почти (pattern). В норме круглые скобки выполняют
одновременно две функции - группируют то, что у них внутри, чтобы можно было
использовать повторители (*, ?, +), и сохраняют то, что там получилось, в
переменных $1, $2,.. (?:pattern) выполняет только первую функцию, не
трогая, таким образом, значения переменных $1, $2,... Что несколько ускоряет
работу (пропорционально количеству откатов, проходящих через границу
выбранной группы) и уменьшает количество переменных.
(?=pattern) - загляд вперед. Отличается от просто pattern тем, что после
успешного нахождения соответствия позиция в строке будет не после
соответствующего куска, а перед ним.
(?!pattern) - отрицательный загляд вперед. Отличается от предыдущего тем, что
pattern найтись НЕ должен.
Вторые оба наиболее осмысленны, когда привязаны к чему-нибудь (^, \G, просто
предшествующему шаблону). Но в некоторых ситуациях осмысленны и сами по себе.
В perl 5.005 появились различные нововведения, о которых подробнее можно
узнать в документации: ?<=, ?<!, ?{code}, ?>,
?(condition)yes-pattern|no-pattern
------------------------------------------------------------------------------
Data Bases
------------------------------------------------------------------------------
Q: Как работать из perl с базами данных?
A: DBI. Это унифицированный программный интерфейс, придуманный для того, чтобы
с разными базами можно было работать одинаково (за исключением, конечно,
специфики самих SQL-запросов). Устанавливаете модуль DBI (Data Base
Interface), ищете и устанавливаете DBD::something (Data Base Driver) -
драйвер-связку между DBI и нужной вам базой. Oracle, MySQL, PostgreSQL и куча
других СУБД поддерживаются DBI+DBD. Читаете perldoc DBI
------------------------------------------------------------------------------
Функции
------------------------------------------------------------------------------
Q: Хочу прочитать список файлов в каталоге, но почему-то не работает или
глючит. Делаю так:
@files=<*>;
A: Такой способ вызывает внешнюю программу glob (также, как и способ
@files=glob("*")). Это неправильно не только потому, что на запуск внешней
программы уходит время и ресурсы, но и потому, что где-нибудь этой программы
может просто не оказаться. Более правильный способ - это:
opendir DIR,'/tmp';
@files=readdir DIR;
closedir DIR;
или
opendir DIR,'/tmp';
for $file (readdir DIR)
{
}
closedir DIR;
Заметьте, что в $file будут подставляться как имена файлов, так и имена
подкаталогов.
Несколько подсказок. Чтобы прочесть список файлов, в котором не содержалось
бы '.' и '..', можно написать следующее:
opendir DIR,'/tmp';
@files=grep !/^\.+$/,readdir DIR;
closedir DIR;
Таким же способом,- с помощью regexp,- можно задавать любые другие маски
файлов.
Если вы хотите прочесть список каталогов, не трогая файлы:
opendir DIR,/tmp';
@dirs=grep {!/^\.+$/ and -d "/tmp/$_"} readdir DIR;
closedir DIR;
------------------------------------------------------------------------------
UNIX-специфика
------------------------------------------------------------------------------
Q: Как сделать демона?
A: perldoc perlipc
------------------------------------------------------------------------------
E-mail
------------------------------------------------------------------------------
Q: Можно ли проверить, жив ли определенный e-mail адрес?
A: В общем случае - нельзя. Проверка существования и функционирования домена,
в котором этот email прописан, в сущности ничего не дает. Остается
отталкиваться от конкретных требований. Например, послать e-mail на этот адрес
и попросить ответить, зафиксировав ответ.
------------------------------------------------------------------------------
Разное
------------------------------------------------------------------------------
Q: Как округлить число?
A: sprintf("%3.2f",$dig)
Здесь 3 - кол-во знаков до запятой, 2 - после запятой.
------------------------------------------------------------------------------
Полезные модули - все есть на http://search.cpan.org, либо входят в
поставку.
екоторые есть и для Activestate Perl, www.activestate.com/packages/zips/
------------------------------------------------------------------------------
Q: Как получить текущую дату и время?
A: Функция time() возвращает время в unix-формате - количество секунд,
прошедших с 1 января 1970 года. Функция localtime() возвращает дату и время.
В контексте массива - значения секунд, минут, и т.п. раздельно, в скалярном
контексте - строку определенного формата. Подробнее см. perldoc -f localtime
Q: Функция time() возвращает время с точностью до секунды. Как работать с
меньшими промежутками?
A: Time::HiRes
Q: Как послать по e-mail письмо с аттачем?
A: Mime::Lite
Q: Как по дате вычислить день недели?
A: Date::Calc
Q: Как, зная дату и время, получить количество секунд, прошедших до этого
времени с 1970 года (unix-time format)?
A: Time::Local
Q: Можно ли сделать GUI-интерфейс в перловой программе, или вывод в GUI-окно
ее результатов?
A: модуль Tk. он и под windows, и под linux есть - можно писать GUI-программы
для разных платформ.
Q: Как устроить загрузку файла с удаленного сервера? Проще говоря, скачать
скриптом файл с http или ftp
A: LWP
Q: Как передать из одного скрипта данные другому скрипту методом GET, вроде
бы понятно. А как передавать данные методом POST?
A: Внимательно почитать документацию о LWP::UserAgent и HTTP::Request
Q: Как создавать графические файлы на лету?
A: модуль GD, или внешние программы: Imagemagick, fly,..
------------------------------------------------------------------------------
WWW-специфика
------------------------------------------------------------------------------
Q: Я положил скрипт на сервер, ввожу его путь в браузер, но вместо того,
чтобы выполнять скрипт, браузер выводит его исходный текст.
A: Чтобы сервер запускал скрипт и выдавал результаты его работы, необходимо
объяснить серверу, что этот файл - исполняемый. Существующее в
unix-системах понятие "атрибуты файла" отличается от атрибутов в DOS/Windows,
и в unix исполняемый файл определяется не расширением, а атрибутом.
Если сервер работает на unix-системе, необходимо проставить на
файл атрибуты исполняемого файла. Это делает команда "chmod 0755 file",
если вы работаете через telnet или ssh, или же продвинутый FTP-клиент типа
CuteFTP или FAR ftp plugin. Атрибуты файла, который могут исполнять
все желающие (в том числе и сервер), выглядят в буквенном представлении, как
-rwxr-xr-x
Если вы работаете в win32 среде, достаточно определить программу,
запускающую файлы с расширением, которое вы даете скриптам - например, cgi.
Для этого нужно в windows explorer'е дважды кликнуть по файлу .cgi, и
выбрать perl\bin\perl.exe в качестве запускающей программы. Это помогло мне
под Sambar-сервером, с apache-win32 не сталкивался.
Q: При попытке запустить скрипт происходит Internal Server Error! Что это за
ошибка?
A: Это, строго говоря, просто сообщение об одной из ошибок, приведших к
невозможности нормального выполнения скрипта. Чаще всего возникает в следующих
случаях:
1) в первой строке отсутствует или неправильно указан путь к perl. обычно это
#!/usr/local/bin/perl или #!/usr/bin/perl
2) Файл со скриптом содержит DOS-овые концы строк 0x0D 0x0A. В юниксе конец
строки - только 0x0A. Чтобы исправить это, воспользуйтесь соотв. возможностью
редактора FAR (shift-f2, as Unix text), или при закачке скрипта на ftp
используйте ASCII-режим вместо бинарного.
3) Скрипт не выводит ничего во время работы, или не выводит заголовок.
Необходимо, чтобы он выводил хотя бы content-type заголовок, например:
print "Content-type: text/html\n\n";
print "All done";
Обратите внимание на двойной перевод строки в конце заголовка.
Если у вас нет доступа к логу ошибок сервера, для отладки скрипта используйте
директиву
use CGI::Carp qw (fatalsToBrowser);
В этом случае при фатальной ошибке, приводящей к завершению скрипта, эта
ошибка будет видна вам в браузере.
Q: Как узнать IP человека, вызвавшего скрипт?
A: $ENV{'REMOTE_ADDR'}
Q: Как узнать, с какой страницы идет ссылка на скрипт?
A: $ENV{'HTTP_REFERER'}
Q: Как узнать IP прокси, если через нее запустили скрипт?
A: $ENV{'HTTP_VIA'}
A1: Некоторые прокси добавляют в конец заголовка строку типа
", via ProxyName", и в результате вместо переменной HTTP_VIA эту строку можно
наблюдать в конце переменной $ENV{'HTTP_USER_AGENT'}
Q: А можно ли узнать IP юзера, запустившего скрипт через прокси?
A: $ENV{'HTTP_X_FORWARDED_FOR'}. Но не все прокси обеспечивают IP сидящего за
ними юзера. "Честные" прокси,- у провайдеров, например,- это делают. А
некоторые халявные прокси-сервера, могут и не показывать IP сидящего "за"
ними пользователя.
Q: А какие еще значения есть у этой %ENV ?
A: for (keys %ENV) { print "$_ = ${ENV{$_}}\n" }
A1: То же самое, но по-другому записанное (более "перловое" решение):
print join("<br>",map("$_ = $ENV{$_}", keys %ENV));
(пальцы... - прим. SLY)
Q: Как запускать скрипт на сервере через определенные промежутки времени, или
в определенное время суток, день недели, месяц?..
A: Это возможно, если есть шелл-доступ на сервер. Читайте man crontab
Q: Как, зная ip, получить имя (DNS), за которым этот ip закреплен?
A: Встроенная функция gethostbyaddr()
Q: Что такое method GET, и что такое method POST?
A: У меня секретов нет - слушайте, детишки.
GET - передача параметров скрипту из строки location браузера. Пример:
script.cgi?mode=aa&type=bb&length=12
Минусы этого метода:
1. Все параметры видны в строке. Если в кач-ве параметров передается пароль
- получается дырка в безопасности
2. Длина данных, передаваемых таким методом, ограничена.
3. Нельзя передавать multipart form data, в т.ч. файлы через кнопочку
"Browse"
POST - передача данных скрипту через STDIN. Отсутствуют минусы метода GET.
Обычно метод GET используется, когда скрипт вызывается со страницы через линк
<a href=...></a>, а POST - при нажатии кнопки submit в форме. Минусы - не
работает кнопка back браузера. Выдается ошибка "page has expired". Это
зависит от настроек web-сервера. Во избежание этого либо делайте полную
навигацию без использования кнопки back, либо используйте метод GET.
Q: Как обрабатывать параметры, переданные скрипту?
A: Используйте модуль CGI. Прочтите perldoc CGI , а для начала вот простой
пример:
use CGI;
$q=new CGI();
$mode=$q->param('mode');
$q - объект, который имеет несколько методов и полей, относящихся к
параметрам вызова, переменным окружения, cookie, и пр. Смотрите perldoc CGI.
В $mode содержится значение параметра 'mode'.
или проще:
use CGI qw/:standard/;
$mode=param('mode');
если вам не нужно несколько объектов query.
Q: Посоветуйте халявный хостинг с поддержкой CGI на perl
A:
www.virtualave.net
free.prohosting.com
www.hypermart.net
www.netfirms.com
Q: Что надо указать в заголовках HTTP-ответа CGI скрипта, выводящего
содержимое, которое надо не показать на экране, а сохранить в файле с заданным
именем, например 'data.zip' ? А то браузер сохраняет файл с именем скрипта.
A: Content-Disposition: attachment; filename="filename.ext"
------------------------------------------------------------------------------
> Apache-специфика
------------------------------------------------------------------------------
Q: А как бы мне сделать, чтобы вывод моего скрипта обрабатывался SSI?
A: Честно - никак. Почему - см. документацию на Apache. Однако, раз уж у нас
есть Perl, нам, видимо (честно говоря, сам не пробовал), поможет CGI::SSI
(если это CGI) или Apache::SSI (если mod_perl).
Q: А как бы мне ограничить доступ к скрипту или директории только для умных и
местных (способных взломать веб-сервер или знающих пароль)?
A: В принципе, возможно множество различных решений. Стандартное делается
средствами авторизационного механизма веб-сервера. Читайте документацию Apache
на предмет директив Auth* и require, а также на предмет параметра AuthConfig
директивы AllowOverride, а то будете потом удивляться, почему совершенно
правильный .htaccess не работает. mod_perl позволяет вклиниться в фазы
контроля доступа, аутентификации и авторизации, и написать свои обработчики.
Для аутентификации и авторизации по базам данных существуют модули для
mod_perl AuthenDBI и AuthzDBI (в свежих версиях они объединились в один
модуль, Apache::AuthDBI), а простейший пример файловой авторизации:
<Files "myscipt.cgi">
AuthType Basic
AuthName My.Script.Very.Secure
AuthFile /home/vasia/.htpasswd
require valid-user
</Files>
Файл /home/vasia/.htpasswd может лежать (и это рекомендуется) в месте,
недоступном для укачивания. Если положить его в такое место невозможно, надо
защитить его от укачивания посредством
<Files ".htpasswd">
deny from all
</Files>
или как минимум всё тем же паролем, только уже с require vasia. Его формат -
имя:пароль, пароль зашифрован стандартным юниксовым crypt(), так что если нет
доступа к команде htpasswd (например, нет шелла), то можно сгенерировать его
перловым скриптом. Я, собственно, поначалу так и делал, пока не сообразил, что
должна быть специальная программа...
Ко всему этому рекомендуется помнить, что пароли Basic авторизации передаются
по сети в незащищённом виде (base64-кодирование строки "имя:пароль"), а поля
форм <input type=password> показываются звёздочками только в браузере, по сети
же передаются как есть (вернее, опять же закодированными, но уже как URL).
Поэтому, если вы не пользуетесь защищённым каналом (SSL), работать так с
действительно конфиденциальными данными нельзя.
------------------------------------------------------------------------------
mod_perl
------------------------------------------------------------------------------
Q: Что такое mod+perl и зачем он нужен?
A: На пальцах - модуль к серверу Apache, который предназначен в первую очередь
для ускорения запуска скриптов. Вместо того, чтобы каждый раз при запуске
скрипта запускался perl, компилировал скрипт и выполнял его, этот perl все
время запущен, и висит в памяти. В памяти же находятся и уже откомпилированные
до состояния исполняемого кода скрипты. Кроме этого он позволяет вмешиваться
почти во все стадии работы сервера, от конфигурирования до различных
стадий обработки запроса; он позволяет получать от Апача все данные о нём
самом и о запросе, которые у того есть.
Q: Что означает ругань "Value of $x will not stay shared at - line 5" и
"Constant subroutine XXX redefined ..." при попытке запустить скрипт при
помощи mod_perl?
A: Это следствие различий между работой честного CGI-скрипта, когда для
выполнения скрипта порождается новый процесс, а по завершении скрипта процесс
завершается, и работой под управлением Apache::Registry - модуля эмуляции
окружения CGI под mod_perl. Скрипт, исполняющийся под Apache::Registry,
выполняется как функция в том же процессе, что и сам веб-сервер, и результат
его компиляции кэшируется mod_perl'ом до обновления скрипта. Второе сообщение
не страшно - оно всего лишь предупреждает, что определённая в скрипте функция
была перекомпилирована при повторном выполнении (или при перекомпиляции? не
помню) скрипта. А вот первое чревато неприятностями, и означает оно, что
определённая в скрипте (теперь - функции где-то внутри Apache::Registry)
функция пользуется определённой в нём же лексической (my) переменной, не
получая её среди аргументов. Такая функция называется closure (вернее, closure
называется такая же, но анонимная функция), и смысл её в том, что значение
этой переменной на момент определения функции сохраняется в ней, и в
дальнейшем при обращении к ней она будет пользоваться этим сохранённым
значением (в нашем случае - тем, которое приняла переменная при первом запросе
к данному скрипту в данном экземпляре Апача), а не новым. Лечится это двумя
различными способами: если этот скрипт уже более-менее отлажен и используется
часто, полезно перенести определения функций из него в отдельный модуль; если
же он пока отлаживается, то см. следующий вопрос.
Q: Написание скриптов под mod_perl чем нибудь отличается от написания
обычных CGI скриптов?
>A: Вообще говоря, да.
Во-первых, существует куча более других способов писания под mod_perl -
Perl-SSI, Perl*Handlers, логика работы которых сильно отличается от CGI.
Если же мы говорим о тех скриптах, которые выполняются через
Apache::Registry, то есть следующие различия:
1. Нельзя использовать my-переменные уровня файла. То есть использовать
можно, но результат будет ну очень странный. Дело в том, что с точки
зрения перла, mod_perl-овый скрипт это не файл, а тело процедуры.
Поэтому использование в нем my переменных, которые потом пользуются из
вложенных процедур, приводит к возникновению closure и всему, что из
этого следует.
Я лично исполюзую следующую технику:
use CGI;
use DBI;
use strict;
use что-там-еще-надо
&main;
sub main {
my $cgi=new CGI;
....
}
sub some_more_sub {
...
}
При таким образом написанном скрипте я уверен что lexical scoring будет
вести себя одинаково и в CGI и в mod_perl.
2. Скрипты живут долго. Поэтому мусор за собой надо чистить аккуратно.
3. Тебе доступен объект Apache::Request, который содержит уйму интересной
информации; в частности, из него можно вытащить пароль при basic
authentication.
4. Теоретически, у тебя есть куда больше способов повлиять на поведение
Apache в процессе обработки твоего запроса, чем из CGI.
5. Если ты используешь самописные модули, то при их редактировании придется
апач перестартовывать (apachectl graceful) - поскольку крайне сложно
(и долго) проверять все зависимости, Apache::Registry проверяет
только момент изменения самого исполняемого им скрипта, а модули,
используемые в качестве Perl*Handler, не проверяются вообще. Если в
конфигурации Апача сказано PerlFreshRestart On, то достаточно его об
этом попросить вежливо (SIGUSR1 AKA apachectl graceful или SIGHUP AKA
apachectl restart), но за отработкой этой директивы при наличии сложных
модулей замечены проблемы. Если она Off, то придётся положить и поднять
(apachectl stop; apachectl start). Существует модуль
Apache:StatINC, который следит за изменениями модулей и перегружает их по
мере изменения. Но есть подозрение, что он не надёжнее PerlFresRestart.
При изменении модулей остерегайтесь эффекта частичного срабатывания -
некоторые запросы обрабатываются еще старой версией модуля, а некоторые - уже
новой. Это происходит оттого, что модуль грузится отдельно каждым экземпляром
Apache, скорее всего, только при первом обращении к использующему его
скрипту, а потому часть экземпляров "запомнила" старый, а к остальным
попал уже "новый".
------------------------------------------------------------------------------
Примеры скриптов и функций
------------------------------------------------------------------------------
Q: Как одновременно поставить куку и сделать редирект?
A:
sub ReLocate
{
my($where,$cookie)=@_;
print "Status: 302 Moved\n";
if ($cookie ne '') { print "Set-Cookie: $cookie\n" }
print "Location: $where\n\n";
}
------------------------------------------------------------------------------
Q: Надо записать в файл строку, а потом прочесть ее оттуда
A:
# записать строку в файл
open FILE,'>file'; # открыть файл на запись
print FILE 'строка'; # записать строку
close FILE; # закрыть файл
# прочитать строку из файла
open FILE,'file'; # открыть файл на чтение
$string=<FILE>; # прочесть одну строку, включая символ "перевод строки"
chomp($string); # обрезать в конце строки "перевод строки", если он есть
close FILE; # закрыть файл
------------------------------------------------------------------------------
Q: Закачка файлов на сервер и решение глюка с закачкой
A:
#!/usr/bin/perl # используйте -T для CGI-скриптов
$SIG{ALRM} = sub { die "$0 timed out" }; # эти 2 строки не работают под
alarm 900; # Windows, но они необязательны
use strict; # спасает от глупых ошибок
use Fcntl; # O_EXCL, O_CREAT и O_WRONLY
use CGI qw (:standard); # читайте "perldoc CGI"
use CGI::Carp qw (fatalsToBrowser); # вывод ошибок к browser-у
$CGI::POST_MAX = 131072; # максимальный ввод = 128 KB
my $foto = param ('foto'); # имя файла и одноврем. handle
my $DIR = '/home/alex/pics'; # не забудьте "chmod 777 pics"
my $JS = " // JavaScript-функция для пред-
// варительной проверки формы
function check (form)
{
if (form.elements['foto'].value.length < 4)// foto должно быть заполнено
{
alert ('A gde zhe foto?'); // показать JavaScript-окошко
form.elements['foto'].select (); // выделить текст в поле foto
form.elements['foto'].focus (); // и прыгнуть туда курсором
return false; // false запретит browser-у
} // отправлять данные к серверу
return true; // все OK - можно отправлять
}";
print header (-type => 'text/html; charset=koi8-r'),
start_html (-title => 'МИСС ИНТЕРНЕТ', # напечатать заголовок и $JS
-script => $JS);
# regex внизу проверяет, есть ли .gif или .jp(e)g в конце и кладет имя
# файла в $1
if ($foto !~ /([\w-]+ \. (?: gif | jpe?g ))$/ix) #только имя,путь выкидывается
{
print h1 ('Отправьте нам фото!'), #start_form работать не будет
start_multipart_form (-onsubmit => 'return check (this)'),
filefield (-name => 'foto'),
submit (-value => 'Go baby go!'), # напечатать форму с кнопкой
end_form; # напечатать </FORM>
}
# Этот скрипт никому не мешает вводить мусор (например xxxx.gif) в поле foto,
# что приведет к созданию пустых файлов; если это Вас беспокоит, установите
# новую версию CGI.pm и прочтите
# http://stein.cshl.org/WWW/software/CGI/#upload
elsif (not sysopen FILE, "$DIR/$1", O_EXCL | O_CREAT | O_WRONLY, 0444)
{
print h1 ("Не могу создать $DIR/$1: $!"); # ошибка или такой файл уже есть
}
# Портятся файлы при посылке? См. ниже!
else # все в порядке - файл создан
{
binmode FILE; # включить binmode для Windows
print FILE while (<$foto>); # и скопировать данные в файл
close FILE;
print h1 ('Сердечное Вам спасибо!'); # воспитывать как собак Павлова
}
print end_html; # напечатать </BODY></HTML>
==========================
Если закачка некоторых файлов происходит с глюками - видимо, файл
перекодируется на лету русским апачем.
Варианты решения:
1.запретите все перекодировки для скрипта, который разбирает FileUpload,
например таким способом:
<Location /path/to/upload.cgi>
CharsetDisable On
</Location>
и делайте перекодировку сами.
2.Используйте директиву CharsetRecodeMultipartForms, которая появилась в PL23,
но при этом вам все равно придется перекодировать вручную текстовые части
запросов. Для этого можно использовать Russian Apache API, доступное в других
модулях или Russian Apache Perl API, доступное из mod_perl.
© faqs.org.ru