Perl и CGI программы — особенности использования. Типы данных в perl

Главная страница » PERL » Циклы и ветвления.

Создание скриптов CGI с помощью PERL.

СОЗДАНИЕ СКРИПТОВ CGI С ПОМОЩЬЮ PERL. В главе 12 вы познакомились с программированием на языке Perl. В это главе вы научитесь использовать Perl для создания скриптов CGI. Коротко говоря, вы получите возможность сочетать ваши знания по языку Perl и CGI, полученные в предыдущих главах. Кроме того, вы узнаете несколько новых приёмов программирования на языке Perl. Как вы уже знаете, можно создать скрипты CGI, используя практически любой язык программирования. Чтобы быть грамотным Web-программистом, вы должны не только знать, как писать програм- мы для WEB, но также необходимо иметь представление о том, какие средства использовать для решения специфических задач. За счёт правильного выбора языка программирования и программных средств в соответствии с вашей задачей, вы можете значительно повысить эф- фективность работы и сэкономив много сил и времени. Когда вы ис- пользуете язык Perl для создания скриптов, можно создать устойчи- вые профессиональные скрипты за относительно короткий промежуток времени. Остаток этой главы посвящен изучению программирования CGI-скриптов на языке Perl. К моменту окончания изучения этой главы вы поймете следующие концепции: ? Perl представляет собой эффективное средство для создания на- дежных скриптов без написания кодов большого объёма, что выгодно отличает его от других языков программирования, таких как C и С++. ? Версия 5 языка Perl добавляет много новых возможностей, таких как поддержка объектно-ориентированных скриптов и усовершенство- вание техники определения области видимости переменных. Почему разработчики используют Perl для создания CGI- скрип- тов? Предыдущие две главы должны были составить у вас представле- ние о том, что такое CGI и почему мощные возможности языка Perl по обработке текстов делают его хорошо приспособленным для разра- ботки CGI-скриптов. Другие причины и пользования разработчиками языка Perl для написания CGI-скриптов заключаются в том, что Perl обеспечивает широкую поддержку взаимодействия с базами данных, обладает переносимостью и обеспечивает безопасность при работе в сетях. Как уже говорилось, Perl представляет собой один из наибо- лее мощных языке программирования для обработки текстов. Скрипты CGI обычно имеют дело с интенсивной обработкой текста: анализом данных, обеспечением доступа к база данных, генерацией HTML-стра- ниц и т. д. Типичный CGI-скрипт, написанный на языке Perl, по своему размеру представляет собой фрагмент программы аналогичного назна- чения, написанной на C++. Как вы увидите дальше в этой главе, Perl обеспечивает поддержку взаимодействия с базами данных. По существу, Perl имеет встроенный менеджер баз данных Perl был пе- ренесен почти что на все популярные вычислительные платформы та- кие как Windows, UNIX, MS, DOS. To обстоятельство, что Perl яв- ляется 6ecплатным, также увеличивает его привлекательность. Пос- кольку Perl не использует указателей, то он является более безо- пасным и надежным языком, чем С и C++. За счет исключения ис- пользования указателей предовращается нарушение доступа к памяти и связанные с этим ошибки. Кроме того используя регулярные выра- жения языка Perl, легко проверить целостность входных данных и отфильтровать всякие escape-последовательности, которые МОГУТ уг- рожать безопасности вашей системы. Наконец, для повышения безо- пасности имеется специальная версия Perl, называемая taintperl, предотвращающая использование каких-либо входных данных в качес- тве системных команд. Дополнительную и информацию о taintperl можно найти на Web-узлах, указанных в конце этой главы. ВЫЗОВ CGI-СКРИПТА На UNIX-системах программисты могут исполнять скрипты, напи- санные на языке Perl, как выполнимые файлы. Иными словами, для них нет необходимости делать что-то специальное для вызова скрип- та. На системах, основанных на DOS или Windows, некоторые серве- ры не исполняют скрипты Perl автоматически. В этом случае вам придется писать пакетный файл, который вызывает команды Perl для запуска скрипта. Для некоторых систем придется подробнее познако- миться (. документацией по вашему НТTР-серверу относительно за- пуска скриптов Perl. Большинство серверов HTTP предполагает, что скрипты CGI находятся в каталоге под названием cgi-bin. В этом случае можно вызвать скрипт с помощью URL, подобно следующему: http://your-domain/cgi-bin/your-script Примечание: В URL задан каталог cgi-bin, но в действительности скрипт может находиться где угодно в системе. Вы должны опреде- лить его расположение при установке сервера HTTP. ВЫЗОВ СGI-СКРИПТА В СИСТЕМЕ UNIX Если вы поместили ваш скрипт в каталог cgi-bin и сделали его выполнимым, то пользователь может вызвать скрипт, непосредствен- но используя URL. Однако необходимо выполнить несколько шагов. В первую очередь, в начало скрипта необходимо поместить строку, ко- торая идентифицирует файл как программу на языке Perl: #!/usr/bin/perl Примечание: Вы должны будете указать в этой строке путь, завися- щий от того, где установлен Perl на вашей системе. Далее необходимо сделать скрипт выполнимым, используя команду chmod: chmod +x your-srcipt ВЫЗОВ СКРИПТА НА ЯЗЫКЕ PERL ИЗ DOS И WINDOWS В DOS или Windows скрипты Perl сами по себе не являются вы- полнимыми самостоятельными программами. Вместо этого необходимо запустить исполнимую программу PERL.EXE, включая имя скрипта на языке Perl в командной строке. Для упрощения этого процесса мож- но создать ВАТ-файл для каждого вашего скрипта, который запус- кает PERL. ЕХЕ с соответствующим файлом, содержащим скрипт. Нап- ример, предположим, что ваш ВАТ-файл HELLO.ВАТ содержит следую- щие команды: @echo off perl Hello.pl %1 %2 %3 %4 %5 %6 %7 %8 %9 Также предположим, что скрипт Perl Hello.PL содержит следую- щие инструкции: print "Hello, args are "@ARGV"\n"; Как можно видеть, ВАТ-файл просто запускает программу PERL.EXE с указанием скрипта Hello.PL в качестве входной коман- дной строки. Если вы запустите скрипт на языке Perl из Web-серве- ра, то обнаружите, что большинство HTTP-серверов распознают скрипты на языке Perl (например, как это делает FolkWeb- сервер), так что нет необходимости в использовании ВАТ-файла. Иными слова- ми, если вы используете HTTP-сервер наподобие FolkWeb, вам нет надобности делать что-то специальное для вызова CGI-скрипта на языке Perl. В противном случае может потребоваться создать ВАТ-файл. Если ваша программа-сервер нуждается в ВАТ-файле для выпол- нения скрипта на языке Perl, вы должны поместить ВАТ-файл (такой как HELLO.ВАТ) в каталог cgi-bin и туда же - скрипт Perl (Hello.PL). СОЗДАНИЕ ТЕКСТА И HTML-ДОКУМЕНТА С ИСПОЛЬЗОВАНИЕМ ЯЗЫКА PERL Создание текстовых документов с использованием языка Perl представляет собой тривиальную задачу. Вам только необходимо удостовериться, что вы поместили правильный НТМL заголовок в на- чале текстового документа. Например, следующий скрипт создает простой текстовый документ, содержащий сообщение Hello, world: print "Content-type: text/plain\n\n"; print "Hello, world\n"; Создание текстовых документов HTML также очень легко. Напри- мер, в следующем фрагменте текста создается простой документ HTML: print Hello, world HTML Эти примеры больше походят на исходные коды HTML, чем на программу на языке Perl. Действительно, если вы удалите нес- колько строк, вы будете иметь HTML-файл. Эта иллюстративная прог- рамма использует свойства языка Perl, которые не были рассмотре- ны в предыдущей главе, но они достаточно просты для понимания. Строка представляет собой просто нес- колько строк литералов. Perl обрабатывает как строку в двойных кавычках. Поскольку делает ис- ходный код на языке Perl легким для чтения, то использование та- кой конструкции является идеальным для создания HTML-документов. Используя конструкцию, скрипт на языке Perl мо- жет не иметь символов цитирования и символов новой строки, и не должен содержать функций printf. Конструкция ши- роко используется в рассматриваемых далее в этой главе примерах. ДОБАВЛЕНИЕ В ДОКУМЕНТ ДИНАМИЧЕСКИХ СВОЙСТВ Если бы возможности CGI-скриптов ограничивались созданием статических форм, то это было бы грустно. Настоящая сила CGI сос- тоит в придании Webстраницам динамики. В главе 11 вы рассматрива- ли программу на языке C++, которая создает скрипт, выводящий на экран значения переменных окружения. Следующий скрипт на языке Perl решает идентичную задачу. Тем не менее, вы убедитесь, нас- колько проще выглядит программа на языке Perl, чем аналогичная С++ версия, показанная в главе 11: print Environment Variables: for $env (sort keys %ENV) { print "
  • $env is $ENV{$env}
    "; } print " \n" Этот пример создает статический заголовок, и затем выводит значения переменных окружения скрипта, используя форматированный HTML-документ. Скрипт показывает, как использовать конструкцию совместно с традиционной функцией print. ДОСТУП К СТРОКЕ ЗАПРОСОВ В главе 11 вы видели, что простым способом передачи данных CGI в скрипт является использование строки запросов. Броузер пе- редает данные HTTP-серверу как часть URL. В свою очередь сервер рассматривает все, что следует за знаком вопроса (?) в URL, как строку запроса. CGI-скрипт может получить доступ к строке запросов двумя способами. Либо сервер передает строку запросов скрипту, ис- пользуя аргументы командной строки, либо сервер присваивает зна- чение строки запросов переменной окружения QUERY_STRING. Напри- мер, можно возвратиться к рассмотренному выше скрипту, который выводит на экран значения переменных окружения, и вызвать скрипт, используя строку запросов. ДЕКОДИРОВАНИЕ ФОРМ HTML С ИСПОЛЬЗОВАНИЕМ МЕТОДА GET. Как вы увидели, использование подсказки ISINDEX для созда- ния одиночного запроса достаточно просто. Но для получения от пользователя больше чем одного значения необходимо использовать формы. Следующий скрипт на языке Perl генерирует форму. Используя метод GET, скрипт дает команду броузеру послать значения запроса как часть URL, так же как при использовании ISINDEX. Разница меж- ду использованием GET и ISINDEX состоит в том, что при использо- вании метода GET броузер может соединить несколько величин полей в одну строку запросов, разделяя поля с помощью амперсанда (&). Для того чтобы скрипт мог определять значения полей, броузер включает имена полей в строку запроса. Например, если база дан- ных содержит три поля (имя, возраст и день рождения) с такими значениями (Bob, 27, 11-1-68), то строка запросов будет содер- жать значения полей в следующем формате: . В следующем примере скрипт декодирует поля и выводит на экран их значения с помощью созда- ния HTML-формы: ($cgi_bin, $cgi_script) = ($0 =~ m:(.*)(.*):); $query = $ENV{QUERY_STRING}; if ($query eq "") { # сгенерируем форму print
    A checkBox.

    A radio button set.
    1
    2
    3

    A data entry field

    Send the data.

    FORM } else { # распечатаем результаты print "Content-type: text/html\n\n"; print " \n"; print " GET Form Result \n" print " \n"; print "Your query values:

    \n"; @fields = split("&", $query); forech (@field) { Switch: { /^check=(.*)/ && do { $check = $1; last Switch; }; /^button=(.*)/ && do { $button = $1; last Switch; }; /^field=(.*)/ && do { $field = $decode(1); last Switch; }; } } print "Check Box: $check
    \n"; print "Radio Button: $button
    \n"; print "Data Field:", &html($field), "
    \n"; print " \n"; } sub decode{ local ($value) = @_; $value =~ s/\+/ /g; $value =~ s/%({2})/pack("C",hex($1))/eg; return $value; } sub html { local ($value) = @_; $value =~ s//>/g; return $value" } Обратите внимание на первую строку скрипта: ($cgi_bin, $cgi_script) = ($0 =~ m:(.*)(.*):); Это выражение выглядит похожим на аналогичное выражение в предыдущем примере. Однако в данном случае скрипт разделяет путь на каталог и имя файла. В этом примере один и тот же скрипт соз- дает форму и обрабатывает ее вывод, что достаточно нетрудно вы- полнить. Такой способ рекомендуется для обработки форм, потому что концентрирует всю обработку в одном месте. Скрипт определяет, создавать ли форму или обработать запрос, в зависимости оттого, поступил ли запрос от пользователя. Для об- работки строки запросов скрипт разделяет запрос на поля, ис- пользуя функцию split. Далее скрипт сравнивает поля запроса с ожидаемыми именами полей. Рассмотрим следующий пример: forech (@field) { Switch: { /^check=(.*)/ && do { $check = $1; last Switch; }; Обычная форма цикла foreach включает переменную {$VAR). Если цикл foreach опускает эту переменную, то Perl использует перемен- ную по умолчанию $_. Аналогично, оператор регулярного выражения обычно выглядит следующим образом $VAR=~/PATTERN/. Если перемен- ная в выражении опущена, Perl использует $_ как переменную по умолчанию, в результате чего цикл и регулярное выражение соответ- ствуют друг другу. Однако если слишком полагаться на переменные по умолчанию, то код на языке Perl может получиться неясным. В данном же случае использование переменных, определенных по умол- чанию, делает код более коротким и лучше читаемым. Далее обратите внимание на регулярное выражение, имеющее форму /^field=(. *)/. Данное выражение указывает на необходи- мость начать поиск от начала строки, что предотвращает совпаде- ния в середине имени другого поля. Иными словами, имя поля и знак равенства (=) должны соответствовать сами себе. Остающаяся часть регулярного выражения соответствует значению поля и извлекает его в переменную $1. Поскольку $1 представляет собой временную пере- менную, то скрипт копирует ее в переменную с именем для каждого поля. Скрипт использует подпрограмму decode для декодирования символов из полей, которые были закодированы броузером. Регуляр- ные выражения, используемые подпрограммой декодирования, рассмат- ривались в предыдущем примере. Наконец, скрипт использует подпрограмму html, чтобы закоди- ровать значения данных для вывода их в тексте HTML. Скрипт может послать большую часть текста броузеру в виде HTML-документа без выполнения какой-либо обработки. Однако поскольку HTML ис- пользует угловые скобки () для кодирования НТМL-входов, скрипт должен закодировать эти скобки, используя последовательности HTML < и >. ДЕКОДИРОВАНИЕ HTML-ФОРМ С ПОМОЩЬЮ МЕТОДА POST Следующий скрипт очень напоминает только что обсуждавшийся, за исключением того, что данный скрипт использует метод POST для посылки данных формы скрипу CGI. Метод POST дает директиву броу- зеру послать данные формы, используя стандартный вход скрипта, а не строку запросов. Полезность метода POST заключается в том, что он может обрабатывать большие объемы данных, тогда как метод GET ограничен пространством переменной сервера, а также длиной URL броузера. Для чтения данных со стандартного ввода скрипт может выз- вать функцию sys-read с нужным числом байт. Размер строки запро- са в байтах содержится в переменной окружения CONTENT_LENGTH. После того как скрипт прочел строку запросов, дальнейшая обработ- ка данных оказывается очень похожей на рассмотренную в предыду- щем примере. Для того чтобы сделать, этот скрипт более коротким, обработка строки запросов осуществляется с помощью несколько бо- лее сложного подхода: ($cgi_bin, $cgi_script) = ($0 =~ m:(.*)(.*):); $content_length = $ENV(CONTENT_LENGTH); if (!definet($query) || $query eq "") { # сгенерируем форму print

  • Был занят, занимался самообразованием, т.к. почувствовал что погряз в одном и том же. Расширяю кругозор, узнаю новое, к чему то стремлюсь, это очень интересно и занимает очень много времени.

    Теперь по делу.

    Операционная система у меня ubuntu ++ постоянно по работе приходится сидеть в консоли. Очень часто возникает задача, быстро по шаблону поменять что то в файле. Ответ на вскидку = sed. В свое время я читал про него, но понял что при помощи perl могу делать то же самое. Прошло время, sed я забыл совершенно, а вот perl тоже стал забываться, и я постоянно не могу найти пример однострочных скриптов.

    Теперь по порядку.

    Дано.
    Есть файл xx.txt в котором лежат числа от 1-го до 5-ти, каждое число, новая строка.



    1
    2
    3
    4
    5

    Хочется заменить все вхождения строки 3 на что то свое, пусть это будет строка "hello"

    Решение:

    cd@laptop:~/data/tmp$ perl -ig -ne "s/3/hello/;print $_; " xx.xx
    cd@laptop:~/data/tmp$ cat xx.xx
    1
    2
    hello
    4
    5


    cd@laptop:~/data/tmp$ perl -ig -pe "s/3/hello/; " xx.xx
    cd@laptop:~/data/tmp$ cat xx.xx
    1
    2
    hello
    4
    5
    cd@cd-acer:~/data/tmp$ ls *g
    9.jpg xx.xxg

    Объяснение.

    perl позволяет запускать однострочные скрипты, не создавая файл с кодом скрипта.

    Пример:

    cd@laptop:~/data/tmp$ perl -e "print "test\n""
    test
    cd@laptop:~/data/tmp$

    За это отвечает опция -e после которой идет код для выполнения.

    Однострочные скрипты, после кода, могут принимать параметром файл, а также, можно заставить выполнять код указанный -e для каждой строки.

    Пример:

    cd@laptop:~/data/tmp$ perl -ne "print ;" xx.xx
    1
    2
    hello
    4
    5

    Т.е. в данном случае мы попросили перл, выполнить распечатку строки по умолчанию, а т.к. была указана опция -n то это команда применялась к каждой строке файла xx.xx, т.е. получили cat

    Также существует параметр -p, который после выполнения кода распечатывает строку. Т.е. логично что команда вида


    perl -ne "dosmth; print $_;" file

    будет аналогична

    perl -pe "dosmth" file

    Ну а теперь завершая. Мы добились того, что можем выполнять любые операции над каждой строкой в файле, и печатать это в stdout, однако первоначальная постановка задачи, звучала как замена строк в файле на лету. Именно для этого и существует опция -i


    perl -i -pe "dosmth" file

    выполнит код dosmth для отдельно взятой строки и заменит ее в указанном файле.

    опция -i может принимать необязательный параметр, и тогда, скрипт перед началом работы сделает backup копию файла


    cd@laptop:~/data/tmp/1$ perl -ibak -ne "print;" 1.txt
    cd@laptop:~/data/tmp/1$ ls
    1.txt 1.txtbak
    cd@laptop:~/data/tmp/1$ cat 1.txt
    1
    2
    3
    cdlaptop:~/data/tmp/1$ cat 1.txtbak
    1
    2
    3
    cd@laptop:~/data/tmp/1$

    Теперь само решение должно быть понятно, а также понятно почему я привел два варианта.

    Появилась простая задачка, в одном из конфигов нужно увеличивать на единицу одно из значений, пусть условно это будет номер билда.

    Возьмем пример файла конфига

    cd:$ cat config
    Key1 Value2
    build=projectname.005
    one more line

    Допустим нам нужно получить такой же конфиг но с build=projectnam.006


    perl -i -pe "s/(projectname\.)(\d+)/sprintf("%s%03d", $1, $2+1)/e" config

    Пояснения.

    I -pe объяснялось выше.

    Что изменилось? В конце регулярного выражения добавился флаг e, который означает что правая часть выражения будет выполняться как код perl и только после выполнения результат подставится для замены.

    Можно было бы конечно сделать что то вроде


    perl -pe "s/(projectname\.)(\d+)/$1 . ($2+1)/e" config
    Key1 Value2
    build=projectname.6
    one more line

    ! опция -i была убрана, я хотел чтобы файл не менялся, а результат был в output

    Как видим пропадают два ведущих нуля, именно поэтому была использована функция sprintf

    4 comments:

    Анастасия said...

    Спасибо. Пригодилось:)
    Если нет возражений, я дала на Ваш блог ссылку в своем http://aal-blog.blogspot.com/2009/10/stroka1-stroka2.html

    said...

    Без проблем. Рад хоть что то пригодилось.

    Anonymous said...

    Есть вопрос...
    Возможно ли запуская скрипт дать ему на обработку данные.
    Например запускаю скрипт совмещения двух баз там идёт запрос месяцев... потом передача вывода на печать...
    тоесть хотелось бы чтоб данные поступали в скрипт с запуском...
    Заранее спасибо

    Удобная система для организации он-лайнового сервера аукционов.

    Возможности программы:

  • Регистрация пользователей.
  • E-mail подтверждения.
  • Защита паролем.
  • Автоматическое закрытие аукциона.
  • Встроенная поисковая система.
  • Восстановление забытого пароля.
  • Встроенная система помощи.
  • Неограниченное количество категорий и подкатегорий.
  • Настраиваемый внешний вид.
  • История торгов по каждому товару.
  • Администраторский интерфейс.
  • Просмотр закрытых аукционов.
  • Сортировка аукционов.
  • Возможность просмотра горячих аукционов и тех, которые скоро закроются.
  • Поддержка формы-почтой для вопросов администратору сервера.
  • И многое другое...
  • DirectMailer 1.6.9 1.6.9

    Edit

    Если у вас на Unix-сервере нет ftp-клиента или вы по каким-то причинам не хотите давать своим пользователям доступ по ftp для редактирования страничек, тогда Вы можете воспользоваться этим скриптом. Он позволяет Вашим пользователям с помощью Веб-формы редактировать свою страничку на сервере.

    WebCode Chat v1.0

    Plain Text Counter

    Простой текстовый счетчик. Требует SSI. Может использоваться как для отдельной странички, так и для всего сайта. Программа автоматически создает log файл для каждой страницы сайта в отдельности.

    Jozefina v1_final

    Полноценный коммерческий комплект скриптов на языке perl для создания интернет сервиса “Доска объявлений”.
    Данная web-система позволяет очень простыми средствами и без специальных знаний создать собственную интернет доску объявлений. Система имеет удобный интерфейс администратора, позволяющий управлять всем, что происходит в доске, просто выбирая нужные пункты прямо в вашей программе просмотра интернет страниц, без знаний языков программирования и навыков администратора.
    Вы можете применить данную систему что бы:
    Организовать бизнес в сети интернет.
    Повысить его посещаемость уже имеющегося интернет проекта, дополнить его новым сервисом, сделать более ценным для посетителей.

    Системные требования.
    Операционная система хостинга: Free BSD или Open BSD или Linux.
    Место на хостинге: 0,1 mb / рубрика
    Поддержка CGI скриптов на языке perl.

    Обратите внимание: доска объявлений не требует MySQL и использует только один, самый распространённый модуль (CGI) языка perl.
    Вам не потребуется нанимать администратора для настройки доски объявлений под ваш хостинг, или тратить время на изучение языков программирования и средств администрирования баз данных.

    Fluid Dynamics Search Engine, V 2.0.0.0030

    Скрипт осуществляющий поиск по серверу. Скрипт очень просто установить, хотя настроить гораздо сложнее, особенно не зная English. Имеет огромное количество настроек, все настраивается через веб-интерфейс. Нуждается в MySQL, поэтому если ваш сервер не позволяет вам использовать эту СУБД скрипт для вас будет бесполезен.

    SSI Random Text Displayer v1.01

    При помощи данной программы вы всегда сможете отображать на вашей страничке что-нибудь новое, так как она предназначена для случайного отображения текста. Для работы программы, вы должны создать базу данных, в которой будут содержаться все ваши цитаты (подсказки, анекдоты и т.д.), а программа будет случайным образом выбирать одну из них, и отображать на вашей страничке.

    Stat Lite v1.0

    Stat Lite - это набор perl скриптов, который
    поможет вам получить статистику вашего
    виртуального веб-сервера. В первую очередь
    данный програмный продукт ориентировать на
    малые веб-сервера с количеством
    поситителей не более 1000 человек в день.

    С помощью данного пакета вы сможете:


    • просмотреть статистику за необходимый
      месяц и год
    • cтатистика хостов и хитов
    • хранить суммарную статистику за весь
      срок использования скрипта
    • просматривать статистику через веб
    • просматривать отчеты в текстовом и
      графическом виде (графики)

    Для работы скрипта нужен
    скомпилированный Perl с модулем GD (графическая
    библиотека).

    Бесплатная версия. Единственное условие
    установки на ваш сайт - наличие ссылки на
    автора в нижней части.

    Mailing List Manager v4.0 (NT)

    Данная программа предназначена для управления листами рассылки. Программа обладает удобным администраторским интерфейсом, при помощи которого вы легко сможете отправить письмо любому из подписчиков индивидуально, отредактировать список (удалить/изменить адрес). Кроме того, подписчики (посетители) самостоятельно могут вносить себя в список рассылки или отказываться от подписки. Для того, чтобы внести свой адрес в лист рассылки, посетитель должен заполнить небольшую форму, в которую необходимо ввести адрес электронной почты, свое имя и выбрать (из списка) тему подписки.

    Так сложилось, что я знаю как минимум двух человек, которые хотели бы выучить Perl. Специально для них я решил написать этот пост.

    • Часть 1: Типы переменных (вы читаете эту часть)

    В нем вы найдете примеры простых программ из серии «вывести числа от 1 до 5» и тому подобное. Мне всегда нравилось учиться на примерах — это интереснее и быстрее, чем по книжкам или на семинарах. Также можете посмотреть посты этого блога, — велика вероятность, что в них вы найдете еще примеры.

    Я предполагаю, что в школе/институте вы изучали Pascal/Delphi, C или хотя бы Basic, и объяснять, что такое функция и циклы не требуется. Если это не так — ничего страшного, просто для того, чтобы во всем разобраться, вам придется потратить лишнее время на чтение Википедии. Если вы не знаете, как запустить bash-скрипт, или для чего в первой строке скрипта писать что-то вроде #!/bin/sh , придется немного погуглить , чтобы это выяснить.

    Специально для тех, кого интересуют вопросы, «а правда ли, что Perl очень сложен», «а какие книжки по Perl можете посоветовать» и даже «эээ… а что, на нем еще пишут?», я написал Mini-FAQ по Perl , которое вы можете прочитать на HabraHabr. А для тех, кто неасилил многабукв здесь я приведу краткое его содержание:

    • Perl — современный язык программирования, на котором пишут и будут писать еще очень долго.
    • Perl, как и любой другой язык программирования, имеет свои достоинства, недостатки и области применения. Существует действительно большой класс задач, которые Perl решает на 5+.
    • Синтаксис Perl не сложнее синтаксиса C++ или Java. В этом вы сможете убедиться, дочитав данный пост до конца.
    • Существуют хорошие и при этом недорогие учебники по Perl. Также в сети вы без труда найдете сообщество perl-программистов, говорящих на вашем родном языке.
    • Perl хорошо работает как под операционными системами семейства UNIX, так и под Злом Windows.

    Дополнение: Также я рекомендую вам ознакомиться со статьями Perl vs Python vs Ruby vs PHP и Жрецы программирования . Первая повествует о производительности различных скриптовых языков, вторая — об отличии PHP от других ЯП. Фанатам Пайтона советую прочитать заметку Тест производительности скриптов на Python . Надеюсь, что эти материалы помогут вам найти ответ на вопрос «чем хорош Perl».

    Привет, %username%!

    Итак, давайте уже напишем наш первый скрипт на Perl!

    #!/usr/bin/perl

    $name = shift () ;
    print ("Hello, $name!\n " ) ;

    Запускаем скрипт:

    $ chmod u+x 1 .pl
    $ ./ 1 .pl afiskon
    Hello, afiskon!

    Тут все очень просто:

    • Имена скалярных переменных (то есть не массивов и не хэшей, что это такое — см ниже) начинаются со знака доллара.
    • Функция shift возвращает очередной аргумент скрипта. Другими словами первый вызов shift() возвращает первый аргумент, второй вызов — второй аргумент и так далее.
    • Функция print() выводит строку, переданную в качестве аргумента.
    • В строку можно подставлять значения переменных (см строку 4). Подробнее о строках — см далее.

    Если пока не очень понятно — ничего страшного. Возможно, немного теории внесет чуть больше ясности.

    Типы переменных

    В Perl существует три основных типа переменных: скаляры (числа и строки), массивы — подобно тем, что используются в Pascal или C (иногда массивы еще называют векторами), и хэши (ассоциативные массивы).

    Скаляры мы уже использовали в предыдущем примере. Вот еще несколько примеров задания скаляров.

    #!/usr/bin/perl

    $a = 123 ;
    $b = - 7.496 ;
    $c = 0xABC; # равно 2748, да, это комментарий:)
    $d = ($a + $b ) / $c ;
    $d *= $a ; # тоже самое, что $d = $d * $a;

    $str1 = "hello" ;
    $str2 = "$str1, world" ; # в $str2 записано "hello, world"
    $str3 = $a . "\n " . $str2 ;
    $str4 = "$str1" ; # в $str4 записано "$str1", а не "hello"

    Тут мы задаем положительные и отрицательные, целые и дробные числа, задаем число в шестнадцатеричной кодировке, складываем, умножаем и делим — все как в Си или Java. Кроме перечисленных операций Perl также поддерживает операцию возведения в степень:

    $a = 2 ** 8 ; # результат: 256

    Со строками все примерно так же, как в каком-нибудь PHP. Точка означает операцию конкатенации (то есть «склеивания» строк), если в строке содержатся имена переменных, на их место подставляются значения, с помощью обратного слэша можно вставлять символы новой строки (\n), табуляции (\t), кавычки (\"), сам обратный слэш (\\) знак доллара безо всякой подстановки переменных (\$) и многое другое. Если строка в одинарных кавычках, символы в ней трактуются «как есть», без подстановки переменных и тд.

    Как и PHP, Perl интерпретирует скаляры, как числа или как строки в зависимости от операции. Все просто:

    $int1 = "11" + 22 ;
    # ^ строка "11" преобразуется в число,
    # после чего выполняется сложение, результат: 33.
    $str1 = "11" . 22 ;
    # ^ число 22 преобразуется в строку,
    # после чего выполняется конкатенация, результат: "1122".

    Правила преобразования из строки в число и наоборот тут те же, что и в PHP:

    $str1 = 0 . "abc" ;
    # ^ результат - "abc", число ноль преобразуется в пустую строку
    $int1 = "aaa" + 1 ;
    # ^ результат - 1, в строке "aaa" нет цифр
    $int2 = "12aaa" + 1 ;
    # ^ результат - 13, учитываются только первые цифры строки

    Кстати, для объявления длинных строк существуют специальные операторы — q и qq:

    # аналогично одинарным кавычкам
    $text = q {
    Do you have $15 ?
    } ;
    # аналогично двойным кавычкам
    $message = qq {
    Hello, $username !
    How are you?
    } ;

    Работа с массивами происходит следующим образом:

    #!/usr/bin/perl

    $scalar = "bebebebe" ;
    ($a , $b ) = (1 , 2 ) ; # тоже самое, что $a = 1; $b = 2;
    @arr = ("aaa" , 123 , $scalar , $a + $b ) ;
    print $arr [ 1 ] . "\n " ;
    push @arr , $a ;
    print pop (@arr ) . "\n " ;

    Здесь мы создаем массив @arr, состоящий из 4-х элементов (строка 5). Затем выводим второй элемент (строка 6). Нумерация элементов начинается с нуля, поэтому для вывода второго по счету элемента используется индекс 1. Затем кладем в конец массива значение переменной $a (функция push, строка 7), и тут же извлекаем и выводим его (функция pop, строка 8).

    Обратите внимание, имена массивов начинаются с «собаки», а не доллара (запомнить не сложно — соответствующие символы похожи на первые буквы английских названий типов: $ — scalar, @ — array). При обращении ко второму элементу массива (строка 6) использовался знак доллара, потому что элемент массива является скаляром. По началу это вызывает много путаницы, но вообще все логично.

    Еще в этом скрипте мы вызываем функции print и push без скобок. В Perl при вызове функции, везде, где это не вызывает неопределенности, скобки можно опустить.

    Для объявления массива, элементами которого являются строки без пробелов, существует специальный оператор — qw:

    @arr = qw/aaa bbb ccc/ ;
    # аналогично ("aaa", "bbb", "ccc"), только короче

    Хэши похожи на массивы, но элементы в хэше не упорядочены. При этом в качестве ключа, по которому производится доступ к элементу, могут использоваться строки.

    #!/usr/bin/perl

    %hash = ( # при объявлении хэшей и массивов можно
    "x" => 12 , # использовать перенос строк
    y => 53 , # если в ключе нет спец-символов, кавычки не нужны
    "z" => - 10.5 , # запятую на конце можно оставлять
    ) ;

    $hash { "x" } ++; # координата по x теперь равна 13
    $hash { y } --; # координата по y теперь равна 52

    # выводим координаты
    print "x = $hash{x}, y = $hash{y}, z = $hash{z}\n " ;

    Имена хэшей начинаются со знака процента, для обращения к элементу используются фигурные скобки (а не квадратные, как в случае с массивами). Если имя ключа заранее известно, можно указывать его без кавычек (строка 10).

    Кстати, переменные $test, @test и %test — это совершенно независимые друг от друга переменные разного типа.

    В этом месте я хотел перейти к условным операторам и циклам for/while, но понял, что для одного поста текста и так уже многовато. Между тем за кадром остались многие вопросы:

    • Условные операторы;
    • Циклы for и while;
    • Объявление функций;
    • Работа с потоками и файлами;
    • Строгий синтаксис;
    • Использование готовых модулей и классов.

    Об этом я напишу в одной из следующих заметок. Хотелось бы получить хотя бы парочку комментариев на этот пост — интересно/неинтересно, понятно/непонятно и так далее. Кстати, если у вас есть вопросы, связанные с Perl (не обязательно с этим постом) — смело задавайте их в комментариях!

    Надеюсь, серия постов о программировании на Perl поможет вам написать ваши первые простенькие скрипты. Со временем скрипты будут становится сложнее, в них станут использоваться новые технологии (ООП, регулярные выражения) и через какое-то время вы обнаружите, что знаете о Perl достаточно, чтобы делиться опытом с другими.