Самоучитель PHP: Глава 3. Основы синтаксиса PHPКак выглядит PHP-программаВ отличие от традиционных скриптовых языков (таких, как Perl), PHP-программа представляет собой HTML-страницу со вставками кода. Для сравнения: Perl-скрипт:
PHP-скрипт (да-да, это программа на PHP ;)):
Как видите, простейшая программа на PHP - это обычная HTML-страница. О выводе заголовка Content-type: text/html PHP тоже позаботился самостоятельно. Непосредственно PHP-код (который - не HTML:) размещается между тэгами <? и ?>. Все, что расположено между этими тэгами, заменяется на выведенный скриптом внутри этого блока HTML-кодом (в частном случае - если скрипт ничего не выводит - просто "исчезает"). Вообще, универсальный (то есть - гарантированно
работающий при любой конфигурации PHP), но более длинный способ
спецификации PHP-кода - тэги <?php ...
?>.
Такая длинная форма записи используется при совмещении XML и PHP, так как
тэг <? ... ?>
используется в стандарте XML.
За распознавание тэга <? как начала PHP-блока отвечает директива short_open_tag файла php.ini(по умолчению - включена). Если вы хотите разрабатывать скрипты, работающие независимо от данной настройки, используйте длинный открывающий тэг <?php. Я буду использовать сокращенную форму. Рассмотрим простой пример.
Для выполнения примеров,
скопируйте их в файл, расположенный в каталоге, соответствующий
директиве DocumentRoot файла конфигурации Apache httpd.conf
(например, в файл с именем test.php), и выполните их, обратившись
к сохраненному скрипту (test.php) из адресной строки браузера
(http://localhost/test.php). Ну а если вы еще не установили
Apache+PHP (как же так? ;), обратитесь к предыдущей
главе.
Если сегодня - 27-е июля 2004 года, в результате исполнения скрипта браузер получит следующий HTML-код:
Строки 5,6,7 - вставка PHP-кода. На строках 5 и 7 расположены соответственно открывающий и закрывающий тэг. Их совершенно необязательно располагать на отдельных строках - это сделано по соображениям удобства чтения. В строке 6 расположен оператор echo, используемый для вывода в браузер. Выводит же он результат выполнения функции date - в данном случае это текущая дата. Строка 6 является законченным выражением. Каждое выражение в PHP заканчивается точкой с запятой - ;. Именно точкой с запятой, а не переводом строки - не забывайте об этом, особенно если вы раньше программировали на Visual Basic или ASP. Внимательный читатель заметит, что тэг </body>
расположен на той же строке, что и текст, сформированный функцией date(),
хотя в исходном коде </body> находится на отдельной строке. Дело в
том, что PHP отбрасывает перевод строки, следующий сразу после закрывающего
тэга ?> - это сделано специально, чтобы в фрагментах HTML, где
лишние пробелы нежелательны, не было необходимости жертвовать
читабельностью скрипта, записывая закрывающий PHP-тэг на одной строке с
последующим HTML-кодом. Если же пробел необходим - вставьте после
?> пустую строку.
Переменные и типы данныхПеременные в PHP начинаются со знака $, за которыми следует произвольный набор латинских букв, цифр и знака подчеркивания: _, при этом цифра не может следовать сразу за знаком $. Регистр букв в имени переменной имеет значение: $A и $a -
это две разные переменные.
Для присваивания переменной значения используется оператор =. Пример:
Данный код выведет: testtest100. Следите за тем, какие имена вы даете переменным: вряд ли вы
через полгода вспомните, для чего используется переменная $a21 или
$zzz. :) А вот для чего используется переменная $username,
понять довольно легко.
В строке 2 переменной $a присваивается строковое значение 'test'. Строки в PHP записываются в кавычках - одинарных или двойных (различие между записями в разных кавычках мы рассмотрим чуть позже). Также справедливо высказывание, что переменная $a инициализируется значением 'test': в PHP переменная создается при первом присваивании ей значения; если переменной не было присвоено значение - переменная не определена, то есть ее просто не существует. В строке 3 переменная $copyOf_a инициализируется значением переменной $a; в данном случае (смотрим строку 2) это значение - строка 'test'. В строке с номером 4 переменной с именем $Number100 присваивается числовое значение 100. Как видите, в PHP существует типизация, то есть язык различает типы данных - строки, числа и т.д. Однако, при этом PHP является языком со слабой типизацией - преобразования между типами данных происходят автоматически по установленным правилам. Например, программа <? echo '100' + 1; ?> выведет число 101: строка автоматически преобразуется в число при использовании в числовом контексте (в данном случае - строка '100', при использовании в качестве слагаемого, преобразуется в число 100, так как операция сложения для строк не определена). Такое поведение (а также отсутствие необходимости
(и даже возможности) явно определять переменные) роднит PHP с Perl и Basic,
однако, возможно, будет встречено в штыки приверженцами строгих
языков, таких как Си и Pascal. Конечно, необходимость четкого
определения переменных и требование явного приведения типов
уменьшает число возможных ошибок программирования, однако,
PHP, прежде всего, - интерпретируемый язык для быстрой разработки скриптов,
и нестрогость синтаксиса с лихвой компенсируется скоростью кодинга.
А о неинициализированной переменной PHP всегда услужливо сообщит - если,
конечно, ему этого не запрещать... Впрочем, я забегаю вперед.
Рассмотрим еще один пример:
Особого внимания заслуживает четвертая строка. Внутри двойных кавычек указаны переменные, определенные в предыдущих строках. Если выполнить эту программу (вы ведь это уже сделали? :)), в окне браузера отобразится строка Привет, Вася!. Собственно, в этом и заключается основная особенность двойных кавычек: имена переменных, указанных внутри пары символов ", заменяются на соответствующие этим переменным значения. Помимо этого, внутри двойных кавычек распознаются специальные управляющие комбинации, состоящие из двух символов, первый из которых - обратный слэш (\). Наиболее часто используются следующие управляющие символы:
Символы \r и \n обычно используются вместе, в виде комбинации \r\n - так обозначается перевод строки в Windows и многих TCP/IP-протоколах. В Unix новая строка обозначается одним символом \n; обычно такой способ перевода строки используется и в HTML-документах (конечно же, это влияет только на HTML-код, но не отображение в браузере (если только текст не заключен в пару тэгов <pre>...</pre>): для отображаемого перевода строки, как известно, используется тэг <br>). Оставшиеся три пункта из приведенного списка применения обратного слэша являются примерами экранирования - отмены специального действия символа. Так, двойная кавычка обозначала бы конец строки, символ доллара - начало имени переменной, а обратный слэш - начало управляющей комбинации (о которых мы тут и говорим ;)). При экранировании, символ воспринимается "как он есть", и никаких специальных действий не производится. Экранирование (не обратный слэш, а сам принцип ;)) в PHP используется во многих случаях
- так что с этим подходом мы еще не раз встретимся.
Если в данном кавычки заменить на одинарные, в браузере отобразится именно то, что внутри них написано ($greeting, $name!). Комбинации символов, начинающиеся с \, в одинарных кавычках также никак не преобразуются, за двумя исключениями: \' - одинарная кавычка внутри строки; \\ - обратный слэш (в количестве одна штука :). Немного изменим наш последний пример:
На этот раз мы не стали пользоваться "услужливостью" двойных кавычек: в строке 4 имена переменных и строковые константы записаны через оператор конкатенации (объединения строк). В PHP конкатенация обозначается точкой - .. Результат выполнения этой программы аналогичен предыдущему примеру. Я рекомендую использовать именно этот способ записи - на то есть достаточно причин:
Однако, двойные кавычки весьма популярны, и вы их наверняка встретите во множестве скриптов, доступных в сети. Кстати, в последних двух примерах совершенно нет необходимости
в определении переменной $message: строки 4 и 5 можно сократить
до echo $greeting . ',' . $name . '!';.
Ну а если переменная $message нам может понадобиться в
нижеследующем коде - можно написать
echo $message = $greeting . ',' . $name . '!';,
и это сработает. Связано это с тем, что результатом выражения,
содержащего присваивние, является присвоенное значение. Это особенно
удобно при присваивании одного и того же значения нескольким переменным.
Например, если переменным $a и $b нужно присвоить
одно и то же значение (скажем, число с плавающей запятой 10.34), можно написать
$a = $b = 10.34;.
В PHP предусмотрено множество встроенных функций для работы со строками, но пока их рассматривать преждевременно. Строковым функциям посвящена отдельная глава самоучителя. Помимо строк и чисел, существует еще один простой, но важный тип данных - булевый (bool), к которому относятся два специальных значения: true (истина) и false (ложь). При автоматическом приведении типов, false соответствует числу 0 и пустой строке (''), true - всему остальному. Булевые значения часто применяются совместно с условными операторами, о которых мы дальше и поговорим. Условные операторыifЧасто (да что тут говорить, практически в любой программе) возникает необходимость выполнения разного кода в зависимости от определенных условий. Рассмотрим пример:
Здесь используется оператор if..else - условный оператор.
В общем виде он выглядит так: В данном случае, условием является результат сравнения значений
переменных \$i и \$j. Оператор сравнения - == -
два знака равенства. Поскольку 5*2 равняется 10, и, соответственно,
10 равняется 10 ;), выполнится строка 5, и мы увидим, что переменные
имеют равные значения. Измените, например, строку 2 на
$i = 11, и вы увидите, что выполнится
оператор echo из строки 7 (так как условие ложно).
Помимо ==, есть и другие операторы сравнения:
Поэкспериментируйте, изменяя оператор сравнения и значения переменных.
(Для логической правильности вывода на экран, потребуется, конечно, изменить
и тексты, выводимые операторами echo :)).
Если требуется только выполнить
действие, если условие выполняется, блок
else ...можно опустить:
В этом случае, если условие ложно, в браузер не выведется ничего.
Отступы перед строками echo ... сделаны
для удобства чтения, но PHP они ни о чем не говорят. Следующий пример работает
не так, как можно ожидать:
Вопреки возможным ожиданиям, строка 6 выполнится,
хотя условие ($i > $j) ложно. Дело в том, что к if(...) относится лишь
следующее выражение - строка 5. Строка 6 же выполняется в любом случае -
действие if(..) на нее уже не распространяется. Для получения нужного
эффекта следует воспользоваться блоком операторов,
который задается фигурными скобками:
Теперь все работает правильно.
Фигурные скобки можно использовать, даже если внутри - только один оператор.
Я рекомендую поступать именно так - меньше шансов ошибиться. На производительности
это никак не сказывается, зато повышает читабельность.
Часто нужно ввести дополнительные условия (если так... а если по-другому... иначе)
или даже (если так.. а если по-другому.. а если еще по-другому... иначе):
Для дополнительных "развилок" используется оператор
if... else if ... else. Как и в случае с
if, блок else может отсутствовать.
Следуя свой же недавней рекомендации, я заключил все операторы
echo в фигурные скобки, хотя все бы прекрасно работало и без оных.
Кстати, в строке 8 - комментарий. Это информация для человека,
PHP ее игнорирует. Комментарии бывают двух видов: однострочный,
как здесь - начинается с // и распространяется
до конца строки, и многострочный - комментарием считается все,
что расположено между парами символов /*
и */.
Бывает необходимость осуществления "развилки" в зависимости
от значения одной и той же переменной или выражения.
Можно написать что-то вроде:
Но существует более удобный для этого случая оператор - switch.
Выглядит это так:
Понаблюдайте за результатом выполнения программы, меняя значение
$i во второй строке. Как вы уже наверняка поняли,
после switch в скобках указывается переменная (хотя там может быть
и выражение - например, $i+1 - попробуйте :)), а строки
case XXX соответствуют значению того, что в скобках.
Операторы, находящиеся между case-ами, не нужно заключать в фигурные
скобки - каждое ответвление заканчивается оператором break.
Специальное условие default соответствует "всему остальному" (аналог else в if...else if..else).
default всегда располагется последним, так что break здесь
необязателен.
Как и в случае с else, условие default может отсутствовать.
Если вы вдруг забудете указать break, будут выполняться
все последующие строки - из последующих case-ов! Например,
если в нашем примере удалить строку 6, при $i==1 в браузер выведется
"одиндва". Некоторые чересчур хитрые программисты
используют этот трюк для указания нескольких вариантов значений:
или для выполнения при определенном значении условия двух действий подряд.
Но это уже ухищрения - лучше всего использовать switch "как положено",
заканчивая каждый case своим break-ом; а если уж "ухищряетесь" - не забудьте
поставить комментарий, как это сделано в строке 5 последнего примера.
Любой более-менее серьезный язык программирования содержит
операторы огранизации циклов для повторного выполнения
фрагментов кода. В PHP есть три таких оператора.
Начнем с цикла while:
Цикл while (строка 3) работает следующим образом.
Сначала проверяется истинность выражения в скобках. Если оно не истинно,
тело цикла (все, что расположено между последующими фигурными скобками - или,
если их нет - следующая инструкция) не выполняется. Если же оно истинно,
после выполнения кода, находящегося в теле цикла, опять проверяется истинность
выражения, и т.д.
В теле цикла (строки 4,5) выводится текущее значение переменной $i,
после чего значение $i увеличивается на единицу.
Переменную, используемую подобно $i в данном примере,
часто называют переменной-счетчиком цикла, или просто счетчиком.
Если бы мы не увеличвали значение $i, выход из цикла никогда бы
не произошел ("вечный цикл").
Запишем тот же пример в более краткой форме:
И еще один вариант:
Советую немного поразмыслить, почему все эти три программы работают
одинаково. Заметьте, что в зависимости от начального значения счетчика
удобнее та или иная форма записи.
Цикл do..while практически аналогичен циклу while, отличаясь
от него тем, что условие находится в конце цикла. Таким образом,
тело цикла do..while выполняется хотя бы один раз.
Пример:
Цикл for - достаточно универсальная конструкция. Он может выглядеть как просто, так и очень запутанно.
Рассмотрим для начала классический вариант его использования:
Как и в предыдущих примерах, этот скрипт выводит в браузер
числа от 1 до 9. Синтаксис цикла for в общем случае такой:
for(выражение_1;выражение_2;выражение_3),
где выражение_1 выполняется перед выполнением цикла,
выражение_2 - условие выполнения цикла (аналогично while),
а выражение_3 выполняется после каждой итерации цикла.
Запутались? ;) Перепишем "общий случай" цикла for
в переложении на цикл while:
Надеюсь, теперь все понятно. :) Точно понятно? Тогда разберитесь
в этом цикле:
Может вознкнуть необходимость выхода из цикла при определенном
условии, проверяемом в теле цикла. Для этого служит оператор break,
с которым мы уже встречались, рассматривая switch.
Этот цикл выведет только значения от 1 до 5. При $i==5 сработает
условный оператор if в строке 5, и выполнение цикла прекратится.
Оператор continue начинает новую итерацию цикла. В следующем примере с
помощью continue "пропускается" вывод числа 5:
Операторы break и continue можно использовать совместно со всеми видами циклов.
Циклы могут быть вложенными (как практически все в PHP): внутри
одного цикла может располагаться другой цикл, и т.д. Операторы break
и continue имеют необязательный числовой параметр, указывающий,
к какому по порядку вложенности циклу - считая снизу вверх от текущей
позиции - они относятся (на самом деле, break - это сокращенная запись
break 1 - аналогично и с continue). Пример выхода
из двух циклов сразу:
Массив представляет собой набор переменных, объединенных одним именем. Каждое значение
массива идентифицируется индексом, который указывается после имени переменной-массива
в квадратных скобках. Комбинацию индекса и соответствующего ему значения называют элементом массива.
В приведенном примере, в строке три объявляется элемент массива $a с индексом
1; элементу массива присваивается строковое значение 'abc'.
Этой же строкой объявляется и массив $a, так как это первое упоминание переменной $a в контексте массива,
массив создается автоматически. В строке 4 элементу массива с индексом 2 присваивается числовое значение 100.
В строке же 5 значение, равное разности $i и $a[2], присваивется элементу массива $a со строковым индексом
'test'.
Как видите, индекс массива может быть как числом, так и строкой.
В предыдущем примере массив создавался автоматически при описании первого
элемента массива. Но массив можно задать и явно:
Созданный в последнем примере массив $a полностью аналогичен массиву из предыдущего примера.
Каждый элемент массива здесь задается в виде индекс=>значение.
При создании элемента 'test' пришлось указать значение 100 непосредственно, так как на этот раз мы создаем
массив "одним махом", и значения его элементов на этапе создания неизвестны PHP.
В строке 4 для вывода значения массива мы воспользовались функцией print_r(), которая очень удобна для
вывода содержимого массивов на экран - прежде всего, в целях отладки.
Если явно не указывать индексы, то здесь проявляется свойство массивов PHP, характерное для числовых
массовов в других языках: очередной элемент будет иметь порядковый числовой индекс. Нумерация начинается с нуля.
Пример:
Вывод:
Здесь мы явно не указывали индексы: PHP автоматически присвоил числовые индексы, начиная с нуля.
При использовании такой формы записи массив можно перебирать с помощью цикла for. Количество элементов массива
возвращает оператор count (или его синоним, sizeof):
Стили записи можно смешивать. Обратите внимание на то, какие индексы автоматически присваиваются PHP
после установки некоторых индексов вручную.
Массив, подобный предыдущему, перебрать с помощью for затруднительно.
Для перебора элементов массива предусмотрен специальный цикл foreach:
Этот цикл работает следующим образом: в порядке появления в коде программы элементов массива $languages,
переменным $key и $value присваюваются соответственно индекс и значение очередного элемента,
и выполняется тело цикла.
Если индексы нас не интересуют, цикл можно записать следующим образом:
foreach ($languages as $value).
В дополнение к уже рассмотренной конструкции array, существует дополняющая
ее конструкция list, являющаяся своего рода антиподом array: если последняя
используется для создания массива из набора значений, то list, напротив,
заполняет перечисленные переменные значениями из массива.
Допустим, у нас есть массив $lang = array('php', 'perl', 'basic').
Тогда конструкция list($a, $b) = $lang присвоит
переменной $a значение 'php', а $b - 'perl'. Соответственно,
list($a, $b, $c) = $lang дополнительно присвоит $c = 'basic'.
А если нас интересуют не только значения, но и индексы? Воспользуемся конструкцией each, которая
возвращает пары индекс-значение.
На первый взгляд может удивить тот факт, что в строках 8-10 переменным
присваиваются разные значения, хотя выражения справа от знака присваивания
совершенно одинаковые. Дело в том, что у каждого массива есть скрытый указатель
текущего элемента. Изначально он указывает на первый элемент. Конструкция
each же продвигает указатель на один элемент вперед.
Эта особенность позволяет перебирать массив с помощью обычных циклов while и for.
Конечно, ранее рассмотренный цикл foreach удобнее, и стоит предпочесть его,
но конструкция с использованием each довольно распространена, и вы можете ее
встретить во множестве скриптов в сети.
После завершения цикла, указатель текущего элемента указывает на конец массива.
Если цикл необходимо выполнить несколько раз, указатель надо принудительно сбросить
с помощью оператора reset:
reset($browsers). Этот оператор устанавливает указатель
текущего элемента в начало массива.
Мы рассмотрели только самые основы работы с массивами. В PHP существует множество
разнообразных функций работы с массивами - им посвящена
отдельная глава Самоучителя.
В отличие от переменных, значение константы устанавливается
единожды и не подлежит изменению. Константы не начинаются с
символа $ и определяются с помощью оператора define:
Константы необязательно называть прописными буквами, но это
общепринятое (и удобное) соглашение.
Поскольку имя константы не начинается с какого-либо спецсимвола,
внутри двойных кавычек значение константы поместить невозможно (так
как нет возможности различить, где имя константы, а где - просто текст).
|