вильно обрабатывать ситуацию, когда вводимое число оказыва-
ется слишком длинным. Функция GETOP считывает цифры подряд
/возможно с десятичной точкой/ и запоминает их, пока после-
довательность не прерывается. Если при этом не происходит
переполнения, то функция возвращает NUMBER и строку цифр.
Если же число оказывается слишком длинным, то GETOP отбрасы-
вает остальную часть строки из файла ввода, так что пользо-
ватель может просто перепечатать эту строку с места ошибки;
функция возвращает TOOBIG как сигнал о переполнении.
GETOP(S, LIM) /* GET NEXT OPRERATOR OR OPERAND */
CHAR S[];
INT LIM;
{
INT I, C;
WHILE((C=GETCH())==' '\!\! C=='\T' \!\! C=='\N')
;
IF (C != '.' && (C < '0' \!\! C > '9'))
RETURN©;
S[0] = C;
FOR(I=1; (C=GETCHAR()) >='0' && C <= '9'; I++)
IF (I < LIM)
S[I] = C;
IF (C == '.') { /* COLLECT FRACTION */
IF (I < LIM)
S[I] = C;
FOR(I++;(C=GETCHAR()) >='0' && C<='9';I++)
IF (I < LIM)
S[I] =C;
}
IF (I < LIM) { /* NUMBER IS OK */
UNGETCH©;
S[I] = '\0';
RETURN (NUMBER);
} ELSE { /* IT'S TOO BIG; SKIP REST OF LINE */
WHILE (C != '\N' && C != EOF)
C = GETCHAR();
S[LIM-1] = '\0';
RETURN (TOOBIG);
}
}
· 88 -
Что же представляют из себя функции 'GETCH' и 'UNGETCH'?
Часто так бывает, что программа, считывающая входные данные,
не может определить, что она прочла уже достаточно, пока она
не прочтет слишком много. Одним из примеров является выбор
символов, составляющих число: пока не появится символ, от-
личный от цифры, число не закончено. Но при этом программа
считывает один лишний символ, символ, для которого она еще
не подготовлена.
Эта проблема была бы решена, если бы было бы возможно
“прочесть обратно” нежелательный символ. Тогда каждый раз,
прочитав лишний символ, программа могла бы поместить его об-
ратно в файл ввода таким образом, что остальная часть прог-
раммы могла бы вести себя так, словно этот символ никогда не
считывался. к счастью, такое неполучение символа легко имми-
тировать, написав пару действующих совместно функций. Функ-
ция GETCH доставляет следующий символ ввода, подлежащий рас-
смотрению; функция UNGETCH помещает символ назад во ввод,
так что при следующем обращении к GETCH он будет возвращен.
То, как эти функции совместно работают, весьма просто.
Функция UNGETCH помещает возвращаемые назад символы в сов-
местно используемый буфер, являющийся символьным массивом.
Функция GETCH читает из этого буфера, если в нем что-либо
имеется; если же буфер пуст, она обращается к GETCHAR. При
этом также нужна индексирующая переменная, которая будет
фиксировать позицию текущего символа в буфере.
Так как буфер и его индекс совместно используются функ-
циями GETCH и UNGETCH и должны сохранять свои значения в пе-
риод между обращениями, они должны быть внешними для обеих
функций. Таким образом, мы можем написать GETCH, UNGETCH и
эти переменные как:
#DEFINE BUFSIZE 100
CHAR BUF[BUFSIZE]; /* BUFFER FOR UNGETCH */
INT BUFP = 0; /* NEXT FREE POSITION IN BUF */
GETCH() /* GET A (POSSIBLY PUSHED BACK) CHARACTER */
{
RETURN((BUFP > 0) ? BUF[--BUFP] : GETCHAR());
}
UNGETCH© /* PUSH CHARACTER BACK ON INPUT */
INT C;
{
IF (BUFP > BUFSIZE)
PRINTF(“UNGETCH: TOO MANY CHARACTERS\N”);
ELSE
BUF [BUFP++] = C;
}
Мы использовали для хранения возвращаемых символов массив, а
не отдельный символ, потому что такая общность может приго-
диться в дальнейшем.
· 89 -
Упражнение 4-4.
Напишите функцию UNGETS(S) , которая будет возвращать во
ввод целую строку. Должна ли UNGETS иметь дело с BUF и BUFP
или она может просто использовать UNGETCH ?
Упражнение 4-5.
Предположите, что может возвращаться только один символ. Из-
мените GETCH и UNGETCH соответствующим образом.
Упражнение 4-6.
Наши функции GETCH и UNGETCH не обеспечивают обработку возв-
ращенного символа EOF переносимым образом. Решите, каким
свойством должны обладать эти функции, если возвращается
EOF, и реализуйте ваши выводы.
4.6. Статические переменные.
Статические переменные представляют собой третий класс
памяти, в дополнении к автоматическим переменным и EXTERN, с
которыми мы уже встречались.
Статические переменные могут быть либо внутренними, либо
внешними. Внутренние статические переменные точно так же,
как и автоматические, являются локальными для некоторой фун-
кции, но, в отличие от автоматических, они остаются сущест-
вовать, а не появляются и исчезают вместе с обращением к
этой функции. это означает, что внутренние статические пере-
менные обеспечивают постоянное, недоступное извне хранение
внутри функции. Символьные строки, появляющиеся внутри функ-
ции, как, например, аргументы PRINTF , являются внутренними
статическими.
Внешние статические переменные определены в остальной
части того исходного файла, в котором они описаны, но не в
каком-либо другом файле. Таким образом, они дают способ
скрывать имена, подобные BUF и BUFP в комбинации
GETCH-UNGETCH, которые в силу их совместного использования
должны быть внешними, но все же не доступными для пользова-
телей GETCH и UNGETCH , чтобы исключалась возможность конф-
ликта. Если эти две функции и две переменные объеденить в
одном файле следующим образом
STATIC CHAR BUF[BUFSIZE]; /* BUFFER FOR UNGETCH */
STATIC INT BUFP=0; /*NEXT FREE POSITION IN BUF */
GETCH() {...}
UNGETCH() {...}
то никакая другая функция не будет в состоянии обратиться к
BUF и BUFP; фактически, они не будут вступать в конфликт с
такими же именами из других файлов той же самой программы.
Статическая память, как внутренняя, так и внешняя, спе-
цифицируется словом STATIC , стоящим перед обычным описани-
ем. Переменная является внешней, если она описана вне какой
бы то ни было функции, и внутренней, если она описана внутри
некоторой функции.
· 90 -
Нормально функции являются внешними объектами; их имена
известны глобально. возможно, однако, объявить функцию как
STATIC ; тогда ее имя становится неизвестным вне файла, в
котором оно описано.
В языке “C” “STATIC” отражает не только постоянство, но
и степень того, что можно назвать “приватностью”. Внутренние
статические объекты определены только внутри одной функции;
внешние статические объекты /переменные или функции/ опреде-
лены только внутри того исходного файла, где они появляются,
и их имена не вступают в конфликт с такими же именами пере-
менных и функций из других файлов.
Внешние статические переменные и функции предоставляют
способ организовывать данные и работающие с ними внутренние
процедуры таким образом, что другие процедуры и данные не
могут прийти с ними в конфликт даже по недоразумению. Напри-
мер, функции GETCH и UNGETCH образуют “модуль” для ввода и
возвращения символов; BUF и BUFP должны быть статическими,
чтобы они не были доступны извне. Точно так же функции PUSH,
POP и CLEAR формируют модуль обработки стека; VAR и SP тоже
должны быть внешними статическими.
4.7. Регистровые переменные.
Четвертый и последний класс памяти называется регистро-
вым. Описание REGISTER указывает компилятору, что данная пе-
ременная будет часто использоваться. Когда это возможно, пе-
ременные, описанные как REGISTER, располагаются в машинных
регистрах, что может привести к меньшим по размеру и более
быстрым программам. Описание REGISTER выглядит как
REGISTER INT X;
REGISTER CHAR C;
и т.д.; часть INT может быть опущена. Описание REGISTER мож-
но использовать только для автоматических переменных и фор-
мальных параметров функций. В этом последнем случае описания
выглядят следующим образом:
F(C,N)
REGISTER INT C,N;
{
REGISTER INT I;
...
}
· 91 -
На практике возникают некоторые ограничения на регистро-
вые переменные, отражающие реальные возможности имеющихся
аппаратных средств. В регистры можно поместить только нес-
колько переменных в каждой функции, причем только определен-
ных типов. В случае превышения возможного числа или исполь-
зования неразрешенных типов слово REGISTER игнорируется.
Кроме того невозможно извлечь адрес регистровой переменной
(этот вопрос обсуждается в главе 5). Эти специфические огра-
ничения варьируются от машины к машине. Так, например, на
PDP-11 эффективными являются только первые три описания
REGISTER в функции, а в качестве типов допускаются INT, CHAR
или указатель.
4.8. Блочная структура.
Язык “C” не является языком с блочной структурой в смыс-
ле PL/1 или алгола; в нем нельзя описывать одни функции
внутри других.
Переменные же, с другой стороны, могут определяться по
методу блочного структурирования. Описания переменных (вклю-
чая инициализацию) могут следовать за левой фигурной скоб-
кой,открывающей любой оператор, а не только за той, с кото-
рой начинается тело функции. Переменные, описанные таким об-
разом, вытесняют любые переменные из внешних блоков, имеющие
такие же имена, и остаются определенными до соответствующей
правой фигурной скобки. Например в
IF (N > 0) {
INT I; /* DECLARE A NEW I */
FOR (I = 0; I < N; I++)
...
}
Областью действия переменной I является “истинная” ветвь
IF; это I никак не связано ни с какими другими I в програм-
ме.
Блочная структура влияет и на область действия внешних
переменных. Если даны описания
INT X;
F()
{
DOUBLE X;
...
}
То появление X внутри функции F относится к внутренней пере-
менной типа DOUBLE, а вне F - к внешней целой переменной.
это же справедливо в отношении имен формальных параметров:
INT X;
F(X)
DOUBLE X;
{
...
}
Внутри функции F имя X относится к формальному параметру, а
не к внешней переменной.
4.9. Инициализация.
Мы до сих пор уже много раз упоминали инициализацию, но
всегда мимоходом , среди других вопросов. Теперь, после того
как мы обсудили различные классы памяти, мы в этом разделе
просуммируем некоторые правила, относящиеся к инициализации.
Если явная инициализация отсутствует, то внешним и ста-
тическим переменным присваивается значение нуль; автомати-