Смекни!
smekni.com

Інтерпретатор muLisp (стр. 1 из 2)

Реферат на тему:

Інтерпретатор muLisp

1. Примітивні об’єкти даних

Примітивними об’єктами даних є символи, числа та конси. muLisp має безліч функцій розпізнання, порівняння, комбінування та обробки цих об’єктів. Це дозволяє конструювати будь-які складні об’єкти даних. Як було сказано раніше, muLisp має два типи даних: атоми та списки. Атоми поділяються на символи та числа. Списки є підмножиною об’єктів, які мають більш загальну структуру — бінарне дерево. Вони створені за допомогою консів.

Кожний об’єкт даних конкретного типу складається із фіксованої кількості елементів - вказівників. Ці елементи можуть вказувати на інші об’єкти даних. Множина усіх об’єктів даних утворює зв’язану мережу вказівників, яка називається область данихMuLisp.

Символ є об’єктом даних, з яким пов’язано 4 атрибути, кожен з яких є вказівником на:

— PRINT - ім’я. Це унікальний рядок ASCII символів, за допомогою якого система ідентифікує символ при операціях введення-виведення. PRINT - ім’я не може бути змінене. Імена обмежені за розміром: вони повинні мати не більше ніж 65536 символів. Жодні два символи не можуть мати однакових PRINT -імен. Коли PRINT - ім’я генерується або читається, спрацьовує алгоритм хешування, який визначає існування атома з таким іменем. Якщо такий атом існує, то саме він і використовується, інакше – утворюється новий атом з новим PRINT - ім’ям.

— поточне значення. Значенням символа може бути будь-який об’єкт даних, який зберігається в комірці пам’яті. Якщо в середовищі Ліспу ввести PRINT-ім‘я символу, то на виході буде його значення. Поточне значення доступно як CAR - елемент символа.

— список властивостей. Містить значення властивостей символа, проіндексованих за ключем. Його форма має вигляд: (ім’я1 значення1 ім’я2 значення2 ... ім’яN значенняN). При ініціалізації системи список властивостей є порожнім (дорівнює NIL). Його можна змінити за допомогою функцій властивостей та прапорців. Доступний як CDR - елемент символа.

— визначення функції. При створенні символу в muLisp цей атрибут дорівнює “функція невизначена”. Визначення функції складається або за шаблонами машинної мови, або на D-коді. Значення цього атрибута можна отримати в результаті виконання функції флагів (GETD символ).

SYMBOLP є функція, яка розпізнає символ. Вона повертає Т, якщо аргумент є символом і NIL в протилежному випадку.

$ (SYMBOLP ‘XYZ) $ (SYMBOLP 41)

T NIL

$ (SYMBOLP ‘(q w)) $ (SYMBOLP ‘())

NIL T

ВКоммонЛіспі (файл common.lsp) визначеніфункціїSYMBOL-VALUE, якаповертаєзначеннясимвола, таSYMBOL-PLIST, якаповертаєвесьсписоквластивостейсимвола.

(DEFUN SYMBOL-VALUE (SYM) (DEFUN SYMBOL-PLIST (SYM)

((SYMBOLP SYM) (CAR SYM) ) ) ((SYMBOLP SYM) (CDR SYM) ) )

УзагальненоюфункцієюприсвоєнняєSETF, якавизначенав common.lsp. Воназаноситьданнівкоміркупам’ятісимвола: (SETF <коміркапам’яті> <значення>). Через функцію SETF можна представити описані раніше функції SET та SETQ.

(SETQ x y) це (SETF x y)

(SET x y) це (SETF (SYMBOL-VALUE x) y)

Проміжки, дужки, коми, одинарні та подвійні лапки, крапка, крапка з комою відіграють спеціальну роль в Ліспі. Одинарним Escape-символом є &bsol;. Багатократним Еscape-символом є |. Спеціальні літери можуть використовуватися у PRINT-іменах символів, але для цього перед ними треба ставити &bsol;, або весь рядок брати в |. Вирази |q w e| та |sym(bol| є символами. Для використання літер &bsol; та | в символах необхідно ставити перед ними &bsol;. Якщо виводиться на екран символ, який містить спеціальні літери, то він виводиться з багатократним escape-символом. Програмна змінна *PRINT-ESCAPE* булевського типу відповідає за виведення escape-символів. Якщо вона дорівнює NIL, то escape-символи на екран не виводяться. Подвійні лапки “ грають роль літери |. Розглянемо приклади (спочатку *PRINT-ESCAPE*=T):

$ (SETQ |sym(bol| 3) $ (SETQ a |q w e|) $ s&bsol;a $ s&bsol;a

$ |sym(bol| $ a sa |s&bsol;a||

3 |q w e|

$ (SETQ *PRINT-ESCAPE* NIL) $ (SETQ a |q w e|) $ (SETQ “s&bsol;a” 2)

$ s&bsol;a $ a $ |s&bsol;a|

s&bsol;a q w e 2

Число є іншим примітивним об’єктом. Воно може бути цілим або дробовим. Ціле число вводиться як послідовність цифр, перед якою може стояти знак мінус. За внутрішнім поданням цілі числа діляться на малі цілі (до 65536) та великі цілі. Оскільки значенням числа завжди є саме число, то немає необхідності перед ним ставити апостроф. Чотири атрибути характеризують число як об’єкт даних:

— елемент тотожності. Це є вказівник на саме число. Він доступний як CAR-елемент числа.

— знак. Він містить один з наступних символів, які характеризують тип числа:

додатне від’ємне $ (CDR 5.6) $ (CAR 5.6)

мале NIL T MACRO 5.6

велике LAMBDA NLAMBDA $ (CDR 1212) $ (CDR -121212)

дробове MACRO SPECIAL NIL NLAMBDA

Значення атрибута знака доступне як CDR-елемент числа.

— довжина. Якщо число є малим цілим, то цей атрибут містить значення цілого. Якщо число — велике ціле, то елемент ‘довжина’ містить довжину слова вектора числа. Якщо число дробове — елемент містить вказівник на його чисельник, який обов’язково повинен бути цілим (додатним або від’ємним).

— вектор. Якщо число мале ціле, то значення атрибута є вказівником на інше мале ціле (хеш-з’єднувач). Якщо число велике ціле, то це поле містить вказівник на найменший значущий байт. Якщо число дробове — елемент містить вказівник на його знаменник, який повинен бути додатним цілим числом.

Функція порівняння EQL може використовуватися для порівняння чисел. Але більш загальною функцією для порівняння множини чисел є рівність:

$ (EQL -3 4) $ (EQL 4 4) $ (= 2 2 2) $ (= 2 2 3 2)

NIL T T NIL

Дробові числа можуть подаватися у десятковому вигляді та з дробовою рискою. Внутрішня змінна *PRINT-POINT* відповідає за тип виведення дробових чисел. Якщо вона дорівнює NIL, то всі дробові числа подаються на виведення з дробовою рискою. Якщо *PRINT-POINT* = n, то дробові числа виводяться з n знаками після десяткової коми. При введенні дробового числа воно автоматично скорочується.

$ ѕ $ 3/9 $ 5/1 $ 12/9

3/4 1/3 5 4/3

Внутрішня змінна *PRINT-BASE* відповідає за основу системи числення, в якій обробляються числа. Якщо значення цієї змінної є цілим та перебуває в інтервалі від 2 до 32, то такою і буде основа системи числення, інакше muLisp працює в десятковій системі числення.

$ (SETQ ten 10) $ (SETQ *PRINT-BASE* 2) $ 234

$ (SETQ *PRINT-BASE* 16) $ ten 11101010

$ ten 1010

0A

Функцією, якарозпізнаєцілічисла, є INTEGERP. Вона повертає Т, якщо її аргумент є цілим числом та NIL інакше. Функція NUMBERP розпізнає число.

$ (INTEGERP 100) $ (INTEGERP 3.5)

T NIL

$ (NUMBERP 3.5) $ (NUMBERP 4/5)

T T

Число в подвійних лапках завжди є символом:

$ (SYMBOLP “23”) $ (NUMBERP “23”)

T NIL

Символи та числа є атомами. Наступні вирази повертають істину:

(ATOM 3.5), (ATOM “23”), (ATOM ‘APPLE).

Конс є примітивним об’єктом, який вказує на будь-які два інші об’єкти даних. Він не є атомом. Назва конс пішла від функції конструктора CONS. Кожен конс склада- ється з CAR- та CDR- елементів. Конс часто називають точковою парою. Якщо X і Y об’єкти даних, то вираз (X . Y) є консом, CAR-елемент якого є X, а CDR-елемент – Y.

$ (SETQ A (cons X Y)) $ (CAR A) $ (CDR A) $ (CDR ‘(R . S))

$ A X Y S

(X . Y)

За допомогою точкового подання можна показати структуру будь-якого об’єкту. Список (x1 x2 x3) є ланцюгом консів, які зв’язані за допомогою CDR- елементів. Його CAR- елементи вказують на елементи списку. CDR- елемент останнього конса вказує на NIL. Вказаний список можна подати у вигляді (x1 . (x2 . (x3 . NIL))). Функція READ читання виразу розпізнає як точкове подання виразу, так і спискове. Функція виведення PRINT виводить об’єкти в списковому поданні.

$ (SETQ a ‘(q . (w . nil)) $ a $ (CONSP ‘(q . w)) $ (CONSP (q w))

(q w) (q w) T T

Функція (CONSP obj) розпізнаєконси. Список не є примітивним об’єктом, а є ланцюгом консів. Отже, результатом застосування функції CONSP до списку буде Т.

2. Керування памяттю

Динамічне автоматичне керування пам’яттю надає велику кількість переваг інтерпретатору muLisp. Немає необхідності власноручно програмісту розподіляти пам’ять під задачу, яка буде виконуватися. Пам’ять, яка не буде використовуватися програмою, доступна для створення нових структур даних.

При ініціалізації muLisp обчислюється розмір доступної пам’яті, яка потім розбивається на 4 області:

– область атомів (64К), яка забезпечує пам’ять для 4 елементів-вказівників, необхідних для кожного символа та числа.

– область векторів (128К), яка забезпечує пам’ять для кожного тіла PRINT-імені символа (64К) та числового двійкового вектора кожного числа (64К).

– область вказівників (256К), яка забезпечує пам’ять під 2 елементи-вказівники, необхідні для кожного cons-а та під D-код, необхідний для визначення функції. Оскільки cons є основною структурою даних Ліспу, область вказівників є найбільшою серед інших.

– область стеку (64К), яка забезпечує пам’ять для контрольного стеку та змінного стеку. Ці два стеки розташовані на протилежних кінцях області стеків.

Таким чином для роботи інтерпретатора muLisp необхідно 512К плюс пам’ять під DOS.

3. Збір сміття

MuLisp має алгоритм збору сміття з двома переглядами (помітка та чистка). Під час першого перегляду пам’яті помічаються усі активні об’єкти даних, доступ до яких забезпечується внаслідок зчеплення за допомогою елементів-вказівників, починаючи з елементів списку значень та властивостей усіх символів системи, або зі стеку змінних, або D-коду. Символи з автоматичним посиланням, які не мають властивостей та поточних визначень функцій, не помічаються. Такі символи автоматично видаляються зі списку під час другого перегляду.

У процесі другого перегляду збору сміття усі помічені об’єкти даних ущільнюються та збираються в одному з кінців відповідної області даних. Це дозволяє зберегти залишки областей даних для створення нових об’єктів.

3.4. Перерозподіл областей даних

Після збирання сміття одній або декільком з чотирьох областей даних може бракувати вільної пам’яті для того, щоб програми мали змогу продовжити виконання, незважаючи на те, що інші області даних мають достатню кількість вільної пам’яті. Якщо виникає така ситуація, то здійснюється перерозподіл областей даних шляхом ділення областей, додання пам’яті, якої не вистачає, одній або декільком областям. Але обмеження на розміри для кожної області даних, які описувались вище, мають бути дотриманими.