А согласно указанным направлениям развития, все более вероятен переход на новые технологии. Отметим, что Япония по скорости внедрения новых интеллектуальных технологий шагает далеко впереди, обогнав как страны СНГ, так и страны Европы. Особенно это хорошо заметно в области бытовой электроники, где чипы на основе нейронных сетей устанавливаются в микроволновые печи (Sharp), пылесосы, фото- и видеокамеры.
Приведем краткий список фирм, уже применяющих ИНС в их аппаратном исполнении: Ericsson (Англия и Швеция), Philips Research (Нидерланды), Siemens AG Munich, Siemens/Nixdorf Bonn, 3M Laboratories (Europe) GmbH Neuss, XIONICS Document Technologies GmbH Dortmund, Robert Bosch GmbH Reutlingen, Spectrum Microelectronics Siek, Fiat, Domain Dynamics Ltd.
Применение
Ниже приведен далеко не полный список возможных и перспективных аппаратных реализаций и сфер применения:
Для оценки производительности нейровычислителей используются следующие показатели:
Ориентация в выполнении нейросетевых операций обуславливает с одной стороны повышение скоростей обмена между памятью и параллельными арифметическими устройствами, а с другой стороны уменьшение времени весового суммирования (умножения и накопления) за счет применения фиксированного набора команд типа регистр-регистр.
Характеристики нейрочипов.
Наименование | Фирма изготовитель | Разряд-ность, бит | Максимальное количество синапсов* | Максимальное число слоев** | Примечание |
MA16 | Siemens | 48 (умножители и сумматоры) | - | - | 400 ММАС. |
NNP (Neural Networks Processor) | Accurate Automation | Nx16 | - | - | MIMD, N - число процессоров. |
СNAPS-1064 | Adaptive Solutions | 16 | 128 Кбайт | 64 | |
100 NAP Chip | HNC | 32 | 512 Кбайт | 4 | Плав. Арифм. 4 процессорных элемента |
Neuro Matrix NM6403, Такт. частота 50 МГц. | Модуль, Россия | 64 (вект. процессор), 32 RISC ядро | 4096 шт. | 24 | Совместим с портами TMS320C4x |
Neuro Matrix NM6404, Такт. частота 133 МГц. | Модуль, Россия | 64 (вект. процессор), 32 RISC ядро | 4096 шт. | ~48 | Совместим с портами TMS320C4x |
CLNN 32 CLNN 64 | Bellcore | 32 64 | 496 1024 | 32 нейрона | 108 перекл./с 2 x 108 перекл./с |
NC 3001 | NeuriGam | 16 | 4096 шт. | 32 | |
ZISC 036 (Zero Instruction Set Computer) | IBM | 64 разр. входного вектора | - | 36 нейронов | Частота 20МГц, Векторно-прототипный нейрочип |
ETANN 80170NW | Intel | 64 входа | Два банка весов 64х80 | 64 нейрона в слое, 3 слоя. | Аналоговая |
MD-1220 | Micro Devices | 16 | 64 шт. | 8 | 8 нейронов |
MT 19003 - Neural Instruction Set Processor | Micro Circuit Engineering (MCE) | 16 разр. Умножитель 35 разр. сумматор | - | 1 | RISC МП c 7 специальными командами |
Neuro Fuzzu | National Semiconductor | - | - | - | |
NI 1000 | Nestor | 5-16 (одного нейрона) | - | 1024 прототипных 256 мерных векторов | Векторно-прототипный нейрочип |
NLX420 (NLX 110, 230) | Adaptive Logic | 16 | 1 Мбайт | 16 | 16 процессорных элементов |
OBL Chip | Oxford Computer | 16 | 16 Мбайт | - | |
L-Neuro 1.0 L-Neuro 2.3 | Philips | 16 16 | 1536 | 16 нейронов 192 (12х16) | 26 МГц 60 МГц |
RSC (Speech Recognition Chip) - 164 | Sensory Circuits | - | - | - | |
ORC 110xx (Object Recognizer Chip) | Synaptics | - | - | - | |
Pram-256 Chip | UCLi Ltd. | 8 (одного нейрона) | - | 256 нейронов | 33МГц. |
SAND | Datafactory | 16 | - | 4 | 200 MCPS |
ACC | 16 | - | - | ||
Геркулес | Россия | 16 | 1 Мбайт | 64 | |
Neuro Classifier | Университет Твента, DESY | 70 вх. нейронов | - | 6 (внутр) 1 вх., 1 вых. | 2 х 1010 перекл./с |
ANNA | AT&T | Число нейроннов 16-256 | 4096 весов | - | Число входов у нейрона 256-16. |
WSC (Wafer Scale Integration) | Hitachi | - | 64 связи на нейрон | 576 нейронов | |
SASLM2 | Mitsubishi | 2 (одного нейрона) | - | 4096(64x64) нейронов | 50 МГц |
TOTEM | Kent (Univer UK), di Trento (Italy) | 16 (одного нейрона) | - | 64 нейрона | 30 МГц |
Neuron 3120, Neurom 3150 | Echelon (США) | 8 бит (шина данных) | - | - | Наличие параллельных, последовательных и коммуникацинных портов |
Нейроускорители НТЦ “Модуль”
За период с 1989 по 1999 гг. в НТЦ “Модуль” разработан ряд образцов нейрокомпьютерных вычислительных систем на современной элементной базе ведущих зарубежных фирм и на основе нейропроцессоров NeuroMatrix 6403 и 6404, созданного в НТЦ “Модуль” [4]. Среди широкой линейки различных ускорителей можно выделить: нейроускорители на основе универсальных сигнальных процессоров (в основном, используется TMS320C4x) и нейроускорители на базе специализированного нейросигнального процессора NeuroMatrix, созданного в НТЦ “Модуль”. Примерами ускорителей первого типа являются ускорительные платы М1и М2.
Ускорительная плата Ml
М1 выполнена на цифровых сигнальных процессорах TMS320C40 фирмы TEXAS INSTRUMENTS, связанных по высокоскоростным линкам. Имеется возможность каскадирования — подключения по линкам аналогичных плат. Структурная схема платы представлена на рис.
Основные характеристики:
· ISA-интерфейс;
· до четырёх TMS320C40 с частотой 50 МГц;
· пиковая производительность — 100 MIPS, 200MFLOPS, 1100 MOPS;
· объём SRAM — 5 Мб (по 1 Мб на процессор + 1 Мб разделяемый с IBM PC), время выборки — 20 нс;
· объём DRAM — до 32 Мб;
· 8 внешних связей (скорость — 20 Мб/с).
Ускорительная плата М2
Многопроцессорный модуль М2 цифровой обработки сигналов выполнен на цифровых сигнальных процессорах TMS320C40 фирмы Texas Instruments и представляет собой одноплатную многопроцессорную вычислительную машину. Модуль предназначен как для автономной работы, так и для функционирования в составе ПЭВМ с системной шиной VMEbus, в том числе состоящей из нескольких таких же модулей. Конструктивно блок выполнен в соответствии с механическим стандартом VMEbus IEEE 1014 (6U).
Модуль М2 содержит:
· VME-bus контроллер;
· master/slave интерфейс;
· до шести TMS320C40 с частотой 50 МГц;
· до 2 Мб SRAM на процессор;
· до 64 Мб DRAM на плате;
· FLASH EEPROM до 0,5 Мб;
· 6 внешних связей (скорость — 20 Мб/с);
· JTAG-интерфейс;
· RS-232-интерфейс;
· общая производительность — до 300 MFLOPS.
Структурная схема ускорителя М2 приведена на рис.
Нейроускорители на базе нейрочипов
Кроме нейроускорителей на базе
ПЛИС и DSP, в последнее время всё большее распространение находят нейроускорители на базе специализированных нейросигнальных и нейросетевых процессоров. Проанализируем особенности их реализации на конкретных примерах.
Двухпроцессорный встраиваемый модуль МЦ4.01 (NM1)
Встраиваемый модуль цифровой обработки сигналов МЦ4.01 (NM1) производства НТЦ “Модуль” [4] предназначен для решения различных задач нейронными и нейроподобными алгоритмами, а также задач цифровой обработки сигналов и ускорения векторно-матричных вычислений (рис. 7). Модуль выполнен на спроектированных и разработанных в НТЦ цифровых сигнальных процессорах NeuroMatrix® NM6403 и представляет собой одноплатный нейроускоритель. Конструктивно выполнен в виде платы, вставляемой в стандартный слот шины PCI.
Нейроускоритель содержит:
· 2 нейропроцессора NM6403;
· от 2 до 8 Мбайт статической памяти (SRAM);
· 64 Мбайт динамической памяти (EDO DRAM);
· 4 внешних ком. порта с темпом обмена 20 Мбайт/с каждый.
Производительность:
Конструктивное выполнение: стандарт PCI (версия 2-1) с темпом обмена до 132 Мбайт/с.