Смекни!
smekni.com

Нейронные сети (стр. 3 из 4)

А согласно указанным направлениям развития, все более вероятен переход на новые технологии. Отметим, что Япония по скорости внедрения новых интеллектуальных технологий шагает далеко впереди, обогнав как страны СНГ, так и страны Европы. Особенно это хорошо заметно в области бытовой электроники, где чипы на основе нейронных сетей устанавливаются в микроволновые печи (Sharp), пылесосы, фото- и видеокамеры.

Приведем краткий список фирм, уже применяющих ИНС в их аппаратном исполнении: Ericsson (Англия и Швеция), Philips Research (Нидерланды), Siemens AG Munich, Siemens/Nixdorf Bonn, 3M Laboratories (Europe) GmbH Neuss, XIONICS Document Technologies GmbH Dortmund, Robert Bosch GmbH Reutlingen, Spectrum Microelectronics Siek, Fiat, Domain Dynamics Ltd.

Применение

Ниже приведен далеко не полный список возможных и перспективных аппаратных реализаций и сфер применения:

  • Системы коммуникаций, модуляторы/демодуляторы, интеллектуальные антенны, полупроводники для применения в космической отрасли.
  • Идентификация объектов, сжатие изображения, HDTV, медицинский и биометрический анализ образов, системы обработки теплового изображения, анализ материалов.
  • Анализ человеческого характера, идентификация говорящего, распознавание речи, распознавание рукописного текста.
  • Информационный поиск, исследовательский анализ данных, проверка качества, изучение функций, автоматический контроль и интеллектуальное управление, экономическое прогнозирование, прогнозирование потребления электричества, автоматическая проверка работоспособности VLSI и WSI.

Для оценки производительности нейровычислителей используются следующие показатели:

  • CUPS (connections update per second) - число измененных значений весов в секунду (оценивает скорость обучения).
  • CPS (connections per second) - число соединений (умножений с накоплением) в секунду (оценивает производительность).
  • CPSPW = CPS/Nw, где Nw - число синапсов в нейроне.
  • CPPS - число соединений примитовов в секунду, CPPS=CPS*Bw*Bs, где Bw, Bs - разрядность весов и синапсов.
  • MMAC - миллионов умножений с накоплением в секунду.

Ориентация в выполнении нейросетевых операций обуславливает с одной стороны повышение скоростей обмена между памятью и параллельными арифметическими устройствами, а с другой стороны уменьшение времени весового суммирования (умножения и накопления) за счет применения фиксированного набора команд типа регистр-регистр.

Нейрочипы: анализ и сравнительные характеристики.

Характеристики нейрочипов.

Наименование Фирма изготовитель Разряд-ность, бит Максимальное количество синапсов* Максимальное число слоев** Примечание
MA16 Siemens 48 (умножители и сумматоры) - - 400 ММАС.
NNP (Neural Networks Processor) Accurate Automation Nx16 - - MIMD, N - число процессоров.
СNAPS-1064 Adaptive Solutions 16 128 Кбайт 64
100 NAP Chip HNC 32 512 Кбайт 4 Плав. Арифм. 4 процессорных элемента
Neuro Matrix NM6403, Такт. частота 50 МГц. Модуль, Россия 64 (вект. процессор), 32 RISC ядро 4096 шт. 24 Совместим с портами TMS320C4x
Neuro Matrix NM6404, Такт. частота 133 МГц. Модуль, Россия 64 (вект. процессор), 32 RISC ядро 4096 шт. ~48 Совместим с портами TMS320C4x
CLNN 32 CLNN 64 Bellcore 32
64
496
1024
32 нейрона 108 перекл./с 2 x 108 перекл./с
NC 3001 NeuriGam 16 4096 шт. 32
ZISC 036 (Zero Instruction Set Computer) IBM 64 разр. входного вектора - 36 нейронов Частота 20МГц, Векторно-прототипный нейрочип
ETANN 80170NW Intel 64 входа Два банка весов 64х80 64 нейрона в слое, 3 слоя. Аналоговая
MD-1220 Micro Devices 16 64 шт. 8 8 нейронов
MT 19003 - Neural Instruction Set Processor Micro Circuit Engineering (MCE) 16 разр. Умножитель 35 разр. сумматор - 1 RISC МП c 7 специальными командами
Neuro Fuzzu National Semiconductor - - -
NI 1000 Nestor 5-16 (одного нейрона) - 1024 прототипных 256 мерных векторов Векторно-прототипный нейрочип
NLX420 (NLX 110, 230) Adaptive Logic 16 1 Мбайт 16 16 процессорных элементов
OBL Chip Oxford Computer 16 16 Мбайт -
L-Neuro 1.0
L-Neuro 2.3
Philips 16
16

1536
16 нейронов
192 (12х16)
26 МГц
60 МГц
RSC (Speech Recognition Chip) - 164 Sensory Circuits - - -
ORC 110xx (Object Recognizer Chip) Synaptics - - -
Pram-256 Chip UCLi Ltd. 8 (одного нейрона) - 256 нейронов 33МГц.
SAND Datafactory 16 - 4 200 MCPS
ACC 16 - -
Геркулес Россия 16 1 Мбайт 64
Neuro Classifier Университет Твента, DESY 70 вх. нейронов - 6 (внутр) 1 вх., 1 вых. 2 х 1010 перекл./с
ANNA AT&T Число нейроннов 16-256 4096 весов - Число входов у нейрона 256-16.
WSC (Wafer Scale Integration) Hitachi - 64 связи на нейрон 576 нейронов
SASLM2 Mitsubishi 2 (одного нейрона) - 4096(64x64) нейронов 50 МГц
TOTEM Kent (Univer UK), di Trento (Italy) 16 (одного нейрона) - 64 нейрона 30 МГц
Neuron 3120, Neurom 3150 Echelon (США) 8 бит (шина данных) - - Наличие параллельных, последовательных и коммуникацинных портов
  • * - максимальное число синапсов определяет размер внутрикристалльной памяти весов.
  • ** - максимальное число слоёв определяется числом операций умножения с накоплением, выполняемых за один такт для операндов длиной 8 бит.

Нейроускорители НТЦ “Модуль”

За период с 1989 по 1999 гг. в НТЦ “Модуль” разработан ряд образцов нейрокомпьютерных вычислительных систем на современной элементной базе ведущих зарубежных фирм и на основе нейропроцессоров NeuroMatrix 6403 и 6404, созданного в НТЦ “Модуль” [4]. Среди широкой линейки различных ускорителей можно выделить: нейроускорители на основе универсальных сигнальных процессоров (в основном, используется TMS320C4x) и нейроускорители на базе специализированного нейросигнального процессора NeuroMatrix, созданного в НТЦ “Модуль”. Примерами ускорителей первого типа являются ускорительные платы М1и М2.

Ускорительная плата Ml

М1 выполнена на цифровых сигнальных процессорах TMS320C40 фирмы TEXAS INSTRUMENTS, связанных по высокоскоростным линкам. Имеется возможность каскадирования — подключения по линкам аналогичных плат. Структурная схема платы представлена на рис.

Основные характеристики:

· ISA-интерфейс;

· до четырёх TMS320C40 с частотой 50 МГц;

· пиковая производительность — 100 MIPS, 200MFLOPS, 1100 MOPS;

· объём SRAM — 5 Мб (по 1 Мб на процессор + 1 Мб разделяемый с IBM PC), время выборки — 20 нс;

· объём DRAM — до 32 Мб;

· 8 внешних связей (скорость — 20 Мб/с).

Ускорительная плата М2

Многопроцессорный модуль М2 цифровой обработки сигналов выполнен на цифровых сигнальных процессорах TMS320C40 фирмы Texas Instruments и представляет собой одноплатную многопроцессорную вычислительную машину. Модуль предназначен как для автономной работы, так и для функционирования в составе ПЭВМ с системной шиной VMEbus, в том числе состоящей из нескольких таких же модулей. Конструктивно блок выполнен в соответствии с механическим стандартом VMEbus IEEE 1014 (6U).

Модуль М2 содержит:

· VME-bus контроллер;

· master/slave интерфейс;

· до шести TMS320C40 с частотой 50 МГц;

· до 2 Мб SRAM на процессор;

· до 64 Мб DRAM на плате;

· FLASH EEPROM до 0,5 Мб;

· 6 внешних связей (скорость — 20 Мб/с);

· JTAG-интерфейс;

· RS-232-интерфейс;

· общая производительность — до 300 MFLOPS.

Структурная схема ускорителя М2 приведена на рис.

Нейроускорители на базе нейрочипов

Кроме нейроускорителей на базе
ПЛИС и DSP, в последнее время всё большее распространение находят нейроускорители на базе специализированных нейросигнальных и нейросетевых процессоров. Проанализируем особенности их реализации на конкретных примерах.

Двухпроцессорный встраиваемый модуль МЦ4.01 (NM1)

Встраиваемый модуль цифровой обработки сигналов МЦ4.01 (NM1) производства НТЦ “Модуль” [4] предназначен для решения различных задач нейронными и нейроподобными алгоритмами, а также задач цифровой обработки сигналов и ускорения векторно-матричных вычислений (рис. 7). Модуль выполнен на спроектированных и разработанных в НТЦ цифровых сигнальных процессорах NeuroMatrix® NM6403 и представляет собой одноплатный нейроускоритель. Конструктивно выполнен в виде платы, вставляемой в стандартный слот шины PCI.

Нейроускоритель содержит:

· 2 нейропроцессора NM6403;

· от 2 до 8 Мбайт статической памяти (SRAM);

· 64 Мбайт динамической памяти (EDO DRAM);

· 4 внешних ком. порта с темпом обмена 20 Мбайт/с каждый.

Производительность:

  • векторные операции — 1,9 млрд. операций с байтовыми операндами в секунду;
  • скалярные операции — до 320 млн. операций в секунду.

Конструктивное выполнение: стандарт PCI (версия 2-1) с темпом обмена до 132 Мбайт/с.