В тихом переулке на Ордынке в старинном особняке ежедневно кипит серьезная работа: здесь манипулируют, пожалуй, с самым деликатным на свете материалом - "мозгом". Сначала берутся нейроны и вяжется нейросеть определенной конфигурации. Затем эта сеть обучается, накапливает знания в результате тренинга и экзаменовок, после чего "мозг" в первом приближении готов. Завершают процесс "генные инженеры": они организуют мутацию и скрещивание нейросетей в надежде получить наилучшее потомство путем эволюционной селекции.
"Нейрохирургия или генная инженерия, - подумаете вы, - к чему бы это здесь?" Но это не случайно. Все описанное - не маргинальные чудеса, а привычная работа аналитиков зерновой фирмы "ОГО" по применению нейросетевой технологии для решения широкого круга аналитических задач в бизнесе.
PC Week/RE уже не раз касался темы нейронных сетей (см. PC Week № , стр. 9, № 5, ), которая оказалась на редкость "горячей" для России, может быть, в силу своей экзотичности.
Чтобы отделить сказочный ореол, как-то сам собой образовавшийся вокруг этих технологий, от реальности, захотелось посмотреть в действии нейросетевую программу BrainMaker, ставшую с недавнего времени официально доступной и в нашей стране. С этим намерением я и попала на Ордынку, где обитает аналитический центр крупнейшей зерновой фирмы России - "ОГО".
Возглавляет центр Евгений Пастухов, кандидат физ.-мат. наук, не один год проработавший в области нейронных технологий. Однако только сейчас, с переходом в "ОГО", его знания стали приносить тот реальный результат, который обычно ждут от науки. Аналитики "ОГО" одними из первых в России стали обладателями профессиональной версии пакета BrainMaker Professional фирмы CSS и оптимизатора GTO (Genetic Training Option) благодаря ориентации фирмы на самые перспективные информационные технологии, позволяющие успешно конкурировать в сфере аналитики.
"Руководители "ОГО", на мой взгляд, оказались очень дальновидными, сделав ставку на новейшие технологии, - считает Евгений Пастухов. - Поверив, что наука может и должна помогать бизнесу, они сформировали команду, сознательно пошли на расходы, чтобы приобрести необходимое программное обеспечение и технику. Приятно сознавать, что среди отечественных предпринимателей есть перспективномыслящие люди, которые верят ученым, создают им уникальные условия для работы. При таких условиях, я уверен, российская наука не будет страдать от утечки мозгов".
Фирма "ОГО", насчитывающая сотни сотрудников и имеющая представительства по всей стране, ежедневно решает массу оперативных задач: отслеживает состояние зернового рынка России и его конъюнктуру, погодные и экологические условия на территории страны, текущие цены на мировом рынке зерна и их прогнозирование, приватизацию предприятий, нормативную базу, оптимизирует перевозки и многое другое.
Пакет BrainMaker эффективно помогает при анализе ситуаций, оценке событий, при составлении прогноза на будущее и в задачах на распознавание.
Система BrainMaker Professional, как пояснил Евгений Пастухов, позволяет достичь уникальных результатов, если ею правильно пользоваться, двигаясь по некоторому сценарию от постановки задачи до анализа полученных решений. Он любезно предоставил несколько рецептов, способствующих успешной работе с нейропакетами. По существу они сводятся к семи шагам.
На первом шаге необходимо решить, что нейросеть должна предсказывать или распознавать: цену акции на завтрашних торгах, уровень продаж в следующем квартале или урожайность пшеницы в будущем году.
Далее, на основе собственного опыта или оценок эксперта определяется, какая информация должна быть использована для прогноза: предыдущая история событий, динамика экономических показателей, регистрация состояний окружающей среды или что-то еще.
Задается точность (толеранс), с которой вы хотите строить прогноз. При этом не следует ставить слишком жесткие условия, иначе сеть не сможет правильно обучиться. Задача состоит в том, чтобы научить ее обобщать, принимать решения по аналогии с теми образами, которые она уже "видела", а не заставить запоминать все подряд.
Затем происходит сбор необходимых данных в формате электронной таблицы, базы данных или текстового файла (этот этап самый длительный по времени). Данные должны быть не сильно искажены и их должно быть достаточно, чтобы представлять тенденцию, закономерность, которые следует усвоить при обучении создаваемой нейросети. Успех прогнозирования во многом зависит от того, насколько правильно подготовлены данные. Если предоставить системе данные, не выражающие тенденцию, то по ним нельзя будет обучить сеть и получить нужный результат.
После этого включается специальный модуль NetMaker, задача которого - выполнить предварительный (трендовый, циклический, корреляционный) анализ, доработку (дифференцирование, очистку, восполнение) данных и сформировать на их основе структуру нейросети со входами, отвечающими данным задачи, и выходами, соответствующими целям прогнозирования.
Следующий этап - тренировка нейросети путем многократного прогона через нее части набора данных, выделенных для обучения. Процесс тренировки, пожалуй, самый сложный и интригующий: нейросеть порой "капризничает", не хочет усваивать знания, требует добавить нейронов. При этом задача "тренера" - не допустить чрезмерного разрастания нейросети, своевременно обрезая ее, а также не пропустить момент "переобучения", когда нейросеть начинает обучаться частностям в ущерб главной тенденции.
Евгений Пастухов - руководитель
аналитического центра
За обучением следует экзаменовка натренированной нейросети на наборе данных, выделенных для тестирования. Существует множество оценок (средняя и среднеквадратичная ошибка, доля правильно предсказанных выходов и др.), по которым можно судить о степени обученности нейросети. Если на экзамене она показывает плохие результаты, то можно вернуться назад и повторить тренировку.
И вот наконец наступает момент, когда обученную (натренированную и оттестированную) нейросеть можно использовать по назначению: оценить текущую ситуацию, предсказать будущее событие, принять немедленное решение.
В результате проделанных операций получается одна или несколько сетей, готовых к работе в качестве экспертов в выбранной предметной области. Все дело в качестве таких нейроэкспертов. Для улучшения их "породы" фирма CSS предлагает воспользоваться интегрированным в BrainMaker специализированным модулем GTO, использующим идеи эволюционного программирования и генной инженерии для отбора лучших "особей".
Здесь не лишне отметить разницу между профессиональной и непрофессиональной версиями BrainMaker (разница в цене составляет $600. $900 стоит непрофессиональная и $1500 - профессиональная версия пакета), а также упомянуть о преимуществах модуля GTO.
В непрофессиональной версии самый сложный процесс - обучение нейросети - практически неавтоматизирован; пользователь должен вручную установить, а затем в процессе тренировки подстраивать различные параметры обучения: скорость, точность, число внутренних нейронов и др. Это довольно сложная задача на грани науки и искусства, требующая от учителя определенных знаний и практического опыта. В профессиональной версии многое автоматизировано: система сама подстраивает (в зависимости от успехов обучения) скорость и точность обучения, а также добавляет или отрезает нейроны в случае необходимости. Таким образом, пользователь практически избавлен от постоянного мониторинга состояния нейросети.
У системы BrainMaker Professional имеется два уровня обучения: ручной и автоматический. Модуль GTO добавляет еще два уровня автоматизации оптимизационный и генетический. На оптимизационном уровне перебираются сотни и даже тысячи вариантов нейросетей и оставляются лучшие.
Однако самым эффективным является генетический уровень, основанный на эволюционных идеях оптимизации. Пользователь задает число поколений в эволюционном процессе, число нейросетей (потомков), переходящих в следующее поколение, и параметры генетических операций: мутации и скрещивания. После запуска эволюционной системы в каждом поколении появляются потомки, которые сначала отправляются в систему BrainMaker Professional для обучения, а затем сравниваются со своими родителями. Те из них, кто показал лучшие, чем у родителей, показатели обучаемости, остаются для репродукции в следующем поколении, остальные уничтожаются. В результате такой селекции в последнем поколении эволюционного процесса остаются наиболее обученные нейросети.
Аналитики "ОГО" активно работают с пакетом BrainMaker Professional более полугода, используя его предсказывающие и распознающие возможности в разных приложениях, и уже добились определенных успехов. Например, финансовый аналитик фирмы Елена Бублик преуспела в прогнозировании валютных фьючерсов на московской товарной бирже. Созданная ею сеть, обученная на реальных данных предыдущих месяцев, значительное время предсказывала фьючерсы с точностью до 10 рублей. По мнению экспертов, это очень высокая точность, недаром разработанная в "ОГО" нейросеть стала популярной и часто обсуждается в среде биржевых аналитиков. Правда, экономическая ситуация в стране меняется, меняются тенденции, а следовательно, требуется модернизировать нейросеть путем дообучения в новых условиях. И вновь без профессионального чутья той же Елены Бублик обойтись будет трудно.
Не стоит думать, что нейротехнологии - волшебная палочка, заполучив которую можно сразу ощутить себя волшебником. Я полагаю, приведенные выше рекомендации Евгения Пастухова в достаточной степени подчеркнули важную роль эксперта, выбирающего тестовый набор данных, формулирующего задачу и настраивающего систему.
Впрочем, в этом нет ничего неожиданного - для успеха дела всегда нужна хоть одна светлая голова.
ЕЛЕНА МОНАХОВА