Русские ученые научили компьютер угадывать мыслеобразы
Российские ученые научили компьютер распознавать зрительные образы, которые представляет себе человек.
Для этого им понадобился собственно компьютер и устройство для снятия электроэнцефалограммы. В общих чертах распознавание происходит следующим образом: вначале человек проходит тренировочную сессию, в которой ему предъявляются два изображения (например, бутерброд и автомобиль), пока он на них смотрит, прибор для снятия ЭЭГ фиксирует, какие участки мозга активизируются в ответ на предъявление каждого изображения, специальное ПО запоминает схему активности мозга и затем происходит собственно распознавание - человек воображает себе картинку, а компьютер "угадывает", о чем думает испытатель. Метод основан на том, что при восприятии разных изображений активизируются немного разные области головного мозга, и пока работает только после предварительной тренировки распознавания компьютером карты мозговой активности конкретного человека.
Это первый интерфейс мозг-компьютер, в котором компьютер распознает именно зрительные образы. До сих пор ученые в основном сосредотачивались на распознавании представлений о движении, что обусловлено двумя основными областями применения этой технологии: помощь парализованным людям и игры. Авторы подчеркнули важность развития неинвазивных интерфейсов мозг-компьютер в тех случаях, когда возможно обойтись без вживления электродов непосредственно в кору головного мозга.
1 | 2 | 3 | 4 |
Презентация технологии распрознавания воображаемых образов прошла в Политехническом музее все фотогалереи
В команду проекта NeuroG на общественных началах вошли Александр Фролов - доктор биологических наук, профессор, заведующий лабораторией математической нейробиологии обучения Института высшей нервной деятельности и нейрофизиологии РАН, Михаил Бахнян - научный сотрудник физического факультета МГУ, Александр Жаворонков – технический директор проекта, кандидат физико-математических наук.
Проект, по заверениям разработчиков, является полностью некоммерческим. В нем используется оборудование компании Emotiv - Emotiv EPOC - беспроводное устройство, снимающее ЭЭГ, самое дешевое из доступных на рынке (оно стоит 300 долл.). Однако если в России появятся собственные аналоги, команда готова перейти на них. Устройство Emotiv EPOC в настоящий момент распродано по всему миру в количестве примерно 30 тыс. экземпляров, причем большая часть разошлась по исследовательским институтам или корпоративным заказчикам. Для дальнейшего развития проекта NeuroG нужна база данных соответствий между активностью мозга и предъявляемыми изображениями - именно среди клиентов Emotiv ученые и надеются найти основную массу испытуемых. Пока что эти устройства используются в играх и есть надежда, что серьезный и интересный исследовательский проект привлечет внимание обладающей необходимыми устройствами публики. В эксперименте может принять участие любой, у кого есть необходимое устройство, подключившись к веб-порталу NeuroG, с Emotiv для этого достаточно просто поставить дополнение к Firefox, а если использовать какое-то другое устройство для снятия ЭЭГ, то ПО придется доработать, поскольку в нем используется собственный формат данных.
Ученые подчеркивают отличие своего подхода от традиционных методов исследования человеческого мозга. Обычно в этой области используется ФМРТ - функциональная магнитно-резонансная томография - гораздо более точный метод регистрации активности зон головного мозга, чем ЭЭГ, а условия эксперимента тщательно контролируются. Очистка результата эксперимента от случайных помех увеличивает финансовые вложения. В данном случае разработчики сделали упор не на точность, а на величину базы данных, которую они надеются получить, чтобы разработать на ее основе универсальный алгоритм распознавания воображаемых образов. Таким образом они демонстрируют, что нейробиологическое исследование может быть недорогим занятием, доступным для энтузиастов. Не всякое исследование, в том числе в области нейробиологии, можно удешевить таким образом, однако опыт команды NeuroG показывает, что можно организовать исследовательскую работу на доступном материале.
Схема активности зон головного мозга
Распознает система образы пока не со 100%-ной точностью, и влияет на количество успешных случаев огромное количество факторов - время суток, усталость человека, а в случае с бутербродом - и чувство голода: если очень хочется есть, очень трудно переключится с воображаемой еды на автомобиль. Точность воспроизведения картины мозговой активности, соответствующей изображению, поддается тренировке.
Среди дальнейших направлений исследования - выяснение того, сколько классов объектов (примеры классов: лица, дома) можно распознавать таким образом, и можно ли научить компьютер отличать разные объекты одного класса (например, машины разных марок). Также планируется увеличение количества образов (продемонстрированное ПО работает с двумя картинками, ведутся эксперименты с тремя).
Основной задачей является разработка универсального алгоритма, который не будет требовать предварительной тренировки для распознавания образов.
Практических же приложений этой технологии множество: биометрия, образовательные программы, приложения для соцсетей. Для демонстрации возможного использования технологии команда разработала интерфейс нейропоиска, который работает по ключевым словам, ассоциированным с изображениями, - таким образом, можно управлять поисковой системой (в данный момент разработчики используют "Яндекс"), мысленно представляя нужную картинку. В связи с этим встает интересный вопрос о возможности распознавания абстрактных понятий (вроде "политика") при помощи ЭЭГ.
Другой целью проекта является привлечение внимания публики, в том числе школьников и студентов, к нейробиологическим исследованиям.
Для этого им понадобился собственно компьютер и устройство для снятия электроэнцефалограммы. В общих чертах распознавание происходит следующим образом: вначале человек проходит тренировочную сессию, в которой ему предъявляются два изображения (например, бутерброд и автомобиль), пока он на них смотрит, прибор для снятия ЭЭГ фиксирует, какие участки мозга активизируются в ответ на предъявление каждого изображения, специальное ПО запоминает схему активности мозга и затем происходит собственно распознавание - человек воображает себе картинку, а компьютер "угадывает", о чем думает испытатель. Метод основан на том, что при восприятии разных изображений активизируются немного разные области головного мозга, и пока работает только после предварительной тренировки распознавания компьютером карты мозговой активности конкретного человека.
Это первый интерфейс мозг-компьютер, в котором компьютер распознает именно зрительные образы. До сих пор ученые в основном сосредотачивались на распознавании представлений о движении, что обусловлено двумя основными областями применения этой технологии: помощь парализованным людям и игры. Авторы подчеркнули важность развития неинвазивных интерфейсов мозг-компьютер в тех случаях, когда возможно обойтись без вживления электродов непосредственно в кору головного мозга.
1 | 2 | 3 | 4 |
Презентация технологии распрознавания воображаемых образов прошла в Политехническом музее все фотогалереи
В команду проекта NeuroG на общественных началах вошли Александр Фролов - доктор биологических наук, профессор, заведующий лабораторией математической нейробиологии обучения Института высшей нервной деятельности и нейрофизиологии РАН, Михаил Бахнян - научный сотрудник физического факультета МГУ, Александр Жаворонков – технический директор проекта, кандидат физико-математических наук.
Проект, по заверениям разработчиков, является полностью некоммерческим. В нем используется оборудование компании Emotiv - Emotiv EPOC - беспроводное устройство, снимающее ЭЭГ, самое дешевое из доступных на рынке (оно стоит 300 долл.). Однако если в России появятся собственные аналоги, команда готова перейти на них. Устройство Emotiv EPOC в настоящий момент распродано по всему миру в количестве примерно 30 тыс. экземпляров, причем большая часть разошлась по исследовательским институтам или корпоративным заказчикам. Для дальнейшего развития проекта NeuroG нужна база данных соответствий между активностью мозга и предъявляемыми изображениями - именно среди клиентов Emotiv ученые и надеются найти основную массу испытуемых. Пока что эти устройства используются в играх и есть надежда, что серьезный и интересный исследовательский проект привлечет внимание обладающей необходимыми устройствами публики. В эксперименте может принять участие любой, у кого есть необходимое устройство, подключившись к веб-порталу NeuroG, с Emotiv для этого достаточно просто поставить дополнение к Firefox, а если использовать какое-то другое устройство для снятия ЭЭГ, то ПО придется доработать, поскольку в нем используется собственный формат данных.
Ученые подчеркивают отличие своего подхода от традиционных методов исследования человеческого мозга. Обычно в этой области используется ФМРТ - функциональная магнитно-резонансная томография - гораздо более точный метод регистрации активности зон головного мозга, чем ЭЭГ, а условия эксперимента тщательно контролируются. Очистка результата эксперимента от случайных помех увеличивает финансовые вложения. В данном случае разработчики сделали упор не на точность, а на величину базы данных, которую они надеются получить, чтобы разработать на ее основе универсальный алгоритм распознавания воображаемых образов. Таким образом они демонстрируют, что нейробиологическое исследование может быть недорогим занятием, доступным для энтузиастов. Не всякое исследование, в том числе в области нейробиологии, можно удешевить таким образом, однако опыт команды NeuroG показывает, что можно организовать исследовательскую работу на доступном материале.
Схема активности зон головного мозга
Распознает система образы пока не со 100%-ной точностью, и влияет на количество успешных случаев огромное количество факторов - время суток, усталость человека, а в случае с бутербродом - и чувство голода: если очень хочется есть, очень трудно переключится с воображаемой еды на автомобиль. Точность воспроизведения картины мозговой активности, соответствующей изображению, поддается тренировке.
Среди дальнейших направлений исследования - выяснение того, сколько классов объектов (примеры классов: лица, дома) можно распознавать таким образом, и можно ли научить компьютер отличать разные объекты одного класса (например, машины разных марок). Также планируется увеличение количества образов (продемонстрированное ПО работает с двумя картинками, ведутся эксперименты с тремя).
Основной задачей является разработка универсального алгоритма, который не будет требовать предварительной тренировки для распознавания образов.
Практических же приложений этой технологии множество: биометрия, образовательные программы, приложения для соцсетей. Для демонстрации возможного использования технологии команда разработала интерфейс нейропоиска, который работает по ключевым словам, ассоциированным с изображениями, - таким образом, можно управлять поисковой системой (в данный момент разработчики используют "Яндекс"), мысленно представляя нужную картинку. В связи с этим встает интересный вопрос о возможности распознавания абстрактных понятий (вроде "политика") при помощи ЭЭГ.
Другой целью проекта является привлечение внимания публики, в том числе школьников и студентов, к нейробиологическим исследованиям.
Ещё новости по теме:
18:20