Наш обзор посвящен ведущим вузам, дающим образование в области речевых технологий — автоматической обработки речи, голосовых интерфейсов, биофизики, искусственного интеллекта, нейронных сетей и т.д.
В конце списка в немногих словах описана ситуация с образовательным рынком России в области речевых технологий и две профильные кафедры в МФТИ и ИТМО.
«Странный, но общепризнанный факт — идея, эмоция, сигнал, песня может путешествовать из головы одного человека в голову другого, и это перемещение зависит от устрашающе сложной, необычайно захватывающей цепной реакции, известной как человеческое общение. В программе нашего университета мы изучаем каждую связь в этой цепи, на каждом уровне познания, от биохимии до понимания».
С 1992 года на SHBT ежегодно обучаются около 50 студентов с 60 различных факультетов Гарвардского университета, Массачусетского технологического института, Бостонского университета и учебных больниц Гарварда.
Проектирование, разработка и улучшение системы аппаратного и программного обеспечения слуховых аппаратов, ушных имплантов, вестибулярных протезов или алгоритмов автоматического распознавания речи.
Кандидаты на SHBT должны иметь степень бакалавра в области физики, биологии, психологии, лингвистики, коммуникативных наук, техники и информатики, и иметь обширные аналитические способности.
: Acoustical Signal Processing, Engineering Acoustics, Medical/Bioacoustics, Musical Acoustics, Physical www.nairaland.com/ Acoustics, Psychological Acoustics, Speech, Animal Bioacoustics
Stanford School of Engineering, основанная в 1925 году и расположенная в самом сердце Силиконовой долины, ежегодно вмещает 9 различных департаментов, около 200 преподавателей и 4 тыс. студентов. 65 лабораторий, многие из которых междисциплинарные, работают в области медицины, бизнеса, лингвистики и физики.
: Medical/Bioacoustics, Physiological Acoustics, Structural Acoustics and Vibration, Engineering Acoustics, Noise and Noise Control, Nonlinear/Aeroacoustics
«Speech Research Group — часть Machine Intelligence Laboratory. Миссия SRG — в продвижении знаний машинной обработки разговорного языка и развитии эффективных алгоритмов для реализации приложений. Основная спецификация SRG — работа с большими речевыми словарями и сопутствующими технологиями. Также исследовательские интересы распространяются на разговорные диалоговые системы, распознавание образов, синтез речи и машинное обучение».
Speech Research Group принимает заявки от потенциальных аспирантов и соискателей докторской степени. Возможна также 1 или 2-х годичная магистратура.
: large vocabulary speech transcription, spoken dialogue systems, multimedia document retrieval, speech synthesis, machine learning.
«Нас интересует, как сенсорные и моторные области мозга взаимодействуют при речевой коммуникации. Мы используем различные методы отображения мозговой активности для изучения мозга во время актов произнесения и восприятия речи».
Speech & Brain Research Group набирает потенциальных магистров и докторов, которые могут выбрать любой из курсов Отделения экспериментальной психологии.
: phonetics, phonology, syntax, semantics, psycholinguistics, language acquisition, historical linguistics, mathematical linguistics.
«Автоматизированные системы, взаимодействующие с людьми посредством разговора или письма, увеличат в скором времени свое удобство, простоту в использовании, а значит и нашу производительность. Эти системы будут сопровождать нас повсюду, где встречается информация, и все, включая людей с ограниченными возможностями, смогут получить доступ к большим и неструктурированным базам данным, таким, например, как интернет».
Center for Language and Speech Processing (CLSP) организован в 1992 году при поддержке американского правительства (NSF, DARPA, DoD). Исследования проводятся преподавателями, исследователями и аспирантами, аффилированными с шестью связанными факультетами: биоинженерия, когнитивистика, информатика, электротехника и вычислительная техника, математические науки и психология.
CLSP принимает на обучение студентов и аспирантов. Заявки должны быть поданы через любой из указанных факультетов: Biomedical Engineering, Cognitive Science, Computer Science, Electrical and Computer Engineering, Applied Mathematics & Statistics, Psychological and Brain Sciences.
: language modeling, natural language processing, neural auditory processing, acoustic processing, optimality theory, and language acquisition.
«Миссия HCII — понять и создать гармоничную технологию, которая усиливает возможности человека, его намерения и улучшить его социальное пространство с помощью междисциплинарных исследований и образования в области дизайна, компьютерных и социальных наук».
С 1985 года HCII предлагает исследовательские и образовательные программы, охватывающие полный цикл получения знаний. В него входят исследования социальной активности (работа, игра, общение) и социальных структур дизайн, создание и оценка технологий и инструментов для поддержки социальной деятельности.
: user-interface software tools, cognitive models, speech recognition, natural language understanding, computer graphics, gesture recognition, data visualization, intelligent agents, visual interface design, multimedia, computer-supported cooperative work, computer music and drama, intelligent tutors, technical writing, and the organizational and social impact of technology.
История речевых технологий (именно технологий, а не просто научной лингвистики) ведет свое начало от перипетий связанных с организацией в СССР в 1959 году Института кибернетики, история успеха которого драматическим образом оказалась историей начала провала и потери мирового первенства в этом направлении. Создание Института кибернетики отчасти было вызвано западными успехами, в частности демонстрацией 7 января 1954 года в нью-йоркском офисе IBM системы машинного перевода (IBM-701).
Технологии машинного перевода, дешифровки текста, распознавания образов в 50-60-х гг. были выведены в СССР на уровень космической программы и оборонной промышленности и должны были доказывать лидирующие позиции Советского Союза в области моделирования искусственного интеллекта и компьютерного проектирования. Расцвет научной мысли в это время связан с такими фамилиями как Н.Д. Андреев, Ю.Д. Апресян, И.А. Мельчук, А.К. Жолковский, О.С. Кулагина, А.И. Берг, А.А. Ляпунов, М.Л. Цетлин, В. А. Успенский, С. К. Шаумян и др.
В 70-х годах, наметившийся выход к новым рубежам в области искусственного интеллекта, распознавания и синтеза речи, был по разным причинам окончательно децентрализован и, можно сказать, приостановлен в 80-е, когда ученые вынуждены были перейти с государственного финансирования на грантовую основу.
К концу 80-х началу 90-х гг. можно отнести первые попытки самостоятельного выживания отдельных лингвистических школ и традиций, впоследствии воплотивших свои знания в коммерчески успешные продукты и на новом витке развития речевых технологий реализующих свои образовательные амбиции. О двух из них — в нашем кратком обзоре.
«Наша цель – сделать на ФИВТе (Факультете инноваций и высоких технологий) самое лучшее преподавание Computer Science в России».
С 2006 года на кафедру поступило около пятидесяти человек. По окончании учёбы предоставляется работа в ABBYY, но выпускники не связаны никакими обязательствами по отношению к компании.
: проектирование и анализ алгоритмов, автоматическая обработка текста, прикладная теория решеток, разработка графического пользовательского интерфейса, интеллектуальные системы, распознавание и обработка изображений, моделирование поведения, восприятия и мышления, разработка архитектуры, клиент-серверные приложения.
Санкт-Петербургский государственный университет информационных технологий, механики и оптики (ИТМО), Центр речевых технологий
«Мы создаем продукты и технологии, которые помогают людям понимать других и быть понятыми, делая жизнь в глобальном информационном сообществе эффективнее и безопаснее».
Открытая в 2011 году кафедра «Речевые информационные системы» (РИС), вошла в состав факультета Информационных технологий и программирования ИТМО. Кафедра готовит специалистов, способных участвовать в исследовательской и проектной работе в области речевых информационных технологий со специализацией в направлениях распознавания и синтеза речи, распознавания личностей по голосу, мультимодальной биометрии, в области проектирования и разработки информационных систем и программного обеспечения.
На кафедру принимаются студенты с дипломом бакалавра или специалиста (желательно по направлениям информационных технологий и программирования) с общематематической подготовкой.
: Санкт-Петербургский государственный университет информационных технологий, механики и оптики (ИТМО), Центр речевых технологий
По идее, датчик концентрации CO2 в частях на миллион (ppm), но точка в значении поставлена ошибочно — типичные значения как раз близки к 384. Гаджеты с подобной функцией есть, например, на
было бы здорово продолжить цикл статей о этих университетах и описать технологии которые они использую для речевых интерфейсов
вообще вот лучшие 100 вузов в области речевых технологий. Уж не знаю какой у вас критерий оценки, но тут он достаточно объективен — по цитированиям.
Ну так недавно где-то цифры публиковали — бюджет компаний уровня Microsoft, IBM, Google на R&D сопоставим с бюджетом РФ выделяемым на всю науку ) Так что и результаты видимо соответствующие )
Без привязки к конкретному направлению ИТМО все-таки один из лучших технических вузов в Европе. Подтверждение этого слышал от весьма уважаемых профессоров.
Ну я имел в виду сами логотипы. Сравните, скажем, первые гордые даже не логотипы, а гербы, — с жалкой итмошной каракулей.
А вы знаете, не совсем в тему, но хочется поделится мыслями. В Питере был, круто для нашей провинции, конечно. Но действительно хотел бы побывать в МТИ. Это заведение, где обучались мои кумиры — Фейнман, Вудворд. Ну, там еще Воловиц и Фримен диплом получили, но это в другой Вселенной… После прочтения лекций и книг Фейнмана сложилось определенное впечатление, затем долго блуждал по лекциям самого МТИ. А на нынешнее лето планирую экскурсию. Друзья поедут в Испанию, в Ллорет-де-Мар, а я — в МТИ:)
С удовольствием послушал бы иллюстрированный рассказ. С одной стороны, конечно, всякое фотканье и даже видео и рядом не лежит с живыми впечатлениями, с другое стороны — еще одно свидетельство, которое может захватить даже через экран…
Что изучать, на что тратить свободное время, чтобы в будущем стать востребованным программистом с нормальным заработком?