Deep Science: приключения искусственного интеллекта в искусстве и литературе

От

06.03.2021

Есть еще новости об ИИ там, за чем кто-либо может угнаться. Но вы можете оставаться в курсе самых интересных событий в этой колонке, в которой собраны достижения в области ИИ и машинного обучения со всего мира и объясняется, почему они могут быть важны для технологий, стартапов или цивилизации.

Начнем с беззаботной заметки: способы, которые исследователи находят для применения машинного обучения в искусстве, всегда интересны, хотя и не всегда практичны. Команда из Вашингтонского университета хотела посмотреть, может ли система компьютерного зрения научиться определять, что играет на пианино, просто по клавишам и рукам игрока сверху.

Audeo, система, обученная Эли Шлизерманом, Кун Су и Сюлун Лю, просматривает видео игры на фортепиано и сначала извлекает простую последовательность нажатий клавиш, похожую на рулон пианино. Затем он добавляет выразительность в виде длины и силы нажатия и, наконец, полирует его для ввода в синтезатор MIDI для вывода. Результаты немного нечеткие, но определенно узнаваемые.

Кредиты изображений: Шлизерман и др. аль

«Раньше считалось, что создание музыки, которая звучит так, как будто ее можно сыграть в музыкальном представлении, невозможно, – сказал Шлизерман. «Алгоритм должен определить реплики или« особенности »в видеокадрах, которые связаны с созданием музыки, и он должен« представить »звук, который происходит между видеокадрами. Это требует системы, которая одновременно является точной и творческой. Тот факт, что мы добились неплохой музыки, стал неожиданностью ».

Еще одно из области искусства и письма – это чрезвычайно увлекательное исследование вычислительного развертывания древних букв, слишком сложных для обработки. Команда Массачусетского технологического института изучала «запертые» буквы 17-го века, которые настолько замысловато сложены и запечатаны, что их удаление и расплющивание могло навсегда повредить их. Их подход заключался в том, чтобы просвечивать буквы рентгеновскими лучами и устанавливать новый, продвинутый алгоритм работы по расшифровке полученных изображений.

Диаграмма, показывающая рентгеновские снимки буквы и то, как она анализируется для ее виртуального развертывания. Кредиты изображений: Массачусетский технологический институт

«В итоге алгоритм выполняет впечатляющую работу по разделению слоев бумаги, несмотря на их чрезвычайную тонкость и крошечные промежутки между ними, иногда меньшие, чем разрешение сканирования», – сказал Эрик Демейн из Массачусетского технологического института. «Мы не были уверены, что это возможно». Эта работа может быть применима ко многим видам документов, которые сложно распутать простыми рентгеновскими методами. Относить это к «машинному обучению» немного натянуто, но это было слишком интересно, чтобы не включать его. Прочтите полный текст статьи на сайте Nature Communications.

Диаграммы, показывающие обзоры точек зарядки электромобилей, анализируются и превращаются в полезные данные.

Кредиты изображений: Asensio, et. аль

Вы приезжаете на станцию зарядки вашего электромобиля и обнаруживаете, что он не работает. Вы даже можете оставить плохой отзыв в Интернете. Фактически, существуют тысячи таких обзоров, которые представляют собой потенциально очень полезную карту для муниципалитетов, стремящихся расширить инфраструктуру электромобилей.

Омар Асенсио из Технологического института Джорджии обучил модель обработки естественного языка на основе таких обзоров, и вскоре она стала экспертом в их анализе тысячами и извлечении информации о том, где часто бывают перебои, сравнительная стоимость и другие факторы.