Компьютер сравнялся с Шекспиром, уникальность человека под вопросом
Искусственный интеллект может превзойти человеческий, так как он уже находится на стадии освоения творческого процесса. В то время, как мы спустя столетия восхищаемся произведениями Шекспира, компьютер обучился складывать стихи в стиле великого английского поэта
Так, компьютер уже может писать стихи, как Шекспир, а мы — нет. Международная команда разработчиков обучила нейросеть сочинять катрены — отдельные четверостишия, из которых состоит английский, или шекспировский, сонет.
Алгоритм был обучен на почти трех тысячах сонетов, включая 154 произведения, написанных Уильямом Шекспиром. Полученные четверостишия выдержаны в плане поэтической формы и стихотворного размера, но уступают настоящим в вопросах содержания и языка. Работа опубликована на сайте Ассоциации компьютерной лингвистики (Association for Computational Linguistics).
Современные методы машинного обучения позволяют разработчикам решать не только прикладные задачи, но и творческие. К примеру, новейшие архитектуры нейросетей можно использовать для того, чтобы создавать оригинальные произведения искусства или даже писать книги. Гораздо более сложная задача — автоматическое написание стихотворных произведений: компьютер необходимо научить не только складывать слова в грамматически правильный текст, но и держать этот текст в рамках определенной стихотворной формы.
Стихотворный размер (тип и количество стоп в строке) можно задать системе изначально, а можно — научить компьютер вычленять его самостоятельно, без учителя. Этим решили заняться разработчики под руководством Адама Хэммонда (Adam Hammond) из Университета Торонто. Архитектура их системы состоит из трех моделей. Первая модель, языковая, работает на основе рекуррентной нейросети с долгой краткосрочной памятью и отвечает за составление связного текста. Вторая модель, пентаметрическая, учится правильно определять ударный слог и делить строку на стопы. Третья модель учится рифмовать. Шекспировский сонет состоит из трех катренов и заключительного рифмованного двустишия. В катренах используется перекрестная рифмовка (рифмуются попарно четные и нечетные строки). Основная задача рифмующей системы — отличать рифмованные и нерифмованные окончания (последние слова) строк.
Все три части системы обучались на 154 сонетах Уильяма Шекспира и еще примерно 2600 сонетов, взятых из корпуса проекта «Гутенберг». Задача обученной системы — создание катрена подходящего под сонет стихотворного размера. Полученные четверостишия разработчики попросили оценить профессора английской литературы. По его словам, системе удалось выдержать форму катрена, но не смысловую составляющую: полученным произведениям не хватало «читаемости и эмоциональности»:
So gently, as the wind that flaps his wings
And shoots a monarch on the English lays
And what was that, with matters of all things
Tis well ashamed to know— of all her ways
Исходный код своего проекта разработчики выложили на GitHub: опробовать его может каждый желающий (требуется Python версии 2.7).
Несмотря на то, что авторы исследования обучили нейросеть сочинять отдельные катрены, они не научили ее сочинять целые сонеты. Сонет — очень сложная поэтическая форма: его части в отдельности выполняют различные функции в рамках поэтического целого, которые нельзя произвольно разделять на отдельные картины и двустишия. Это несовершенство машины утешает нас, так как мы все еще превосходим искусственный интеллект в такой иррациональной, интуитивной и очень тонкой области, как творчество и создание произведений искусства. Однако, можно предположить, что радоваться осталось недолго, и вскоре компьютеры «эволюционируют» и в этой сфере.
Машинное обучение используется сейчас для сканирования научных исследований и новостей для выявления известных ученых, которых нет в Википедии. Среди этих ученых многие — женщины, и отсутствие информации о них особенно заметно в самой популярной в мире интернет-энциклопедии, в которой 82% биографий написано о мужчинах.
Напомним, ранее Politeka писала о том, что компания Google успешно работает над развитием проекта, связанного с предсказанием даты смерти человека.
Как сообщала Politeka, ученые смогут получить «воспоминания» из клеток ДНК организма человека.