Динозавры и история жизни на Земле

Статистика




Яндекс.Метрика




Трудности перевода у Google

Спросите любого программиста, что будет, если компьютеры станут в тысячу раз быстрее. Скорее всего, вы услышите в ответ, что дополнительной мощности всегда можно найти применение.

Но задайте тот же вопрос Францу Джозефу Очу, — и он пожмет плечами. Даже на машине с мощностью в тысячу раз большей, чем у сегодняшнего компьютера, его программа не начнет работать значительно лучше. Серьезное признание, учитывая то, что Оч отвечает за одну из самых удивительных программ в мире: он возглавляет проект Google Translate.

Google Translate — это бесплатная программа, которая переводит с языка на язык почти так же быстро, как Google отвечает на запрос поиска. Забейте туда адрес страницы испанской газеты, и где-то за секунду текст будет переведен на английский. В базе Google Translate несколько десятков языков. Когда видишь такое в первый раз, вспоминаешь мечты научных фантастов об исчезновении языковых барьеров.

По крайней мере, такое впечатление получает новый пользователь. Но если пользоваться программой подольше, понимаешь, что программа далека от идеала. Иногда Google Translate переводит идеально точно, особенно несложные предложения с языков с простой структурой, вроде испанского. Но порой, она может и совершенно сбить с толку.

Вот, например, предложение из репортажа о Чемпионате мира по футболу из одной мадридской газеты: «Переходя Швейцарии, Испании в настоящее время в руках видео…»

Программа развивается благодаря прогрессу статистического машинного перевода. Этот метод основан не на разборе предложений, которому учат в начальной школе, а на сравнении множества фраз с уже существующими переводами (для решения этой задачи Google загрузил кипы переведенных текстов, вроде документации ООН). Программисты выжали из метода практически все возможное и не могут существенно улучшить работу программы, даже на более мощном оборудовании.

Другими словами, пользователи Google Translate в 2020 году будут находить несуразности и непоследовательности так же часто, как и сегодня. Компьютер, который переводит не хуже человека (что само по себе может служить хорошим определением настоящего искусственного интеллекта), появится еще очень не скоро. Google Translate регулярно улучшают, но слишком медленно. «Траектория, по которой мы движемся, похоже, никогда не достигнет искусственного интеллекта», — говорит Оч.

И это касается не только машинного перевода. Такое же положение практически во всех сложных областях, где работают компьютеры: язык, зрение, робототехника и даже поиск, на котором держится интернет. Компьютеры стали удивительно полезными, но все равно до мечты о машине с интеллектом, неотличимым от человеческого, еще очень и очень далеко.

Появится ли когда-нибудь такой компьютер? Оч испытывает определенный оптимизм. Он верит, что должен произойти некий прорыв, пусть пока и не ясно, какой. Что необходимо, по его словам, так это компьютерные программы, способные к обучению. Кроме того, программистам нужно придумать, как синтезировать умения разных программ. В настоящий момент компьютер может играть в «Кто хочет стать миллионером», но ничего не знать о шахматах. И ни компьютер-эрудит, ни компьютер-шахматист не имеют никакого представления о том, как летает по полю футбольный мяч. А чтобы изящно переводить, компьютер должен знать понемногу о многом.

В Кремниевой долине обитают инженеры двух мастей. Одни — и их большинство — несмотря на доказательства обратного верят, что компьютеры развиваются очень быстро, и не за горами время, когда у нас появится реальная версия компьютера с искусственным интеллектом, HALа из «Космической одиссеи». Некоторые из них являются коллегами Оча в Google. В этих кругах распространено убеждение, что компьютеры все больше становятся похожи на людей, и уже через несколько десятилетий мы сможем загружать в них наше сознание и таким образом жить вечно.

Другие инженеры понимают, что поверхностные сравнения компьютеров и людей не отдают должного сложности ни тех, ни других. К этой категории относится Джозеф Оч.

Догадайтесь, кто из них пишет более полезные программы?