Компания "Яндекс" запустила
в режиме бета-тестирования онлайн-сервис "Яндекс.Перевод" собственной
разработки. Система работает по тому же принципу, что и Переводчик
Google, т.е. основана на статистическом анализе переводов, сделанных
человеком.
Подробнее о том, как работает статистический перевод, можно прочитать здесь.
Вкратце: анализируется куча текстов и их переводов и составляются
модели для каждого из языков и модели для каждой языковой пары, в
которых учитываются слова и словосочетания и частота их
использования/перевода. При переводе конкретного текста т.н. декодер
выбирает вариант "с наилучшим сочетанием вероятности (с точки зрения
модели перевода) и частоты употребления (с точки зрения модели языка)".
Иными словами, такая система перевода совершенно не знает правил ни
одного из языков, а просто занимается перебором огромного количества
данных из таблиц.
"Статистический машинный перевод, конечно, нельзя сравнивать с
литературным, сделанным профессиональным переводчиком, — признаёт
руководитель сервиса "Яндекс.Перевод" Алексей Байтин. — Но часто бывает,
что пользователю нужно просто понять основной смысл текста — например,
он хочет почитать отзывы о зарубежных отелях или новости в иностранных
СМИ. Онлайн-переводчик легко поможет это сделать. К тому же на перевод
он потратит всего несколько секунд".
В этих словах есть своя правда, но у статистического подхода имеются и
слабые места. Опыт Google показывает, что статистика нередко
подкидывает забавные, а, бывает, и обидные для кого-то сюрпризы.
Например, летом 2009 года в ходе предвыборной борьбы на Украине гугловский сервис перевода путал
двух Викторов — тогдашних кандидатов в президенты — Януковича и Ющенко.
Или вот пример ещё более настораживающий: некоторое время назад
англо-арабский гуглопереводчик упорно не желал
признавать евреев и американцев террористами (добавляя в перевод
частицу "не"), зато при этом совершенно корректно отрабатывал
аналогичную фразу с арабами.
Можно предположить, что у "Яндекс.Перевода" будут возникать схожие
проблемы, хотя проявляться они будут по-своему. Быстрая проверка
показала, что оба продукта переводят одни и те же тексты по-разному
(или, точнее, по-разному ошибаются), хотя некоторые конструкции, даже
ошибочные, у них и совпадают (и тот, и другой используют для своих
статистических моделей тексты из Интернета, так что совпадения
неизбежны).
На данный момент онлайн-переводчик "Яндекса"
обучен только 4 направлениям перевода: английский в русский, русский в
английский, украинский в русский и русский в украинский (в багаже знаний
Переводчика Google несколько десятков языков). Чисто визуально
"Яндекс.Перевод" работает медленнее, чем конкурирующий продукт Google,
но всё равно достаточно быстро, чтобы им можно было пользоваться.
|