[personal profile] borislvin
Марк Крамер в своем фейсбуке дал линк на интервью известнейшего китайского историка Шэнь Жихуа (как минимум одна из его книг, хотя и не самая значительная, даже переведена на русский) - http://wemedia.ifeng.com/36582055/wemedia.shtml

Интервью на китайском, но если нажать на кнопку "would you like to translate this page", автоматически выскакивающую в хроме, то на ходу возникает вполне ясный и читабельный текст на английском - настолько ясный, что временами создается впечатление, что это, собственно, и есть изначальный вариант интервью.

Сергей Радченко подчеркивает четкость и прозрачность, свойственную китайской прозе Шэнь Жихуа.

Мне же подумалось, что, возможно, именно китайский язык наиболее приспособлен для автоматического перевода печатных текстов.

Как утверждают, грамматика китайского языка очень простая. По словам знающих язык, самое сложное - это, во-первых, длительное выучивание иероглифики, а во-вторых, правильное употребление тональности в устной речи. Но механическое распознавание самых сложных иероглифов - это ведь едва ли не самая простая задача для компьютера, особенно если это текст не рукописный, а печатный. Тональные же дела для перевода письменных текстов вообще нерелевантны.

Если так, то может оказаться, что прямо на наших глазах происходит революция. Тексты, еще вчера самые загадочные и головоломные для непосвященных, - непостижимость которых вошла в пословицу, - превращаются в чуть ли не наиболее легко прочитываемые.

Date: 2017-11-14 05:32 am (UTC)
From: [identity profile] french-man.livejournal.com
Кстати да. Мне последнее время приходилось иметь дело с большим количеством китайских официальных документов, и гугль-тр переводил их очень хорошо.

Date: 2017-11-14 08:53 am (UTC)
From: [identity profile] ailev.livejournal.com
"может оказаться, что прямо на наших глазах происходит революция" -- революция уже произошла, это не "может оказаться". Уровня переводчика-профи ещё не достигнуто, но это уже совсем не "пословный перевод", и это разные системы от гугля, фейсбука, майкрософта и разных других специализированных фирм.
И ты прав, для разных пар языков уровни достижений в переводе разные.

Date: 2017-11-14 03:06 pm (UTC)
From: [identity profile] bbb.livejournal.com
Естественно, я давно уже пользуюсь гуглотранслейтом для чтения новостей и т.д., но это первый раз, когда я вижу, что гуглотранслейт сгенерировал настолько чистый и понятный текст.

Date: 2017-11-14 03:16 pm (UTC)
From: [identity profile] ailev.livejournal.com
Там каждые полгода меняется технология, и довольно принципиально. Вот, например, августовские исследования Гугля -- и обычно скоро это оказывается на их серверах в production: https://research.googleblog.com/2017/08/transformer-novel-neural-network.html

Date: 2017-11-16 01:34 pm (UTC)
From: [identity profile] e2pii1.livejournal.com
Реальный пример, google-translate в этом году, переводим с японского на английский 2 фразы, почти одинаковые: 

第12期人事評価表(営業部・氏名)
第12期人事評価表(技術開発部・氏名)
->
Eleventh period personnel evaluation table (Sales department · name)
12th term Personnel Evaluation Table (Technology Development Department / Name)

Теперь ставим японскую точку после них (это иногда помогает):

第12期人事評価表(営業部・氏名)。
第12期人事評価表(技術開発部・氏名)。
->
The 12th term personnel evaluation table (sales department / name).
Eleventh Period Personnel Evaluation Table (Technical Development Department / Full Name).

Еще какой-то прикол покруче недавно был с ним, но забыл уже.
Если с японского на русский переводить еще круче отжигает.

Date: 2017-11-17 08:06 am (UTC)
From: [identity profile] ailev.livejournal.com
Люди-переводчики отжигают часто не меньше. Только их не тестируют, добавляя японские точки в конце предложений и подсовывая текст ещё раз -- просто пожинают плоды их труда и терпят. Других-то на планете переводчиков нет, или они чрезвычайно дороги.

Опять же, перевод на уровне лучших представителей профессии -- это одно дело, а перевод на уровне какого-нибудь выпускника ВУЗа, сдавшего иностранный на четвёрку -- совсем другое. Людям почему-то сразу скидка даётся, которую не дают массовому сервису, обслуживающему миллиарды (ага, миллиарды на многих парах языков) людей за доли секунды на текст и бесплатно.

Date: 2017-11-17 12:11 pm (UTC)
From: [identity profile] e2pii1.livejournal.com
Я обратил внимание на такую ошибку потому что она
1) грубая (число 12 перевёл как "11", в простейшей ситуации).
2) как раз там, где компьютер, по идее, не должен ошибаться (тут нет проблем с неоднозначностями смысла или грамматики в естественном языке).
3) опасная: в каких-то случаях вы можете остаться с ложной информацией не заметив подвоха. (это не хаханьки когда например когда-то "black kitten" переводился как "афроамериканец"). Причем непредсказуемо аналогичные случаи иногда верны иногда неверны.
Представьте себе калькулятор у которого иногда 8+4=11 а иногда 12.

Раньше он еще японские даты + время неверно переводил: переставлял в переводе дни или месяцы с часами. Сейчас вроде правильно.

Конечно это полезный инструмент. Но с ним надо быть очень осторожным, аккуратным и недоверчивым, и возможности его пока весьма ограничены.

P.S.
японские точки в конце предложений ему надо ставить (если они пропущены) потому что он без неё часто ошибается, не понимая где конец фразы.
Edited Date: 2017-11-17 12:18 pm (UTC)

Date: 2017-11-14 10:19 am (UTC)
From: [identity profile] elotar.livejournal.com
Осталось только понять, что из всего этого вала читать.

Date: 2017-11-14 09:16 pm (UTC)

Date: 2017-11-14 09:29 pm (UTC)
From: [identity profile] anchil.livejournal.com
русский-украинский уже лет десять гугл переводит так, словно это один язык :)

Date: 2017-11-15 12:12 am (UTC)
From: [identity profile] scabon.livejournal.com
Китайского я не знаю, но с этим феноменом недавно столкнулся.

Последние несколько лет я с интересом слежу за тем, как популярная культура восточной Азии, т.е. ранобэ, уся, аниме, манга и т.д., распространяется по миру и переплетается с другими культурами. Так вот, когда смотришь усреднённый слегка отшлифованный китайский текст, переведённый на английский с помощью компьютера, то всё понятно. (Тот же текст, переведённый человеком, который знает оба языка, пока ещё будет лучше, но жить можно.) Когда же читаешь аналогичный усреднённый японский текст -- а в японском порядок слов совсем другой -- то результат куда хуже, вплоть до полной нечитабельности. Посмотрим, как они будут этот орешек раскалывать.
Edited Date: 2017-11-15 12:15 am (UTC)

Date: 2017-11-15 12:46 am (UTC)
From: [identity profile] bbb.livejournal.com
Мне тут выше в комментах написали, что, оказывается, это даже не столько в китайском дело, а больше в том, что буквально в течение прошедшего года произошла целая революция в деле машинного перевода, и гугл-транслейт сейчас работает по новой технологии. Так что, может быть, сейчас и японский переводится хорошо.

См., например, https://en.wikipedia.org/wiki/Google_Neural_Machine_Translation

Date: 2017-11-15 01:16 am (UTC)
From: [identity profile] scabon.livejournal.com
Да, но если бы дело было в новых технологиях, то это означало бы, что большинство китайских текстов, которые я читал, были переведены с использованием новых технологий, а большинство японских -- с использований старых. Насколько я могу судить, это не так.

Тут, правда, есть ещё, по крайней мере, один момент. Возможно, что я недооцениваю роль человеческой шлифовки компьютерного перевода. Если среди занимающихся этим делом людей значительно выше процент хорошо знающих китайский и английский, чем процент хорошо знающих английский и японский, то это может сильно исказить картину.

Как бы то ни было, посмотрим, как будет дальше развиваться ситуация в этой области. Мне пару лет назад один специалист в области искусственного интеллекта говорил, что до более или менее безошибочного машинного перевода ещё по крайней мере 30 лет. Мне тогда вспомнился Первый Закон Кларка: "Когда уважаемый, но пожилой учёный утверждает, что что-то возможно, то он почти наверняка прав. Когда он утверждает, что что-то невозможно, то он, весьма вероятно, ошибается" :-)
Edited Date: 2017-11-15 01:18 am (UTC)

Date: 2017-11-16 01:40 pm (UTC)
From: [identity profile] e2pii1.livejournal.com
порядок слов для компьютера не проблема: переставит. Проблема когда написано не совсем грамматически правильно, неряшливо. И просто бывают самые неожиданные заскоки, я выше тут привел прикольный пример.

С японского вот хороший переводчик, в комбинации с гуглом хорош - не один так другой справится:
https://www.excite.co.jp/world/english_japanese/

Profile

borislvin

January 2026

S M T W T F S
    123
45 6 7 8 910
11121314151617
18192021222324
25262728293031

Style Credit

Expand Cut Tags

No cut tags
Page generated Jan. 18th, 2026 08:32 am
Powered by Dreamwidth Studios