Новый мир китайской грамоты
Nov. 13th, 2017 09:37 pmМарк Крамер в своем фейсбуке дал линк на интервью известнейшего китайского историка Шэнь Жихуа (как минимум одна из его книг, хотя и не самая значительная, даже переведена на русский) - http://wemedia.ifeng.com/36582055/wemedia.shtml
Интервью на китайском, но если нажать на кнопку "would you like to translate this page", автоматически выскакивающую в хроме, то на ходу возникает вполне ясный и читабельный текст на английском - настолько ясный, что временами создается впечатление, что это, собственно, и есть изначальный вариант интервью.
Сергей Радченко подчеркивает четкость и прозрачность, свойственную китайской прозе Шэнь Жихуа.
Мне же подумалось, что, возможно, именно китайский язык наиболее приспособлен для автоматического перевода печатных текстов.
Как утверждают, грамматика китайского языка очень простая. По словам знающих язык, самое сложное - это, во-первых, длительное выучивание иероглифики, а во-вторых, правильное употребление тональности в устной речи. Но механическое распознавание самых сложных иероглифов - это ведь едва ли не самая простая задача для компьютера, особенно если это текст не рукописный, а печатный. Тональные же дела для перевода письменных текстов вообще нерелевантны.
Если так, то может оказаться, что прямо на наших глазах происходит революция. Тексты, еще вчера самые загадочные и головоломные для непосвященных, - непостижимость которых вошла в пословицу, - превращаются в чуть ли не наиболее легко прочитываемые.
Интервью на китайском, но если нажать на кнопку "would you like to translate this page", автоматически выскакивающую в хроме, то на ходу возникает вполне ясный и читабельный текст на английском - настолько ясный, что временами создается впечатление, что это, собственно, и есть изначальный вариант интервью.
Сергей Радченко подчеркивает четкость и прозрачность, свойственную китайской прозе Шэнь Жихуа.
Мне же подумалось, что, возможно, именно китайский язык наиболее приспособлен для автоматического перевода печатных текстов.
Как утверждают, грамматика китайского языка очень простая. По словам знающих язык, самое сложное - это, во-первых, длительное выучивание иероглифики, а во-вторых, правильное употребление тональности в устной речи. Но механическое распознавание самых сложных иероглифов - это ведь едва ли не самая простая задача для компьютера, особенно если это текст не рукописный, а печатный. Тональные же дела для перевода письменных текстов вообще нерелевантны.
Если так, то может оказаться, что прямо на наших глазах происходит революция. Тексты, еще вчера самые загадочные и головоломные для непосвященных, - непостижимость которых вошла в пословицу, - превращаются в чуть ли не наиболее легко прочитываемые.
no subject
Date: 2017-11-15 12:46 am (UTC)См., например, https://en.wikipedia.org/wiki/Google_Neural_Machine_Translation
no subject
Date: 2017-11-15 01:16 am (UTC)Тут, правда, есть ещё, по крайней мере, один момент. Возможно, что я недооцениваю роль человеческой шлифовки компьютерного перевода. Если среди занимающихся этим делом людей значительно выше процент хорошо знающих китайский и английский, чем процент хорошо знающих английский и японский, то это может сильно исказить картину.
Как бы то ни было, посмотрим, как будет дальше развиваться ситуация в этой области. Мне пару лет назад один специалист в области искусственного интеллекта говорил, что до более или менее безошибочного машинного перевода ещё по крайней мере 30 лет. Мне тогда вспомнился Первый Закон Кларка: "Когда уважаемый, но пожилой учёный утверждает, что что-то возможно, то он почти наверняка прав. Когда он утверждает, что что-то невозможно, то он, весьма вероятно, ошибается" :-)